AI पेपर्स
मूलभूत अवधारणाएं और आर्किटेक्चर:
- बैकप्रोपेगेशन: न्यूरल नेटवर्क को प्रशिक्षित करने के लिए मूलभूत एल्गोरिदम।
- कन्वोल्यूशनल न्यूरल नेटवर्क: इमेज प्रोसेसिंग के लिए एक प्रमुख आर्किटेक्चर।
- Word2Vec: टोमाश मिकोलोव द्वारा वर्ड एम्बेडिंग्स पर पेपर्स।
- सीक्वेंस टू सीक्वेंस लर्निंग विद न्यूरल नेटवर्क्स: सीक्वेंस मॉडलिंग पर एक मूलभूत पेपर।
- अटेंशन इज़ ऑल यू नीड: ट्रांसफॉर्मर आर्किटेक्चर को पेश करने वाला प्रमुख पेपर।
- ResNet, “डीप रेजिडुअल लर्निंग फॉर इमेज रिकग्निशन”: गहरे नेटवर्क्स के लिए रेजिडुअल कनेक्शन्स को पेश किया।
बड़े भाषा मॉडल और संबंधित तकनीकें:
- चेन-ऑफ-थॉट प्रॉम्प्टिंग एलिसिट्स रीजनिंग इन लार्ज लैंग्वेज मॉडल्स: बेहतर तर्क के लिए प्रॉम्प्टिंग तकनीकों की खोज।
- रिट्रीवल-ऑगमेंटेड जेनरेशन फॉर नॉलेज-इंटेंसिव एनएलपी टास्क्स: बेहतर प्रदर्शन के लिए रिट्रीवल को जेनरेशन के साथ जोड़ता है।
- GPT-4 टेक्निकल रिपोर्ट
- Claude 3 मॉडल कार्ड
- LLaMA 3 पेपर
विशिष्ट मॉडल और अनुप्रयोग:
- DeepSeek V3 और V2: DeepSeek के हाल के मॉडल।
- Whisper, रोबस्ट स्पीच रिकग्निशन वाया लार्ज-स्केल वीक सुपरविजन: एक मजबूत स्पीच रिकग्निशन मॉडल।
- लेटेंट डिफ्यूजन मॉडल्स (स्टेबल डिफ्यूजन) पेपर: इमेज जेनरेशन के लिए लेटेंट डिफ्यूजन को पेश करता है।
- DALL-E 3: स्केलिंग टेक्स्ट-टू-इमेज जेनरेशन: एक शक्तिशाली टेक्स्ट-टू-इमेज मॉडल।
बेंचमार्क और मूल्यांकन:
- SWE-Bench: कैन लैंग्वेज मॉडल्स रिज़ॉल्व रियल-वर्ल्ड GitHub इश्यूज़? कोड जेनरेशन क्षमताओं का मूल्यांकन करने के लिए एक बेंचमार्क।
क्यूरेटेड सूचियाँ:
- NeurIPS टेस्ट ऑफ टाइम पेपर्स: लंबे समय तक प्रभाव के लिए मान्यता प्राप्त प्रभावशाली पेपर्स का संग्रह।
- इल्या की टॉप 30 एआई पेपर्स: इल्या सुत्स्केवर द्वारा क्यूरेट की गई सूची, https://aman.ai/primers/ai/top-30-papers/ पर उपलब्ध।