أوراق بحثية عن الذكاء الاصطناعي
المفاهيم والأسس المعمارية:
- الانتشار العكسي (Backpropagation): الخوارزمية الأساسية لتدريب الشبكات العصبية.
- الشبكات العصبية التلافيفية (Convolutional Neural Networks): بنية رئيسية لمعالجة الصور.
- Word2Vec: أوراق بحثية من تأليف Tomáš Mikolov حول تمثيل الكلمات.
- التعلم من التسلسل إلى التسلسل باستخدام الشبكات العصبية (Sequence to Sequence Learning with Neural Networks): ورقة بحثية أساسية حول نمذجة التسلسلات.
- الانتباه هو كل ما تحتاجه (Attention is All You Need): الورقة البحثية الرائدة التي قدمت بنية المحولات (Transformer).
- ResNet، “التعلم العميق باستخدام الوصلات المتبقية للتعرف على الصور”: قدمت الوصلات المتبقية للشبكات الأعمق.
نماذج اللغة الكبيرة والتقنيات ذات الصلة:
- التفكير المتسلسل (Chain-of-Thought Prompting) لتحفيز التفكير في نماذج اللغة الكبيرة: يستكشف تقنيات التحفيز لتعزيز التفكير.
- التوليد المعزز بالاسترجاع للمهام اللغوية التي تتطلب معرفة مكثفة (Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks): يجمع بين الاسترجاع والتوليد لتحسين الأداء.
- التقرير الفني لـ GPT-4
- بطاقة نموذج Claude 3
- ورقة LLaMA 3
نماذج محددة وتطبيقات:
- DeepSeek V3 & V2: نماذج حديثة من DeepSeek.
- Whisper، التعرف القوي على الكلام عبر الإشراف الضعيف واسع النطاق: نموذج قوي للتعرف على الكلام.
- نماذج الانتشار الكامن (Stable Diffusion): تقدم الانتشار الكامن لتوليد الصور.
- DALL-E 3: توسيع نطاق توليد الصور من النصوص: نموذج قوي لتوليد الصور من النصوص.
المعايير والتقييمات:
- SWE-Bench: هل يمكن لنماذج اللغة حل مشكلات GitHub الواقعية؟ معيار لتقييم قدرات توليد الأكواد.
قوائم مختارة:
- أوراق NeurIPS التي صمدت أمام اختبار الزمن: مجموعة من الأوراق البحثية المؤثرة التي تم الاعتراف بتأثيرها طويل الأمد.
- أفضل 30 ورقة بحثية في الذكاء الاصطناعي من إعداد Ilya: قائمة مختارة من قبل Ilya Sutskever، متاحة على https://aman.ai/primers/ai/top-30-papers/.