Papiers d'IA | Original, traduit par l'IA
Concepts Fondamentaux & Architectures :
- Rétropropagation
- Réseaux de Neurones Convolutionnels
- Papiers Word2Vec par Tomáš Mikolov.
- Apprentissage Séquence à Séquence avec des Réseaux de Neurones
- L’Attention, c’est Tout Ce Dont Vous Avez Besoin
- ResNet, “Apprentissage Résiduel Profond pour la Reconnaissance d’Images”
Grands Modèles de Langage & Techniques Associées :
- Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
- Génération Augmentée par Récupération pour des Tâches NLP Intensives en Connaissances
- Rapport Technique GPT-4
- Carte Modèle Claude 3
- Papier LLaMA 3
Modèles Spécifiques & Applications :
- DeepSeek V3 & V2
- Whisper, Reconnaissance Vocale Robuste via Supervision Faible à Grande Échelle
- Modèles de Diffusion Latente (Stable Diffusion) Papier
- DALL-E 3 Scaling Text-to-Image Generation
Benchmarks & Évaluations :
- SWE-Bench Les Modèles de Langage Peuvent-ils Résoudre des Problèmes GitHub du Monde Réel ?
Listes Curatées :
- Papiers NeurIPS Test of Time
- Top 30 Papiers AI d’Ilya Une liste curatée par Ilya Sutskever, disponible à https://aman.ai/primers/ai/top-30-papers/.