Papers de IA
Conceptos Fundamentales y Arquitecturas:
- Retropropagación
- Redes Neuronales Convolucionales
- Papers de Word2Vec por Tomáš Mikolov.
- Aprendizaje de Secuencia a Secuencia con Redes Neuronales
- La Atención es Todo lo que Necesitas
- ResNet, “Aprendizaje Residual Profundo para el Reconocimiento de Imágenes”
Grandes Modelos de Lenguaje y Técnicas Relacionadas:
- Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
- Generación Augmentada por Recuperación para Tareas de NLP Intensivas en Conocimientos
- Informe Técnico de GPT-4
- Tarjeta del Modelo Claude 3
- Paper de LLaMA 3
Modelos y Aplicaciones Específicas:
- DeepSeek V3 & V2
- Whisper, Reconocimiento de Voz Robusto a través de Supervisión Débil a Gran Escala
- Paper de Modelos de Difusión Latente (Stable Diffusion)
- DALL-E 3 Escalando la Generación de Texto a Imagen
Benchmark y Evaluaciones:
- SWE-Bench ¿Pueden los Modelos de Lenguaje Resolver Problemas Reales de GitHub?
Listas Curadas:
- Papers de NeurIPS Test of Time
- Top 30 Papers de AI de Ilya Una lista curada por Ilya Sutskever, disponible en https://aman.ai/primers/ai/top-30-papers/.