人工智能论文
基础概念与架构:
- 反向传播
- 卷积神经网络
- 托马什·米科洛夫的Word2Vec论文
- 使用神经网络进行序列到序列学习
- 注意力就是你所需的一切
- ResNet, “用于图像识别的深度残差学习”
大型语言模型及相关技术:
- 链式思维提示引发大型语言模型的推理
- 检索增强生成用于知识密集型NLP任务
- GPT-4 技术报告
- Claude 3 模型卡
- LLaMA 3 论文
特定模型与应用:
- DeepSeek V3 和 V2
- Whisper, 通过大规模弱监督实现鲁棒语音识别
- 潜在扩散模型(Stable Diffusion)论文
- DALL-E 3 扩展文本到图像生成
基准与评估:
- SWE-Bench 语言模型能否解决实际的GitHub问题?
精选列表:
- NeurIPS 经典论文
- 伊利亚的前30篇AI论文,由伊利亚·苏茨克弗精选,可在https://aman.ai/primers/ai/top-30-papers/找到。