人工智慧論文
基礎概念與架構:
- 反向傳播
- 卷積神經網絡
- 托馬斯·米科洛夫的Word2Vec論文
- 使用神經網絡進行序列到序列學習
- 注意力是你所需的一切
- ResNet, “深度殘差學習用於圖像識別”
大型語言模型及相關技術:
- 鏈式思維提示在大型語言模型中引發推理
- 為知識密集型NLP任務的檢索增強生成
- GPT-4技術報告
- Claude 3模型卡
- LLaMA 3論文
特定模型與應用:
- DeepSeek V3 & V2
- Whisper, 通過大規模弱監督進行穩健語音識別
- 潛在擴散模型(穩定擴散)論文
- DALL-E 3擴展文本到圖像生成
基準與評估:
- SWE-Bench語言模型是否能解決現實世界的GitHub問題?
精選列表:
- NeurIPS經典論文
- 伊利亞的前30篇AI論文,由伊利亞·蘇茨克弗精選,可在https://aman.ai/primers/ai/top-30-papers/找到。