人工智慧論文

人工智慧論文 | 原創，AI翻譯

Home 2025.01

基礎概念與架構：

反向傳播
卷積神經網絡
托馬斯·米科洛夫的Word2Vec論文
使用神經網絡進行序列到序列學習
注意力是你所需的一切
ResNet, “深度殘差學習用於圖像識別”

大型語言模型及相關技術：

鏈式思維提示在大型語言模型中引發推理
為知識密集型NLP任務的檢索增強生成
GPT-4技術報告
Claude 3模型卡
LLaMA 3論文

特定模型與應用：

DeepSeek V3 & V2
Whisper, 通過大規模弱監督進行穩健語音識別
潛在擴散模型（穩定擴散）論文
DALL-E 3擴展文本到圖像生成

基準與評估：

SWE-Bench語言模型是否能解決現實世界的GitHub問題？

精選列表：

NeurIPS經典論文
伊利亞的前30篇AI論文，由伊利亞·蘇茨克弗精選，可在https://aman.ai/primers/ai/top-30-papers/找到。

Back Donate