人工智能论文

人工智能论文 | 原创，AI翻译

Home 2025.01

基础概念与架构：

反向传播
卷积神经网络
托马什·米科洛夫的Word2Vec论文
使用神经网络进行序列到序列学习
注意力就是你所需的一切
ResNet, “用于图像识别的深度残差学习”

大型语言模型及相关技术：

链式思维提示引发大型语言模型的推理
检索增强生成用于知识密集型NLP任务
GPT-4 技术报告
Claude 3 模型卡
LLaMA 3 论文

特定模型与应用：

DeepSeek V3 和 V2
Whisper, 通过大规模弱监督实现鲁棒语音识别
潜在扩散模型（Stable Diffusion）论文
DALL-E 3 扩展文本到图像生成

基准与评估：

SWE-Bench 语言模型能否解决实际的GitHub问题？

精选列表：

NeurIPS 经典论文
伊利亚的前30篇AI论文，由伊利亚·苏茨克弗精选，可在https://aman.ai/primers/ai/top-30-papers/找到。

Back Donate