AI論文
基礎概念とアーキテクチャ:
- バックプロパゲーション: ニューラルネットワークを訓練するための基本的なアルゴリズム。
- 畳み込みニューラルネットワーク: 画像処理における重要なアーキテクチャ。
- Word2Vec: Tomáš Mikolovによる単語埋め込みに関する論文。
- Sequence to Sequence Learning with Neural Networks: シーケンスモデリングの基礎となる論文。
- Attention is All You Need: Transformerアーキテクチャを紹介した画期的な論文。
- ResNet, “Deep Residual Learning for Image Recognition”: より深いネットワークのための残差接続を導入。
大規模言語モデルと関連技術:
- Chain-of-Thought Prompting Elicits Reasoning in Large Language Models: 推論能力を高めるためのプロンプト技術を探求。
- Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks: 検索と生成を組み合わせて性能を向上。
- GPT-4 テクニカルレポート
- Claude 3 モデルカード
- LLaMA 3 論文
特定のモデルとアプリケーション:
- DeepSeek V3 & V2: DeepSeekからの最新モデル。
- Whisper, Robust Speech Recognition via Large-Scale Weak Supervision: 堅牢な音声認識モデル。
- Latent Diffusion Models (Stable Diffusion) 論文: 画像生成のための潜在拡散を紹介。
- DALL-E 3: Scaling Text-to-Image Generation: 強力なテキストから画像への生成モデル。
ベンチマークと評価:
- SWE-Bench: Can Language Models Resolve Real-World GitHub Issues? コード生成能力を評価するためのベンチマーク。
キュレーションされたリスト:
- NeurIPS Test of Time Papers: 長期的な影響が認められた影響力のある論文のコレクション。
- Ilya’s Top 30 AI Papers: Ilya Sutskeverによるキュレーションされたリスト、https://aman.ai/primers/ai/top-30-papers/で利用可能。