大型語言模型的最大上下文長度

大型語言模型的最大上下文長度 | 原創，AI翻譯

Home 2025.01

我最近使用了DeepSeek API來生成提交信息，如AI驱动的Git提交信息所述。

當提交涉及許多更改的文件時，DeepSeek API報告輸入超出了其上下文長度限制，即65,535個標記（2^16 - 1）。

以下是其他一些模型的上下文窗口大小：

Claude 3系列： 2024年3月推出，這些模型的上下文窗口從200,000個標記開始。
GPT-4： 標準版本支持8,192個標記，而擴展版本（GPT-4-32k）支持32,768個標記。
Meta的LLaMA 2： 標準版本支持4,096個標記，但微調版本可以處理多達16,384個標記。
Mistral 7B： 支持多達8,000個標記。

Back Donate