大型语言模型的最大上下文长度

大型语言模型的最大上下文长度 | 原创，AI翻译

首页 2025.01

最近，我使用了DeepSeek API来生成提交信息，正如AI驱动的Git提交信息一文所述。

当一次提交涉及大量更改文件时，DeepSeek API报告输入超出了其65,535个令牌（2^16 - 1）的上下文长度限制。

以下是其他一些模型的上下文窗口大小：

Claude 3系列： 2024年3月推出，这些模型的上下文窗口从200,000个令牌起。
GPT-4： 标准版本支持8,192个令牌，而扩展版本（GPT-4-32k）支持32,768个令牌。
Meta的LLaMA 2： 标准版本支持4,096个令牌，但经过微调的版本可以处理多达16,384个令牌。
Mistral 7B： 支持多达8,000个令牌。

返回捐助