幻觉日期与模型截止

幻觉日期与模型截止 | AI生成和翻译

首页 2026.05

问题： DeepSeek-V2-Lite-Chat 说今天是2022年9月22日——这是否表明其训练/微调数据的截止日期？

回答：

不完全是——这是一个有噪音的信号，但值得深入分析。

当模型在没有实时访问权限的情况下说“今天是X”时，它并不是在读时钟。它是在从训练数据中进行模式匹配。模型看到了大量文本中“今天”对应其训练语料库中的日期，然后根据这种分布幻觉出一个看似合理的日期。

它输出的日期受以下因素影响：

DeepSeek-V2系列的真实截止日期很可能在 2024年初至年中。

几种可能性：

不要相信模型自我报告的日期。改为：

# 询问一个已知事件边界的问题
"你对GPT-4o了解多少？" # 2024年5月发布
"你对DeepSeek-V3了解多少？" # 2024年12月发布
"告诉我2024年美国大选结果"

如果它知道GPT-4o但不知道DeepSeek-V3，那么截止日期大约在2024年中。这种方法比直接问“今天是什么日期”要可靠得多，能给你一个更准确的时间范围。

2022年9月22日几乎肯定是一个幻觉，并非实际的训练截止日期。DeepSeek-V2的真实截止日期是2024年初。模型自我报告的日期不可靠——改用带日期的事件进行探测。

返回捐助