模型知识括号探测截止

模型知识括号探测截止 | AI生成和翻译

首页 2026.05

问题： DeepSeek-V2-Lite-Chat 知道 ChatGPT——这告诉我们它的训练截止日期是什么，最终区间是什么？

回答：

区间现已收窄

事件	日期	模型是否知道？
ChatGPT 发布	2022年11月30日	✅ 是
GPT-4 发布	2023年3月14日	❌ 否

结论：训练数据截止日期在 2022年12月到2023年3月之间——大致为3个月窗口。

最可能的是：2023年1月至2月，因为数据 pipeline 通常存在延迟（收集、去重、过滤、分词——这些步骤在标称截止日期后需要数周时间）。

这与2022年9月22日的“日期”幻觉实际上是一致的

模型的数据在2022年底最为密集。SFT 指令数据很可能是在同一时期生成/整理的，因此当被问到“今天是什么日子”时，它锚定到了2022年9月。这并非随机的幻觉——它反映了其训练分布的质心。

最终情形

DeepSeek-V2-Lite-Chat 知识时间线：

[密集覆盖]          [稀疏/无]
━━━━━━━━━━━━━━━━━━━━━━━━━|════════════════════════
          ...2022     2023年1-2月  2023年3月 →
                           ↑
                     截止区域

发布日期：2024年5月  （截止后约15个月）

从截止到发布间隔约15个月，对于这一规模的模型来说属于正常——以这种规模预训练 MoE，再进行 SFT + 对齐，即使拥有大型 GPU 集群也需要相当长的日历时间。

探测方法有效

三个问题，清晰的区间：

probes = {
    "今天是什么日子":        "噪声较大，锚定到训练密度中心",
    "你知道 GPT-4 吗":      "2023年3月之后 → 否  ✓ 上界",
    "你知道 ChatGPT 吗":    "2022年11月之后 → 是 ✓ 下界",
}
# 结果：截止日期在 [2022年11月, 2023年3月]

这是一种通用的有用技巧——每当你运行本地模型并希望校准其知识陈旧程度，以便在信任它处理任何时效性内容之前，都可以使用这种方法。

返回捐助