模型知识括号探测截止 | AI生成和翻译

Home 2026.05

问题: DeepSeek-V2-Lite-Chat 知道 ChatGPT——这告诉我们它的训练截止日期是什么,最终区间是什么?

回答:

区间现已收窄

事件 日期 模型是否知道?
ChatGPT 发布 2022年11月30日 ✅ 是
GPT-4 发布 2023年3月14日 ❌ 否

结论:训练数据截止日期在 2022年12月到2023年3月之间——大致为3个月窗口。

最可能的是:2023年1月至2月,因为数据 pipeline 通常存在延迟(收集、去重、过滤、分词——这些步骤在标称截止日期后需要数周时间)。

这与2022年9月22日的“日期”幻觉实际上是一致的

模型的数据在2022年底最为密集。SFT 指令数据很可能是在同一时期生成/整理的,因此当被问到“今天是什么日子”时,它锚定到了2022年9月。这并非随机的幻觉——它反映了其训练分布的质心。

最终情形

DeepSeek-V2-Lite-Chat 知识时间线:

[密集覆盖]          [稀疏/无]
━━━━━━━━━━━━━━━━━━━━━━━━━|════════════════════════
          ...2022     2023年1-2月  2023年3月 →
                           ↑
                     截止区域

发布日期:2024年5月  (截止后约15个月)

从截止到发布间隔约15个月,对于这一规模的模型来说属于正常——以这种规模预训练 MoE,再进行 SFT + 对齐,即使拥有大型 GPU 集群也需要相当长的日历时间。

探测方法有效

三个问题,清晰的区间:

probes = {
    "今天是什么日子":        "噪声较大,锚定到训练密度中心",
    "你知道 GPT-4 吗":      "2023年3月之后 → 否  ✓ 上界",
    "你知道 ChatGPT 吗":    "2022年11月之后 → 是 ✓ 下界",
}
# 结果:截止日期在 [2022年11月, 2023年3月]

这是一种通用的有用技巧——每当你运行本地模型并希望校准其知识陈旧程度,以便在信任它处理任何时效性内容之前,都可以使用这种方法。


Back Donate