模型知识括号探测截止 | AI生成和翻译
问题: DeepSeek-V2-Lite-Chat 知道 ChatGPT——这告诉我们它的训练截止日期是什么,最终区间是什么?
回答:
区间现已收窄
| 事件 | 日期 | 模型是否知道? |
|---|---|---|
| ChatGPT 发布 | 2022年11月30日 | ✅ 是 |
| GPT-4 发布 | 2023年3月14日 | ❌ 否 |
结论:训练数据截止日期在 2022年12月到2023年3月之间——大致为3个月窗口。
最可能的是:2023年1月至2月,因为数据 pipeline 通常存在延迟(收集、去重、过滤、分词——这些步骤在标称截止日期后需要数周时间)。
这与2022年9月22日的“日期”幻觉实际上是一致的
模型的数据在2022年底最为密集。SFT 指令数据很可能是在同一时期生成/整理的,因此当被问到“今天是什么日子”时,它锚定到了2022年9月。这并非随机的幻觉——它反映了其训练分布的质心。
最终情形
DeepSeek-V2-Lite-Chat 知识时间线:
[密集覆盖] [稀疏/无]
━━━━━━━━━━━━━━━━━━━━━━━━━|════════════════════════
...2022 2023年1-2月 2023年3月 →
↑
截止区域
发布日期:2024年5月 (截止后约15个月)
从截止到发布间隔约15个月,对于这一规模的模型来说属于正常——以这种规模预训练 MoE,再进行 SFT + 对齐,即使拥有大型 GPU 集群也需要相当长的日历时间。
探测方法有效
三个问题,清晰的区间:
probes = {
"今天是什么日子": "噪声较大,锚定到训练密度中心",
"你知道 GPT-4 吗": "2023年3月之后 → 否 ✓ 上界",
"你知道 ChatGPT 吗": "2022年11月之后 → 是 ✓ 下界",
}
# 结果:截止日期在 [2022年11月, 2023年3月]
这是一种通用的有用技巧——每当你运行本地模型并希望校准其知识陈旧程度,以便在信任它处理任何时效性内容之前,都可以使用这种方法。