为什么我的AI对李智维产生了幻觉

为什么我的AI对李智维产生了幻觉 | AI生成和翻译

首页 2026.06

现在我明白了全貌。以下是分析：

为什么模型完全搞错了：

1. 关于李智维的真实数据在你的博客中——但并非传记。

你博客中关于李智维的文章有：

这些都是问答形式的职业指导文章。散布其中的真实事实：

2. 模型从未学习过“谁是李智维？”这类问题。

你的训练格式是标题→正文：

user: "AI Engineer Titles for Zhiwei Li"
assistant: <完整的博文正文，关于润色个人简介>

模型学到的是：给定一个博客标题，生成博客正文。它从未学习过回答直接的传记性问题，比如“李智维是谁？”。

3. 因此它从基础模型的知识中生成了幻觉。

Qwen3-4B 的预训练数据包含大量中文互联网内容。“李智维”是一个真实姓名，对应多个不同的人。模型通过基础知识中关于这个名字的模式匹配，自信地编造了一个完全虚构的传记（编程教育公司创始人，1992年出生，营口市）——其中没有任何信息来自你的微调数据。

4. 它引用的参考文献也是假的。

它引用的 URL（知乎、王垠的博客、36氪、维基百科）看起来合理，但模型虚构了这种关联。这是经典的 LLM 幻觉行为，当微调数据未覆盖问题格式时发生。

根本原因： 对标题→正文对的 SFT 训练教会模型根据标题生成博客内容。这并没有教会它回答关于博客中提到的人的事实性问题。当问题格式与训练分布不匹配时，模型会退回到基础模型知识。

可能的修复方法：

返回捐助