技术

Hallucination

当 LLM 产出流畅、自信却纯属虚假的输出时,这是模型工作方式的直接后果,无法被完全消除,只能被减少。

最近审阅: 2026-06-02 审阅人Kevin Riedl wiki ↗

幻觉是指模型生成了听起来正确而实际错误的东西:一个编造的引用、一个虚构的 API、一个貌似可信却虚假的事实。它不是你能打补丁修掉的故障。LLM 预测的是可能的文本,而一个流畅、听起来自信的回答在统计上就是可能的,无论它碰巧是否为真。模型没有"我不知道"的内在感觉,所以它用某个符合模式的东西来填补空白。

因为它是结构性的,诚实的定位是降低风险,而非消除。最大的杠杆是接地:在运行时通过检索(RAG)把真实事实给模型,让它从真实的源文本作答,而不是从它训练时刻的猜测作答。约束输出格式,让即兴发挥的空间更小。让模型引用你能核查的来源。而且至关重要的是要评估,构建一个真实问题的测试集,衡量系统出错的频率,并把这个数字当作一项像其他指标一样要追踪的质量指标。

这就是 AI 与 QA 相遇之处,而大多数团队会跳过它。在没有评估框架的情况下上线一个 LLM 功能,等于上线未经测试的代码却把它叫做完成。你需要在你的用户替你发现之前,就知道你的错误率。我们把这一点视为在 Software Quality Assurance 下不可协商的事项。

在受监管或高风险领域,信任这一面就是全部的游戏。一个推荐电影的聊天机器人里的幻觉只是耸耸肩的事。同样的幻觉出现在金融、法律或医疗输出中就是一项隐患。让护栏与出错代价相匹配,永远不要让一个流畅的回答取代一个经过核实的回答。

// FAQ

常见问题

常见问题

因为它们预测的是可能的文本,而不是经过核实的真相。一个流畅、自信的回答在统计上就是可能的,无论是否正确,而模型没有内置的’我不知道’信号,所以它会填补空白。
不能。它们是 LLM 工作方式的结构性产物。你可以用接地(检索)、受约束的输出、来源引用和评估来减少它们,但总会残留一定比例。要管理它,不要假设它已经消失。
通过 RAG 把答案接地到真实数据,约束输出格式,要求可核查的来源,并运行一个在真实问题上衡量你错误率的评估框架。让护栏的强度与出错代价相匹配。