LLM
Large Language Model
一种经过训练以预测下一个 token 的统计模型,这使它在语言任务上出奇地出色,而在任何需要保证正确性的事情上都不可靠。
最近审阅: 2026-06-02
审阅人Kevin Riedl
wiki ↗
LLM 是一种在海量文本上训练、只做一件事的模型:根据之前的全部内容预测下一个 token(大致是下一个词片段)。把足够多的这种预测叠加起来,就得到了流畅的回答、摘要、翻译和代码。这就是全部的诀窍。它不是人类意义上的推理,而是非常出色的模式补全。
这一点很重要,因为它同时解释了魔力与局限。LLM 对你的业务没有记忆,没有超出其训练截止日期的知识,也没有内置的保证它给出的流畅回答是真实的。它会用与正确事实完全相同的自信说出一个错误事实。把它当作工具,而不是神谕。
当你需要确定性的、可审计的输出时,LLM 就是错误的工具:税务计算、监管逻辑,任何"通常正确"就构成隐患的场景。正确的做法是用它周围那些枯燥的工程把模型包裹起来:用检索提供事实,用校验处理输出,并在出错代价高的地方加入人工环节。这正是我们在 人工智能 下所构建的。
诚实的总结:LLM 是一个概率性的文本引擎。用于合适的工作(起草、分类、抽取、在自己的数据上搜索)时,它是真正的力量倍增器。当作真理来源使用时,它是一个充满自信的隐患。
// FAQ