技术

LLM

Large Language Model

一种经过训练以预测下一个 token 的统计模型,这使它在语言任务上出奇地出色,而在任何需要保证正确性的事情上都不可靠。

最近审阅: 2026-06-02 审阅人Kevin Riedl wiki ↗

LLM 是一种在海量文本上训练、只做一件事的模型:根据之前的全部内容预测下一个 token(大致是下一个词片段)。把足够多的这种预测叠加起来,就得到了流畅的回答、摘要、翻译和代码。这就是全部的诀窍。它不是人类意义上的推理,而是非常出色的模式补全。

这一点很重要,因为它同时解释了魔力与局限。LLM 对你的业务没有记忆,没有超出其训练截止日期的知识,也没有内置的保证它给出的流畅回答是真实的。它会用与正确事实完全相同的自信说出一个错误事实。把它当作工具,而不是神谕。

当你需要确定性的、可审计的输出时,LLM 就是错误的工具:税务计算、监管逻辑,任何"通常正确"就构成隐患的场景。正确的做法是用它周围那些枯燥的工程把模型包裹起来:用检索提供事实,用校验处理输出,并在出错代价高的地方加入人工环节。这正是我们在 人工智能 下所构建的。

诚实的总结:LLM 是一个概率性的文本引擎。用于合适的工作(起草、分类、抽取、在自己的数据上搜索)时,它是真正的力量倍增器。当作真理来源使用时,它是一个充满自信的隐患。

// FAQ

常见问题

常见问题

一种根据已有文本预测下一段文本的模型。在足够的数据上训练后,这种预测会产生流畅、有用的回答。它是大规模的模式补全,而不是理解。
当你需要保证正确且可审计的答案时。LLM 是概率性的,所以对于税务计算、合规逻辑,或任何自信的错误答案会带来危险的场景,应使用确定性代码,让 LLM 只在边缘处辅助。
只知道到其训练截止日期为止的内容。任何更新的内容,或任何与你业务相关的具体内容,除非你在运行时通过检索把上下文喂给它,否则它都不知道。