Fine-Tuning
在你自己的示例上继续训练模型以改变它的行为,这对于风格和格式是正确的工具,而对于注入最新事实则是错误的工具。
最近审阅: 2026-06-02
审阅人Kevin Riedl
wiki ↗
Fine-Tuning 拿一个预训练模型,在一组精选的你自己的示例上进一步训练它,调整模型权重,使它倾向于你所演示的行为。你用它来固化一致的语气、特定的输出格式、领域词汇,或基础模型处理得笨拙的某项任务。它改变的是模型如何回应,而不是它能访问哪些事实。
真正要紧的决策是 Fine-Tuning 与 RAG 之争,而人们常常把它弄反。RAG 通过从你的数据中检索,在运行时注入最新的、会变化的事实,所以答案只和你最后一次更新文档一样新。Fine-Tuning 教授持久的行为,但把知识冻结在训练时刻,所以当你的事实会变化时它就是错误的工具。经验法则:为形式而调,为事实而取。许多真实系统两者都用,一个经过微调、以你自家风格回答的模型,再由检索为实时数据提供依据。
成本现实没有过去那么吓人,但依然真实。你需要一个干净、带标注的数据集(通常是数百到数千个示例)、训练运行本身,以及每当基础模型改进或你的需求变化时重新微调的持续成本。最后这项成本是团队会忘记的那一项。Fine-Tune 不是一次性项目,而是一项维护承诺。
Fine-Tuning 什么时候彻底取胜?当 Prompting 加检索无法可靠地产出你所需的格式或行为,而你又有足够多高质量的示例去教它时。拿不准时,先把 Prompting 和 RAG 用尽,因为它们改起来更便宜。我们在 人工智能 下做出这个自建还是微调的判断。
// FAQ