融资前 AI MVP 的技术尽职调查清单
对 AI MVP 的技术尽职调查会审查与任何软件评审相同的层面(代码、基础设施、安全、团队),再加上一组通才会遗漏的 AI 专属检查项:你是否有评估集和回归评估,提示词和模型是否已做版本管理,你是否记录每一次模型调用,模型失效时会发生什么,一次推理实际花费多少,以及你是否拥有用于训练或检索的数据的权利。把一个可融资的 AI MVP 与一个演示区分开来的唯一东西就是证据。投资者越来越把一套私有的、有版本管理的评估套件当作你的 AI 能用的证明。"我们靠人工测试"过不了这道关。这是一份你应该在别人对你用之前先对自己用的清单。
这是一份面向创始人的工程视角,把投资者的问题明确摆出来。监管时间点截至 2026 年年中有效;其中一个尤其是陷阱,如果你围绕一个尚未发生的延期来规划,下文会标出。
想在融资前做一次独立的技术尽职调查吗?
预约免费咨询为什么要证据,而不是演示
两项独立发现确立了这道门槛。斯坦福对专门打造的法律 AI 工具(也就是以准确为卖点的那类)的研究发现,某些产品在超过 17% 的基准查询上仍然出现幻觉,另一些则超过 34%。而一份在 2025 年被广泛引用、与 MIT 相关的报告发现,约 95% 的企业生成式 AI 试点没有带来可衡量的财务影响。对一个正在融资的创始人来说,教训很直白:一个能跑的演示几乎什么都证明不了,而投资者心知肚明。能推动一轮融资的,是经过衡量的证据,证明你的系统能用、不会回退,并且在规模化下经济和法律上都站得住脚。
通才会遗漏的 AI 专属检查项
这是本文的核心,也是通用软件评审会跳过的部分。每一项都说明:检查什么、为什么重要,以及危险信号。
- 一个评估集。一个有版本管理的黄金数据集加上一套评分细则。单元测试告诉你绿或红;它们无法告诉你某个回答是否正确或是否忠实于来源。危险信号:"我们用肉眼看输出",没有黄金集,没有数字。
- 作为 CI 关卡的回归评估。评估套件在每次提示词或模型改动后、部署前运行。当模型版本或输入发生变化时,同一个提示词会给出不同输出,而针对一个用例的修复会悄悄破坏另一个。危险信号:提示词改动直接上生产环境。
- 模型调用的可观测性。对每一次模型调用做追踪,带有 token 与成本核算,并捕获提示词和响应。你无法调试一个你无法重建的糟糕回答。危险信号:把"我们用供应商的仪表盘"当作全部说辞。
- 提示词与模型的版本管理。提示词是有版本管理的产物,模型被固定,而不是以"latest"调用、在你不知情下自动升级。危险信号:提示词内联硬编码,模型别名指向 latest。
- 模型失效时的回退。重试、备用模型或备用供应商、优雅降级。你的可用性现在受制于一个第三方 API。危险信号:一个供应商、一个模型,没有超时或降级路径,于是某个供应商一宕机就是全面宕机。
- 每次推理的单位经济。先按每次调用建模成本,再到每个动作,再算进毛利。智能体式流程会把一个动作扇出成数百次调用。危险信号:没有每动作成本指标,毛利被假定为"类 SaaS"。
- 训练和检索数据的权利。有据可查的来源,以及每个来源的许可或授权。问题不再是"这算不算合理使用",而是"你能否证明每一条数据从何而来、且是合法获取的"。危险信号:来源不明的抓取数据,没有使用权的 RAG 语料库。
- 经过衡量的幻觉率加上护栏。在领域基准上的错误率,加上检索接地和输出校验。危险信号:没有衡量过的比率,却把"RAG 能解决幻觉"说得像问题已经解决。
- 模型选择与锁定。对专有 API 与开放权重的取舍理由,以及一个让你能更换供应商的抽象层。危险信号:与某一家供应商的 SDK 硬耦合,其经济性只在今天的补贴价下才成立。
可融资的 AI MVP 已备好的交接资料
如果这些都在,尽职调查会很快,你的估值也守得住。如果它们只活在某位创始人的脑子里,每一处缺口都会变成一笔折扣。
| 资料 | 尽职调查为何在意 | 缺失时的危险信号 |
|---|---|---|
| 架构图(注明日期,列出外部依赖) | 检验它能否撑住 10 倍,并暴露关键人物风险 | 架构只活在某位创始人的脑子里 |
| 数据流图(跟着数据走,而非跟着服务走) | 显示哪些第三方接触哪些数据;GDPR 风险敞口 | 投资者将继承的未知隐私敞口 |
| 评估报告(有版本管理的工具链,按模型和提示词分列结果) | 所声称的 AI 护城河如何被验证而非凭信任 | 没有客观证据表明模型能用或不会回退 |
| 模型与提示词登记表 | 任何输出的可复现性和回滚 | 生产环境的行为无法复现 |
| 运维手册与事件响应 | 降低关键人物依赖,合规的基础证据 | 未经衡量的宕机风险 |
| SBOM(SPDX 或 CycloneDX,在 CI 中重新生成) | 暴露 copyleft 污染和未修补的 CVE | 未知的许可证与漏洞敞口 |
| 知识产权权属链(创始人和承包商的权利转让) | 经典的交易杀手;付一张发票并不转移知识产权 | 一位离开的贡献者从未转让过一个核心模块 |
| 安全报告(近期渗透测试、SOC 2 或 ISO 27001 如适用) | 2026 年的基本要求,并能打通企业销售 | 未知的数据泄露敞口 |
数据、隐私与来源
对一个欧盟的 AI MVP 来说,交易就是在这里被重新定价的。尽职调查会检查你的处理活动记录(GDPR 第 30 条)、用个人数据训练的合法依据(第 6 条和第 9 条,并存档一份合法利益评估)、高风险处理前的数据保护影响评估(第 35 条),以及与次级处理者的数据处理协议。请注意一件创始人会忽略的事:一个吞入你用户提示词的模型 API 就是一个次级处理者,因此它需要一份 DPA 以及不训练、零留存的配置,而不是消费级条款。EDPB 第 28/2024 号意见还警告,用个人数据训练出的模型并不自动匿名,因此不合法的训练数据可能污染已部署的产品。关于 EU AI Act,大多数高风险和透明度义务现行的有约束力日期是 2026 年 8 月 2 日。2026 年有一项延期提案在流传,但并未颁布成法,而一个押注于该延期的合规计划本身就是一个危险信号。
投资者真正会标注什么
从投资者和收购方的角度看(这些来源是利害关系方,请据此权衡),反复出现的标注是:在单一模型上的薄封装,缺乏工作流深度;护城河薄弱(如今持久的护城河是专有或经授权的数据、集成和持久上下文,而不是基础模型本身);扣除推理成本后的毛利,因为推理是真实的可变成本,会打破类 SaaS 的毛利假设;切换成本低时脆弱的留存;以及越来越被看重的、缺少私有持续评估这一点。具体到收购,预期会有针对核心 AI 工程师的留任条款,以及与数据来源陈述挂钩的赔偿条款。其中关于 vibe-coding 的角度,安全、知识产权归属,以及收购方在 AI 生成代码里会检查什么,是我们关于 Lovable、Bolt 和 Replit 尽职调查的文章中单独的一份清单;而支撑第一项和第二项的评估纪律,则在何时值得构建 LLM 评估中。

"演示证明你能拿到一次好答案。评估集证明你能持续拿到好答案,并且在它们不再好时你会察觉。投资者不再被前者打动,而开始要求后者。这个转变就是 AI 尽职调查的全部要义。"
常见问题
AI 初创公司的技术尽职调查是什么?
投资者会在 AI MVP 中检查什么?
融资前我需要哪些评估证据?
AI 尽职调查与普通软件尽职调查有何不同?
尽职调查需要 SBOM 吗?
什么是知识产权权属链,它为何能搞砸交易?
GDPR 如何影响欧盟的 AI 尽职调查?
EU AI Act 已经适用于我的 MVP 了吗?
奥地利的技术尽职调查,有什么不同吗?
我如何证明我的 AI 产品不只是一个 GPT 封装?
最终思考
对 AI MVP 的技术尽职调查,不是在通用代码评审上加个 AI 字眼。决定你这一轮的,是那些 AI 专属的层面:证明这东西能用且不会回退的评估,让任意输出可复现的版本管理,诚实的推理经济,以及对你数据的干净权利。
好消息是,所有这些在尽职调查之前修复都比在调查期间解释更便宜。把评估集建起来,把模型固定住,把调用记录下来,把知识产权权属链签好,并把这些资料备在一个文件夹里。做到这点,尽职调查就成了走形式。跳过它,每一处缺口都会变成对你估值的一笔折扣。
想在融资前把评估集和资料都准备好吗?
预约免费咨询