融资前 AI MVP 的技术尽职调查清单

对 AI MVP 的技术尽职调查会审查与任何定制软件开发评审相同的层面（代码、基础设施、安全、团队），再加上一组通才会遗漏的 AI 专属检查项：你是否有评估集和回归评估，提示词和模型是否已做版本管理，你是否记录每一次模型调用，模型失效时会发生什么，一次推理实际花费多少，以及你是否拥有用于训练或检索的数据的权利。把一个可融资的 AI MVP 与一个演示区分开来的唯一东西就是证据。投资者越来越把一套私有的、有版本管理的评估套件当作你的 AI 能用的证明。"我们靠人工测试"过不了这道关。这是一份你应该在别人对你用之前先对自己用的清单。

这是一份面向创始人的工程视角，把投资者的问题明确摆出来。监管时间点截至 2026 年年中有效；其中一个尤其是陷阱，如果你围绕一个尚未发生的延期来规划，下文会标出。

想在融资前做一次独立的技术尽职调查吗？

预约免费咨询

为什么要证据，而不是演示

两项独立发现确立了这道门槛。斯坦福对专门打造的法律 AI 工具（也就是以准确为卖点的那类）的研究发现，某些产品在超过 17% 的基准查询上仍然出现幻觉，另一些则超过 34%。而一份在 2025 年被广泛引用、与 MIT 相关的报告发现，约 95% 的企业生成式 AI 试点没有带来可衡量的财务影响。对一个正在融资的创始人来说，教训很直白：一个能跑的演示几乎什么都证明不了，而投资者心知肚明。能推动一轮融资的，是经过衡量的证据，证明你的系统能用、不会回退，并且在规模化下经济和法律上都站得住脚。

通才会遗漏的 AI 专属检查项

这是本文的核心，也是通用软件评审会跳过的部分。每一项都说明：检查什么、为什么重要，以及危险信号。

一个评估集。一个有版本管理的黄金数据集加上一套评分细则。单元测试告诉你绿或红；它们无法告诉你某个回答是否正确或是否忠实于来源。危险信号："我们用肉眼看输出"，没有黄金集，没有数字。
作为 CI 关卡的回归评估。评估套件在每次提示词或模型改动后、部署前运行。当模型版本或输入发生变化时，同一个提示词会给出不同输出，而针对一个用例的修复会悄悄破坏另一个。危险信号：提示词改动直接上生产环境。
模型调用的可观测性。对每一次模型调用做追踪，带有 token 与成本核算，并捕获提示词和响应。你无法调试一个你无法重建的糟糕回答。危险信号：把"我们用供应商的仪表盘"当作全部说辞。
提示词与模型的版本管理。提示词是有版本管理的产物，模型被固定，而不是以"latest"调用、在你不知情下自动升级。危险信号：提示词内联硬编码，模型别名指向 latest。
模型失效时的回退。重试、备用模型或备用供应商、优雅降级。你的可用性现在受制于一个第三方 API。危险信号：一个供应商、一个模型，没有超时或降级路径，于是某个供应商一宕机就是全面宕机。
每次推理的单位经济。先按每次调用建模成本，再到每个动作，再算进毛利。智能体式流程会把一个动作扇出成数百次调用。危险信号：没有每动作成本指标，毛利被假定为"类 SaaS"。
训练和检索数据的权利。有据可查的来源，以及每个来源的许可或授权。问题不再是"这算不算合理使用"，而是"你能否证明每一条数据从何而来、且是合法获取的"。危险信号：来源不明的抓取数据，没有使用权的 RAG 语料库。
经过衡量的幻觉率加上护栏。在领域基准上的错误率，加上检索接地和输出校验。危险信号：没有衡量过的比率，却把"RAG 能解决幻觉"说得像问题已经解决。
模型选择与锁定。对专有 API 与开放权重的取舍理由，以及一个让你能更换供应商的抽象层。危险信号：与某一家供应商的 SDK 硬耦合，其经济性只在今天的补贴价下才成立。

可融资的 AI MVP 已备好的交接资料

如果这些都在，尽职调查会很快，你的估值也守得住。如果它们只活在某位创始人的脑子里，每一处缺口都会变成一笔折扣。

资料	尽职调查为何在意	缺失时的危险信号
架构图（注明日期，列出外部依赖）	检验它能否撑住 10 倍，并暴露关键人物风险	架构只活在某位创始人的脑子里
数据流图（跟着数据走，而非跟着服务走）	显示哪些第三方接触哪些数据；GDPR 风险敞口	投资者将继承的未知隐私敞口
评估报告（有版本管理的工具链，按模型和提示词分列结果）	所声称的 AI 护城河如何被验证而非凭信任	没有客观证据表明模型能用或不会回退
模型与提示词登记表	任何输出的可复现性和回滚	生产环境的行为无法复现
运维手册与事件响应	降低关键人物依赖，合规的基础证据	未经衡量的宕机风险
SBOM（SPDX 或 CycloneDX，在 CI 中重新生成）	暴露 copyleft 污染和未修补的 CVE	未知的许可证与漏洞敞口
知识产权权属链（创始人和承包商的权利转让）	经典的交易杀手；付一张发票并不转移知识产权	一位离开的贡献者从未转让过一个核心模块
安全报告（近期渗透测试、SOC 2 或 ISO 27001 如适用）	2026 年的基本要求，并能打通企业销售	未知的数据泄露敞口

数据、隐私与来源

对一个欧盟的 AI MVP 来说，交易就是在这里被重新定价的。尽职调查会检查你的处理活动记录（GDPR 第 30 条）、用个人数据训练的合法依据（第 6 条和第 9 条，并存档一份合法利益评估）、高风险处理前的数据保护影响评估（第 35 条），以及与次级处理者的数据处理协议。请注意一件创始人会忽略的事：一个吞入你用户提示词的模型 API 就是一个次级处理者，因此它需要一份 DPA 以及不训练、零留存的配置，而不是消费级条款。EDPB 第 28/2024 号意见还警告，用个人数据训练出的模型并不自动匿名，因此不合法的训练数据可能污染已部署的产品。关于 EU AI Act，大多数高风险和透明度义务现行的有约束力日期是 2026 年 8 月 2 日。2026 年有一项延期提案在流传，但并未颁布成法，而一个押注于该延期的合规计划本身就是一个危险信号。

投资者真正会标注什么

从投资者和收购方的角度看（这些来源是利害关系方，请据此权衡），反复出现的标注是：在单一模型上的薄封装，缺乏工作流深度；护城河薄弱（如今持久的护城河是专有或经授权的数据、集成和持久上下文，而不是基础模型本身）；扣除推理成本后的毛利，因为推理是真实的可变成本，会打破类 SaaS 的毛利假设；切换成本低时脆弱的留存；以及越来越被看重的、缺少私有持续评估这一点。具体到收购，预期会有针对核心 AI 工程师的留任条款，以及与数据来源陈述挂钩的赔偿条款。其中关于 vibe-coding 的角度，安全、知识产权归属，以及收购方在 AI 生成代码里会检查什么，是我们关于 Lovable、Bolt 和 Replit 尽职调查的文章中单独的一份清单；而支撑第一项和第二项的评估纪律，则在何时值得构建 LLM 评估中。

"演示证明你能拿到一次好答案。评估集证明你能持续拿到好答案，并且在它们不再好时你会察觉。投资者不再被前者打动，而开始要求后者。这个转变就是 AI 尽职调查的全部要义。"

常见问题

AI 初创公司的技术尽职调查是什么？

投资者或收购方对 AI 产品背后的代码、基础设施、AI 系统、数据流和团队进行的审查，核实它能用、能扩展、法律上干净，并且不是单人或单一供应商的负担。对 AI 而言，它还增加了通用软件尽职调查会跳过的评估证据、模型和提示词版本管理、推理经济性以及数据权利检查。

投资者会在 AI MVP 中检查什么？

它是否不只是在单一模型 API 上的薄封装，它通过数据或工作流深度形成的防御力，扣除推理成本后的毛利，留存，以及越来越被看重的、能证明生产质量而非仅是演示的私有评估结果。

融资前我需要哪些评估证据？

一个有版本管理的黄金与回归数据集，按模型和提示词版本评分的结果，一道能拦住回归的 CI 关卡，以及在领域代表性基准上经过衡量的错误率或幻觉率。"我们靠人工测试"过不了这道关。

AI 尽职调查与普通软件尽职调查有何不同？

普通尽职调查问代码好不好、能不能扩展。AI 尽职调查还会问你能否复现任意模型输出，是否记录并观测模型调用，一次推理花费多少，模型失效时会发生什么，以及你是否拥有用于训练或检索的数据的权利。

尽职调查需要 SBOM 吗？

越来越需要。一份当前的 SPDX 或 CycloneDX 格式 SBOM 能暴露开源许可证冲突和已知漏洞，而 M&A 买方和 EU Cyber Resilience Act 如今都要求机器可读的 SBOM。

什么是知识产权权属链，它为何能搞砸交易？

证明公司拥有其全部知识产权的书面证据。著作权默认归作者所有，因此付一张承包商的发票并不转移知识产权。一个未做权利转让的联合创始人或承包商模块，是初创公司在 A 轮前过不了尽职调查的经典原因。

GDPR 如何影响欧盟的 AI 尽职调查？

尽职调查会检查你的处理记录（第 30 条）、用个人数据训练的合法依据（第 6 条和第 9 条）、高风险处理的 DPIA（第 35 条），以及与次级处理者的 DPA，包括那个吞入你用户提示词的模型 API。EDPB 第 28/2024 号意见警告，训练出的模型并不自动匿名。

EU AI Act 已经适用于我的 MVP 了吗？

部分适用。禁止性做法和 AI 素养义务自 2025 年 2 月起适用，GPAI 义务自 2025 年 8 月起适用，大多数高风险和透明度义务自 2026 年 8 月 2 日起适用。有一项延期提案存在但尚未成为法律，所以不要围绕它来规划。

奥地利的技术尽职调查，有什么不同吗？

实质内容是欧盟标准，即 GDPR 和 AI Act。奥地利的特殊之处在于一个积极执法、对 AI 不给豁免的数据保护机构，以及你股权结构表上的 aws 或 FFG 公共资助条款，后期投资者会希望它们干净。

我如何证明我的 AI 产品不只是一个 GPT 封装？

通过集成、专有或经授权的数据和持久上下文展示工作流深度与切换成本，一个让你能更换供应商的抽象层，以及在非补贴模型价格下仍能成立的单位经济。

最终思考

对 AI MVP 的技术尽职调查，不是在通用代码评审上加个 AI 字眼。决定你这一轮的，是那些 AI 专属的层面：证明这东西能用且不会回退的评估，让任意输出可复现的版本管理，诚实的推理经济，以及对你数据的干净权利。

好消息是，所有这些在尽职调查之前修复都比在调查期间解释更便宜。把评估集建起来，把模型固定住，把调用记录下来，把知识产权权属链签好，并把这些资料备在一个文件夹里。做到这点，尽职调查就成了走形式。跳过它，每一处缺口都会变成对你估值的一笔折扣。

想在融资前把评估集和资料都准备好吗？