Kevin Riedl

10 min 阅读 · 01 Jul 2026

Dario 向开源宣战。真正的战争,是关于你那张 AI 账单。

Dario Amodei 不只是批评开源 AI。Anthropic 出手,想把它的一部分给禁掉。这家公司指控中国实验室窃取其能力,并请求华盛顿介入。在 7 月 1 日那期 20VC x SaaStr 节目里,Harry Stebbings、Jason Lemkin 和 Rory O'Driscoll 把这套说法拆了个透,而有意思的部分并不是地缘政治。是这场仗揭示了谁在掌控 LLM 智能的成本,以及这种掌控正在多快地流失。

这是我们作为工程师的解读,我们靠把客户工作负载在这些模型之间迁移为生,这不是对中美政策的评判。论点很简单:这场开源战争,是一场关于定价权的代理战争。跟着钱走,一切就清楚了。

在为通用活儿付着 frontier 的价钱?

 预约免费咨询

Anthropic 到底指控了中国什么?

指控是蒸馏:用一个更强的模型的输出去训练另一个模型。2026 年 2 月,Anthropic 点名了 DeepSeek、Moonshot AI 和 MiniMax,声称它们以违反其服务条款的方式,用 Claude 抽取能力。6 月 24 日它升级了指控,称阿里巴巴发动了迄今为止针对它已知规模最大的一次蒸馏攻击:大约 2880 万次对话,通过数千个欺诈账户跑完。

把措辞读仔细。Anthropic 自己承认,蒸馏本身是一种被广泛使用且正当的训练方法。它的抱怨是关于做法:违反服务条款和欺诈账户,而不是这项技术。这个区别很重要,因为 Anthropic 推动的补救措施,比它指控的罪行宽泛得多。它敦促国会打击中国对手的蒸馏行为,并把整件事包装成国家安全问题:论调是,廉价的中国模型缩小了美国的领先优势,可能加速对手的军事与网络 AI。

如果你想搞清楚,蒸馏和微调为什么让克隆一个强模型变得如此容易,那正是这场争议的技术核心。而商业层面的要点是:这项技术现在已经便宜到,没有哪家实验室能守住一个持久的质量领先。

保护主义的解读:这是安全,还是护城河?

Rory O'Driscoll 在节目里的反驳最锋利。一家美国 frontier 实验室,自己的模型是用抓来的网页和第三方 IP 训出来的,却在竞争对手从它的输出里学东西时高喊窃取,这里面有实打实的虚伪。而它提出的补救措施,看起来不像安全政策,更像是用监管挖出来的一条护城河。

他那个类比最扎心:为了保护一家 frontier 实验室的经济账而封杀低成本开源权重模型,就像 1980 年代为了撑住 IBM 的股价而禁止 IBM PC 的克隆机。正是克隆把计算的价格拉了下来,让每张桌子上都有了一台机器。当年把它叫作窃取没能阻止它,现在也不会。用他的话说,这么干「蠢透了」。

对 Anthropic 这一步最合理的解读,也是这几位嘉宾反复绕回的一个,是一笔监管上的交易,而不是一次有原则的立场:在国内一侧接受一些限制,换取联邦层面对蒸馏出来的中国模型的封禁。这是分析,不是已确认的事实。但它符合各方的动机。当你产品的单位价格在快速下跌时,捍卫利润最便宜的办法不是造一个更好的产品。是让更便宜的替代品变成非法。

Kevin Riedl

"当一个产品的价格在塌,捍卫利润最便宜的办法就是让更便宜的替代品变成非法。那是一场政策仗,不是产品仗,买家应当照此对待。"

Coinbase 已经把这个实验做完了

就在 Anthropic 为规则争论时,一家上市公司刚刚展示了:当你无视这场戏、埋头去优化时会发生什么。6 月下旬,Coinbase 的 CEO Brian Armstrong 说,公司把内部 AI 开支削减了大约 50%,同时 token 用量还在往上涨。他没有给任何一名工程师设上限就做到了。用到的杠杆,正是我们和客户一起打磨的那几个:

  • 更好的默认,而不是用量上限。Coinbase 把工程师的默认模型设成了开源权重模型,具体是 GLM 和 Kimi 这一档,同时任由他们在任务需要时选用 frontier 模型。反正大多数人本来也从没触到过旧的上限,所以降低默认价格胜过去管制用量。
  • 按任务路由。Prompt 先经过预处理,再路由到能干完这活的最便宜模型,把价格和缓存命中都算进去。
  • 缓存。单个最大的杠杆。Coinbase 把缓存命中率从约 5% 推到了约 60%。

这和我们在如何在 2026 年降低 LLM token 成本里摆出来的手册是同一套:缓存会重复的,把简单的大多数路由到便宜模型,把 frontier 模型留给困难的尾部。让这一切变安全的那层 router,我们在LLM 网关与 router 拆解里做了比较,而 Coinbase 倚重的那些开源权重模型,正是我们在开源权重 LLM 对决里做基准测试的那些。

嘉宾们对这意味着什么产生了分歧。Lemkin 把 Armstrong 那条帖子斥为「表演式社交媒体」,他的意思是,如果营收顶线不动,省成本没多大意义。Rory 把它读作成本管理的常识,每个精打细算的高管都会照抄,用来遏制失控的模型费用。两个人都对,而这种张力,正是当下企业 AI 的全部故事。

没人愿意点破的那场 ROI 清算

Coinbase 这场辩论背后,藏着一个让人不适的规律。公司往 AI token 上砸进数百万,却交出和以前一样的增长率。加大开支没能把顶线拉动。董事会已经注意到了,对无脑「token 拉满」的反弹已经开始。CFO 们想要一条清晰的连线,从 AI 开支通向更快的交付,或者实打实的净利节省,而大多数人现在还画不出来。

这不是反对 AI 的论据。这是要求去度量它的论据。如果你的产品每个任务要调用几百次,那更便宜的单位 token 价格就毫无意义,这也是我们反复敲打每 token 成本与每任务成本之别的原因。而那些悄悄失败的项目,很少是败在模型质量上。它们败在范围、评估和集成上,也就是我们在为什么 AI agent 项目会被砍里逐条走过的那些失败模式。如果你度量不出提升,那么像 Coinbase 那样把账单砍掉一半,就是理性的第一步,因为至少那笔节省是真的。

钱其实正流向哪里

这一周里另外两个数据点,从资本一侧给出了同样的论据:投资人现在奖励的是纪律和现金生成,不是烧 token。

  • Kalshi 正在追逐 400 亿美元估值。这家预测市场交易所正以约为上一轮两倍的估值募资,背后是超过 20 亿美元的年化营收和约 1780 亿美元的年化交易量。不过有一处炒作值得纠正:IPO 并非近在眼前。CEO Tarek Mansour 已排除了 2027 年之前上市,现实的窗口是 2027 年底或 2028 年。
  • Bending Spoons 是今年最聪明的一次 IPO。这家米兰运营商 7 月 1 日在纳斯达克上市,发行价 29 美元,首日收盘大涨近 40%,约 40.50 美元,市值接近 257 亿美元,是它上一次私募估值的两倍多。它靠的不是自然的用户增长。它买下黏性强但表现不佳的平台,其中包括 AOL、Vimeo、WeTransfer、Eventbrite 和 Evernote,然后提价、砍掉冗余,再重写软件。

节目里 Lemkin 认为这套整合打法正冲着成熟的 B2B SaaS 而来:收购一个黏性强、表现不佳的平台,注入求胜的运营者,修好留存,把营收套利抓到手。他点到的那些名字,Marketo、Asana、PagerDuty,是他对未来目标的猜测,不是 Bending Spoons 拥有的公司。底下的信号才是对任何做 AI 预算的人重要的:公开市场正在为盈利能力和运营纪律定价,而不是不惜代价的增长。让一次整合有吸引力的同一套逻辑,也让一张没被度量的 AI 账单成为一项负债。

这对一个欧盟买家意味着什么

你不必在一场中美政策仗里选边,就能行动。那些能砍掉你账单的动作,今天就摆在那儿,无论华盛顿如何决定:

  • 把开源权重当作头等选项。在真实的编码和推理工作上,质量差距已基本弥合,价格却只是 frontier 的一个零头。Coinbase 在生产里证明了这一点。
  • 用托管而不是回避来解决治理。用一个中国开源权重模型,真正的问题不是质量,是推理在哪里跑、数据落在哪里。把它自托管在欧盟基础设施上,你就能保住价格优势,而不用把数据送出境。我们在在欧盟自托管 LLM里把这笔账算了出来,并在AI 应用的欧盟数据驻留里梳理了合规选项。
  • 默认路由,按需升级。先上便宜模型,只在置信度检查没通过时才上 frontier 模型。把升级率当作一项 KPI 来跟踪。

就算联邦禁令真的落地,它管的是美国的访问权,管不到一台跑在法兰克福服务器上的自托管开源权重模型。对你自己技术栈的主权,才是那个对冲。把这些搭起来,路由、评估、托管决策,正是我们AI 赋能项目里的工作。

常见问题

什么是模型蒸馏,它合法吗?
蒸馏是用一个更强的模型的输出,去训练一个更小或更新的模型。Anthropic 自己都称这项技术被广泛使用且正当。它对中国实验室的抱怨是关于访问的方法,一次被指控的服务条款违规和欺诈账户,而不是这项技术本身。今天并没有一条普遍禁止蒸馏的法律。
Coinbase 真的把 AI 开支砍了 50% 吗?
是的。2026 年 6 月下旬,CEO Brian Armstrong 说,内部 AI 开支下降了约 50%,即便 token 用量还在上升,靠的是开源权重默认、按任务路由,以及把缓存命中率从约 5% 提到 60%,而且没有给工程师设上限。
对一家欧盟公司来说,中国开源权重模型用起来安全吗?
在大多数编码和推理工作上,质量是有竞争力的。真正的问题是治理:推理在哪里跑、你的数据落在哪里。把一个开源权重模型自托管在欧盟基础设施上,既能保住成本优势,又能把数据留在欧盟。用一个非欧盟 API,则会先带出一个你必须回答的数据驻留问题。
我们该把默认模型换成开源权重吗?
对高用量、对成本敏感的工作负载,去测。把简单的大多数路由到一个便宜的开源权重模型,只在置信度检查没通过时才升级到 frontier 模型。永远别只凭一个基准标题就换。在你自己的评估上证明它,因为一个每 10 个任务失败 1 个的模型并不便宜。
Kalshi 是不是要以 400 亿美元 IPO 了?
Kalshi 正以约 400 亿美元估值募资,约为上一轮的两倍,但 IPO 并非近在眼前。CEO Tarek Mansour 已排除 2027 年之前上市,更可能的窗口是 2027 年底或 2028 年。

最终思考

这场开源战争,是一场披着国家安全外衣的定价战争。当一个产品的价格跌得这么快,捍卫利润最便宜的办法就是让替代品变成非法,而那是一场政策仗,不是产品仗。

买家不必等结果。Coinbase 已经把这步棋演示过了:开源权重默认、聪明的路由和激进的缓存,把账单砍掉一半,且没有丢掉任何访问权。会失败的项目,不是那些选了更便宜模型的,是那些从没度量过提升的。把开源权重当作头等选项,用欧盟托管而不是回避来解决治理,并默认路由。对你自己技术栈的主权,是唯一能挺过华盛顿任何决定的对冲。

想在董事会开口之前,把你的 AI 技术栈做一次成本审计?

 预约免费咨询
Kevin Riedl

10 min 阅读 · 01 Jul 2026