来自实战 第 №65

观点,不是新闻稿

用 Claude Fable 5 写代码:在 Fable、Opus、Sonnet 和 Haiku 之间做模型路由 Engineering

Fable 回来了。这才是用它写代码的正确方式。

Fable 5 再次可用,但背后是更严格的分类器,有时会回退到 Opus 4.8。别把它当自动补全用:把它用在架构、迁移规划和最终审阅上,其余的路由给更便宜的模型。

Anthropic 对开源 AI 的战争,其实是一场关于智能成本的较量 商业与法律

Dario 向开源宣战。真正的战争,是关于你那张 AI 账单。

Anthropic 指控中国实验室窃取它的模型,并请华盛顿介入。剥掉地缘政治,这是一场关于智能价格的仗。Coinbase 已用开源权重和路由把 AI 账单砍掉 50%。我们的解读,以及欧盟的对冲。

敏捷去工程化与企业工程文化的侵蚀 客座文章

敏捷去工程化

一场旨在解放工程师的运动,如何反而侵蚀了企业的工程文化。Alexandre Kotcherguine 与 Kevin Riedl 追溯商业化、仪式捕获、指标倒置和工程手艺侵蚀的完整机制。

2026 年 DACH 内部 AI 助手成本 Engineering

2026 年 DACH 地区的内部 AI 助手到底要花多少钱

Embedding、向量库、token、托管,以及所有人都忘记的维护项。一份面向 DACH 公司的方向性每席位成本拆解。

在 AI 时代用最小可信产品取代传统 MVP 产品管理

MVP 已死。请构建最小可信产品。

AI 降低了原型成本,却没有降低产品判断的难度。粗糙的传统 MVP 如今可能污染它本应收集的信号。本文提出一种更小、更完整、更可信,并能产生决策级证据的首版产品。

2026 年 LLM 网关对比 Engineering

2026 年 LLM 网关对比:LiteLLM vs OpenRouter vs Portkey vs RouteLLM

一个端点覆盖多家供应商,把回退、缓存、花费上限和路由收在一处。LiteLLM、OpenRouter、Portkey 和 RouteLLM 有何区别,以及怎样按约束你的那条限制来选。

在欧盟自托管开放权重 LLM Engineering

在欧盟自托管 LLM:开放权重模型何时才真正划算

GPU 是便宜的部分。这里讲清自托管的真实成本、相对托管 API 的每天 token 盈亏平衡点、数据驻留何时逼你出手,以及 vLLM 生产栈。

2026 开源权重 LLM 对比 DeepSeek vs Qwen vs Kimi vs GLM vs Llama Engineering

2026 开源权重 LLM 对决:DeepSeek vs Qwen vs Kimi vs GLM vs Llama

DeepSeek、Qwen、Kimi K2、GLM 与 Llama 在价格、编码与推理质量、上下文窗口、许可证和欧盟自托管上的对比,以及我们在上线一个模型前所用的决策顺序。

一份关于 2026 年奥地利 AI 咨询的诚实指南 商业与法律

2026 年奥地利 AI 咨询:面向中小企业的诚实指南

AI 咨询究竟包含什么、2026 年成本几何、哪些应用场景有回报、EU AI Act 当下要求什么,以及资助如何运作。这是工程视角,而非销售话术。

为什么软件真正的瓶颈是上下文,而不是智能 Engineering

瓶颈从来不是智能,而是上下文。

乐天让一个编程智能体在 vLLM 上跑了七个小时,准确率 99.9%。真正的教训不是那几个小时,而是瓶颈是上下文而非智能,以及指挥智能体成了新的深度工作。

为 DACH 企业对比 ChatGPT Enterprise、Microsoft 365 Copilot 和自建 RAG Engineering

DACH 企业怎么选:ChatGPT Enterprise vs Copilot vs 自建 RAG

扎根 M365 选 Copilot;数据分散选 ChatGPT Enterprise;只有要完整控制力才自建 RAG。三者单独都不符合 GDPR,您仍是数据控制者。2026 年年中现状。

在各类欧盟驻留方案中,你的 AI 数据存储与处理位置 Engineering

2026 年 AI 应用的欧盟数据驻留对比

OpenAI、Azure、Mistral、Hetzner 还是自托管?几乎人人忽略的陷阱:欧盟数据驻留通常指数据存储在欧盟,而非模型在欧盟运行。

针对用 Lovable、Bolt 和 Replit 构建的应用的安全、知识产权与投资准备 Engineering

Lovable、Bolt 和 Replit 应用尽职调查

在以 AI 构建的应用去融资或出售之前,三个问题决定它能否过关:它安全吗,归你所有吗,可维护吗?这是安全、知识产权与投资准备清单。

2026年奥地利AI资助的四条路径 商业与法律

2026奥地利AI资助:aws、FFG、研究奖励、KMU.DIGITAL

2026年奥地利AI资助的四条路径,诚实评估:aws用于引入,FFG用于研发,14%研究奖励,以及KMU.DIGITAL。还有无人提及的难处:开放窗口与剩余预算。

如何在 2026 年把 AI 落地到团队内部而不沦为摆设 Engineering

如何在 2026 年把 AI 落地到团队内部

大多数内部 AI 落地都沦为摆设。我们应用的顺序:教育团队,梳理真实流程,定好成本与合规,把一个工作流做到生产级,再交接出去让你的团队真正掌控它。

MCP、RAG、Agent Skills 与 Custom GPTs 作为一个 AI 系统的不同层 Engineering

MCP vs RAG vs Agent Skills vs Custom GPTs

不是同一问题的四个答案,而是四个层:RAG 提供知识,MCP 提供连接性,Skills 提供流程,Custom GPTs 是打包界面。一份决策树,以及为何大多数情况下应组合而非择一。

Fractional CTPO 对比一位 fractional CTO 和 CPO 领导力

Fractional CTPO 对比 CTO 和 CPO

一个同时掌管产品与工程的合并脑袋,何时胜过分别招 fractional CTO 和 CPO,八名工程师的拆分点,以及单点故障的取舍。

融资前 AI MVP 的技术尽职调查清单 Engineering

融资前 AI MVP 的技术尽职调查

投资者在 AI MVP 中检查什么:作为证据的评估、版本管理、推理成本、数据权利、EU AI Act,以及融资前应备好的交接资料。

Vibe-Code 生产就绪清单 Engineering

Vibe-Code 生产就绪清单

一份独立、可快速浏览的清单,在真实用户接触之前检查任何 AI 生成应用。十项检查按咬人频率排序,分为阻断、高危和清理。

把 vibe-coded 应用做到生产可用要花多少钱 Engineering

把一个 vibe-coded 应用做到生产可用要花多少钱?

按产品类型的工作量区间、时间真正的去向,以及审计通常会发现什么,以钱和时间线呈现。加固是花费,审计先告诉你它的规模。

Fractional CPO vs 资深产品经理 领导力

Fractional CPO vs 资深 PM

Fractional CPO、资深 PM 和先谁都不招各自到底负责什么。从 PM 到 CPO 的进阶,以及为什么大多数早期创始人一个都不需要。

在奥地利什么时候招 Fractional CPO 领导力

什么时候招 Fractional CPO

一个诚实的框架。PMF 之后的触发点、创始人是否愿意交出产品决策权、什么时候适得其反,以及 freier Dienstvertrag 合同形式。

面向小型德语区企业的一页式 AI 使用政策 商业与法律

面向德语区中小企业的一页式 AI 政策

您的团队早已在用 AI。与其写 27 页,不如写一页会被读完的内容:获批工具、数据规则、培训(欧盟《人工智能法案》第 4 条)、人工复核、披露与一位负责人。附可直接复制的模板。

如何在 2026 年降低 LLM token 成本 Engineering

如何在 2026 年降低 LLM Token 成本

Token 价格下来了,但带 agent 的产品账单依旧很高。我们按顺序执行的实战手册,缓存、批处理、路由、选对模型(含中国开源权重 frontier 模型)以及上下文压缩。

面向中小企业的 AI 智能体 30/60/90 天生产上线计划 Engineering

30/60/90 天 AI 智能体试点:上线计划

一次现实的 AI 智能体上线大约需要 90 天。计划是:界定范围、降低风险,以影子模式构建,在批准关卡下投入有限生产环境,并把所有权干净地移交给团队。

一位兼职 CTO 在初创公司前 90 天的执行计划 领导力

兼职 CTO:30/60/90 天计划

您已经聘请了一位兼职 CTO。前 90 天究竟应当产出什么?评估、规划、执行,并留下一个仍在运转的系统以及能在他离开后留存的交付物。

带验收标准、评测集与上线门槛的 AI MVP 范围模板 Engineering

AI MVP 范围:验收标准、评测集与 SoW

对 LLM 而言,“它能用”不是验收标准。四样东西必须写进 SoW:评测集、带阈值的目标指标、上线门槛,以及不确定情形的处理。附可直接复制的模板。

面向 SharePoint、Confluence 和 Google Drive 的权限优先 RAG 架构 Engineering

面向 SharePoint、Confluence、Drive 的权限优先 RAG

企业级 RAG 真正的难题是权限,而非检索质量。如何在检索层强制执行访问控制、把 ACL 带到每个 chunk 上,并避免泄露。

AI 生成代码的 QA,上线前会出什么问题 Engineering

AI 生成代码的 QA

Lovable、Cursor、Claude Code 和 Replit 生成的代码在上线前会在哪里出问题,以及我们用来排查的生产就绪清单。

从 Lovable 和 Cursor 原型到生产 Engineering

从 Lovable 和 Cursor 原型到生产:迁移清单

做到 demo 很快。做到生产是一个独立的项目。这是我们用来给 AI IDE 原型做加固的清单,涵盖认证、数据、密钥、托管,以及保留还是重建的抉择。

vibe-coded 软件审计,上线前会出什么问题 Engineering

Vibe-Coded 软件审计:上线前会出什么问题

你上线了从没读过的软件。这是我们对 AI 生成代码所做的结构化通读,我们最先检查的七件事,以及什么会卡住上线、什么可以等。

面向欧盟企业的 RAG 生产就绪清单 Engineering

面向欧盟企业的 RAG 生产就绪清单

做一个 RAG demo 很容易。做一个可信赖、在 GDPR 与《AI 法案》下站得住脚、又付得起的 RAG 助手则不然。这是我们在上线前会跑的检索、锚定、成本、合规与安全检查。

奥地利做 AI MVP 和初创产品的最佳软件公司 商业与法律

奥地利做 AI MVP 和初创产品的最佳软件公司(2026)

奥地利不存在唯一最佳的软件公司。一份诚实、公道的创始人指南,教你按所处阶段、预算和产品的 AI 核心程度选对类别,外加签约前该问的十个问题。

2026 年在奥地利做一个 AI MVP 要多少钱 商业与法律

2026 年在奥地利做一个 AI MVP 要多少钱?

按层级划分的诚实 EUR 区间、把数字推高或拉低的因素、自建/购买/微调的判断、人们忘掉的持续成本,以及奥地利的资助叠加如何改变真实价格。

什么时候不该雇用 Wavect 商业与法律

什么时候不该雇用 Wavect

一份诚实的清单,列出 Wavect 不是对的人选的六种情况、该转而找谁,以及我们真正最擅长的那一小块工作。

软件工作室能否申请奥地利的 Forschungsprämie 商业与法律

软件工作室能否申请奥地利的 Forschungsprämie?

奥地利的 Forschungsprämie 以现金返还符合条件研发成本的 14%,即使亏损也能拿到。哪些开发成本算数、什么会被 FFG 驳回,以及它与德国 Forschungszulage 的对比。

什么时候值得构建 LLM 评测 Engineering

什么时候值得构建一套 LLM 评测?成本、ROI 与信任裁判

当风险、调用量和 prompt 变更频率超过测试框架的成本时,构建 LLM 评测才值得。模型账单是每次运行几美元;真正的成本是一个你能信任的数据集和裁判。

为什么跨链桥不断被掏空 Engineering

为什么跨链桥不断被掏空

Ronin、Wormhole 和 Nomad 三者合计损失超过 11 亿美元。根源是信任模型,而不是代码。以及,你到底需不需要一座桥。

aws Preseed + FFG + Forschungspraemie 奥地利资助叠加 商业与法律

奥地利创业资助究竟如何叠加

aws Preseed、FFG Basisprogramm 和 14% 的 Forschungsprämie 可以合法叠加,但双重资助规则会抵消重叠的欧元。上限、完整算例,以及申请的顺序。

React Native vs Flutter:必须在本地招聘的 DACH 创始人该怎么选 Engineering

React Native vs Flutter:必须在本地招聘的 DACH 创始人该怎么选

每个对比都跳过的变量是:在因斯布鲁克、维也纳、慕尼黑或苏黎世你实际能招到谁。为什么 React Native 通常赢下 DACH 的招聘数学。

LoRaWAN vs NB-IoT vs Sigfox IoT 传感器试点成本 Engineering

LoRaWAN vs NB-IoT vs Sigfox:如何为 IoT 传感器试点编制预算

一个决定主导你试点 80% 的成本,而且不是无线本身。你拥有的私有网络 vs 你租用的运营商订阅,附一个完整的 TCO 交叉算例。

编排 AI 代理时,专注力成为新的瓶颈 Engineering

专注力是新的瓶颈

LLM 把瓶颈从打字搬到了专注力。编排上限、N 个代理之后的七种失败模式,以及我们如何控制代理数量。

外部审计前的智能合约安全检查清单 Engineering

智能合约安全检查清单(30 项)

我们在 Solidity 代码送外部审计前会跑的 30 项内部清单。编译器、访问控制、重入、gas 攻击面。

奥地利 Fractional CTO 日费率 领导力

奥地利 Fractional CTO 日费率

因斯布鲁克、维也纳、林茨的 Fractional CTO 真实日费率区间。Pre-seed、Seed、Series A、scale-up 阶段每天的欧元到底买到什么。

5 人创业团队的 EU AI Act 合规成本拆解 商业与法律

5 人创业团队的 EU AI Act 成本

3 万到 8 万欧元的逐项拆解。法律审查、风险分级、技术文档、合规评估、数据治理、上市后监控。

奥地利 SaaS 创始人面对的 Werkvertrag 与 T&M 选择 商业与法律

奥地利 SaaS:Werkvertrag vs T&M

谁承担范围风险、ABGB 下验收怎么走、账务上各自怎么处理,以及奥地利项目何时该选哪种合同模型。

已上线产品中有多少失败,以及无聊的中间地带 产品管理

我们交付的产品。多少失败了

Wavect 交付产品的整体结果分布。多少做到了规模化、多少被下线、多少落在不上不下的中间地带。

21 个 Web3 项目的 gas 成本复盘 Engineering

21 个 Web3 项目。Gas 成本复盘

21 个项目里 gas 成本到底烧在了哪里,以及今天我们会怎么选链。Ethereum、Arbitrum、Optimism、Polygon、Base、Solana 横向对比。

固定价与 T&M 项目的 scope creep 比率 商业与法律

Scope Creep 比率。真实数字

固定价与 T&M 项目里实际的范围变更频率。为什么签字的 Werkvertrag SoW 才是合同的关键,而不是价格本身。

在奥地利,何时 Fractional CTO 比招人更划算 领导力

何时 Fractional CTO 胜过招人

奥地利招一位资深 CTO 的全负载第一年成本,对比 Fractional 顾问月费。各自什么时候赢,什么时候是错的选择。

2026 年奥地利 Web3 创业团队面对的 MiCA 与 FMA 现实 商业与法律

奥地利 2026:MiCA + FMA 现实

从工程视角看奥地利加密合规手册。CASP 分类、资本下限、FMA 接触点,以及创始人反复问的那些问题。

DACH SaaS 创始人面对的 GDPR 与 EU AI Act 叠加 商业与法律

DACH SaaS:GDPR + EU AI Act

5 人团队的合规叠加。Annex III 风险判定决策树,加上一张谁负责哪项控制的责任矩阵。

为什么 40% 的 AI 代理项目被叫停 Engineering

为什么 40% 的 AI 代理项目会死

我们在 AI 代理项目里反复看到的八种模式。它们长什么样、怎么把项目搞死,以及早期发现时的低成本修法。

2026 年 RAG、fine-tuning 与 long-context 的成本交叉点 Engineering

2026:RAG vs Fine-Tuning vs Long-Context

决策树已经变了。新的交叉点在哪里,以及 100MB 语料库、每月 10k 次查询的欧元成本模型。

2026 年 LLM API 成本下降 80% Engineering

2026 LLM API 成本:架构要变

token 已经便宜了,架构要跟着价格曲线走。上下文窗口巨大、路由成为关键的 2026 年,要做的七步动作。

Ethereum 到 Solana 迁移成本拆解 Engineering

Ethereum 到 Solana 迁移成本

Ethereum 到 Solana 迁移的实话拆解。账户模型、EVM 到 SVM 工具差距、indexer 重建、钱包 UX、代币标准、重新部署成本。

加密之外的零知识证明用例 Engineering

加密之外的零知识应用

六个非加密的 ZK 用例。隐私保护的 KYC、年龄验证、供应链溯源、私密凭证、机密 ML 推理。

生产环境中的账户抽象 ERC-4337 Engineering

生产环境的账户抽象

ERC-4337 修好的六件事,对比它修不好的六件事。再加上 EIP-7702、bundler 中心化风险,以及 paymaster 经济模型。

Agile Fixed Pricing Header 商业与法律

软件项目定价的正确方式

所有人都讨厌按小时计费,所以他们要求固定价格。问题是,软件项目的固定价格同样有缺陷。

Software Project Budgets Header 商业与法律

为什么人们觉得外包公司很烂

软件有缺陷、截止日期一拖再拖、账单出乎意料。这些噩梦都是真实的,但外包公司真正的问题可能不是你想的那样。

Test Driven Development Engineering

为什么测试驱动开发值得投入

测试给人留下了一个假象:它成本高、拖慢开发速度、阻碍工程部门。而现实是,它能为你省下大钱。

Software a breathing organism header 商业与法律

软件:一个有生命的有机体

软件永远没有完成的一天,但大多数公司还是把它当成「能做完」来做预算。以下是如何停止烧钱,开始打造用户口口相传的产品。

Feature fabric 产品管理

逃离功能陷阱

大多数产品死于功能过多,而非过少。以下是如何停止什么都做,开始专注于真正重要的那件事。

Road to PMF 产品管理

通往产品市场契合的道路

人人都在谈PMF,几乎没人能做到。保证你永远无法实现PMF的最快方式?从第一天就专注于错误的事情。

本期结束 №65 · 每两周一篇来自一线的实战分享。