观点,不是新闻稿
每 token 更便宜。每个答案更贵。
Sonnet 5 的每 token 单价比 Opus 4.8 更低,但在完整基准测试中,每完成一个任务的成本反而更高。为什么真正决定账单的是每任务成本,而不是每 token 单价。
Fable 回来了。这才是用它写代码的正确方式。
Fable 5 再次可用,但背后是更严格的分类器,有时会回退到 Opus 4.8。别把它当自动补全用:把它用在架构、迁移规划和最终审阅上,其余的路由给更便宜的模型。
Dario 向开源宣战。真正的战争,是关于你那张 AI 账单。
Anthropic 指控中国实验室窃取它的模型,并请华盛顿介入。剥掉地缘政治,这是一场关于智能价格的仗。Coinbase 已用开源权重和路由把 AI 账单砍掉 50%。我们的解读,以及欧盟的对冲。
敏捷去工程化
一场旨在解放工程师的运动,如何反而侵蚀了企业的工程文化。Alexandre Kotcherguine 与 Kevin Riedl 追溯商业化、仪式捕获、指标倒置和工程手艺侵蚀的完整机制。
2026 年 DACH 地区的内部 AI 助手到底要花多少钱
Embedding、向量库、token、托管,以及所有人都忘记的维护项。一份面向 DACH 公司的方向性每席位成本拆解。
MVP 已死。请构建最小可信产品。
AI 降低了原型成本,却没有降低产品判断的难度。粗糙的传统 MVP 如今可能污染它本应收集的信号。本文提出一种更小、更完整、更可信,并能产生决策级证据的首版产品。
2026 年 LLM 网关对比:LiteLLM vs OpenRouter vs Portkey vs RouteLLM
一个端点覆盖多家供应商,把回退、缓存、花费上限和路由收在一处。LiteLLM、OpenRouter、Portkey 和 RouteLLM 有何区别,以及怎样按约束你的那条限制来选。
在欧盟自托管 LLM:开放权重模型何时才真正划算
GPU 是便宜的部分。这里讲清自托管的真实成本、相对托管 API 的每天 token 盈亏平衡点、数据驻留何时逼你出手,以及 vLLM 生产栈。
2026 开源权重 LLM 对决:DeepSeek vs Qwen vs Kimi vs GLM vs Llama
DeepSeek、Qwen、Kimi K2、GLM 与 Llama 在价格、编码与推理质量、上下文窗口、许可证和欧盟自托管上的对比,以及我们在上线一个模型前所用的决策顺序。
2026 年奥地利 AI 咨询:面向中小企业的诚实指南
AI 咨询究竟包含什么、2026 年成本几何、哪些应用场景有回报、EU AI Act 当下要求什么,以及资助如何运作。这是工程视角,而非销售话术。
瓶颈从来不是智能,而是上下文。
乐天让一个编程智能体在 vLLM 上跑了七个小时,准确率 99.9%。真正的教训不是那几个小时,而是瓶颈是上下文而非智能,以及指挥智能体成了新的深度工作。
DACH 企业怎么选:ChatGPT Enterprise vs Copilot vs 自建 RAG
扎根 M365 选 Copilot;数据分散选 ChatGPT Enterprise;只有要完整控制力才自建 RAG。三者单独都不符合 GDPR,您仍是数据控制者。2026 年年中现状。
2026 年 AI 应用的欧盟数据驻留对比
OpenAI、Azure、Mistral、Hetzner 还是自托管?几乎人人忽略的陷阱:欧盟数据驻留通常指数据存储在欧盟,而非模型在欧盟运行。
Lovable、Bolt 和 Replit 应用尽职调查
在以 AI 构建的应用去融资或出售之前,三个问题决定它能否过关:它安全吗,归你所有吗,可维护吗?这是安全、知识产权与投资准备清单。
2026奥地利AI资助:aws、FFG、研究奖励、KMU.DIGITAL
2026年奥地利AI资助的四条路径,诚实评估:aws用于引入,FFG用于研发,14%研究奖励,以及KMU.DIGITAL。还有无人提及的难处:开放窗口与剩余预算。
如何在 2026 年把 AI 落地到团队内部
大多数内部 AI 落地都沦为摆设。我们应用的顺序:教育团队,梳理真实流程,定好成本与合规,把一个工作流做到生产级,再交接出去让你的团队真正掌控它。
MCP vs RAG vs Agent Skills vs Custom GPTs
不是同一问题的四个答案,而是四个层:RAG 提供知识,MCP 提供连接性,Skills 提供流程,Custom GPTs 是打包界面。一份决策树,以及为何大多数情况下应组合而非择一。
Fractional CTPO 对比 CTO 和 CPO
一个同时掌管产品与工程的合并脑袋,何时胜过分别招 fractional CTO 和 CPO,八名工程师的拆分点,以及单点故障的取舍。
融资前 AI MVP 的技术尽职调查
投资者在 AI MVP 中检查什么:作为证据的评估、版本管理、推理成本、数据权利、EU AI Act,以及融资前应备好的交接资料。
Vibe-Code 生产就绪清单
一份独立、可快速浏览的清单,在真实用户接触之前检查任何 AI 生成应用。十项检查按咬人频率排序,分为阻断、高危和清理。
把一个 vibe-coded 应用做到生产可用要花多少钱?
按产品类型的工作量区间、时间真正的去向,以及审计通常会发现什么,以钱和时间线呈现。加固是花费,审计先告诉你它的规模。
Fractional CPO vs 资深 PM
Fractional CPO、资深 PM 和先谁都不招各自到底负责什么。从 PM 到 CPO 的进阶,以及为什么大多数早期创始人一个都不需要。
什么时候招 Fractional CPO
一个诚实的框架。PMF 之后的触发点、创始人是否愿意交出产品决策权、什么时候适得其反,以及 freier Dienstvertrag 合同形式。
面向德语区中小企业的一页式 AI 政策
您的团队早已在用 AI。与其写 27 页,不如写一页会被读完的内容:获批工具、数据规则、培训(欧盟《人工智能法案》第 4 条)、人工复核、披露与一位负责人。附可直接复制的模板。
如何在 2026 年降低 LLM Token 成本
Token 价格下来了,但带 agent 的产品账单依旧很高。我们按顺序执行的实战手册,缓存、批处理、路由、选对模型(含中国开源权重 frontier 模型)以及上下文压缩。
30/60/90 天 AI 智能体试点:上线计划
一次现实的 AI 智能体上线大约需要 90 天。计划是:界定范围、降低风险,以影子模式构建,在批准关卡下投入有限生产环境,并把所有权干净地移交给团队。
兼职 CTO:30/60/90 天计划
您已经聘请了一位兼职 CTO。前 90 天究竟应当产出什么?评估、规划、执行,并留下一个仍在运转的系统以及能在他离开后留存的交付物。
AI MVP 范围:验收标准、评测集与 SoW
对 LLM 而言,“它能用”不是验收标准。四样东西必须写进 SoW:评测集、带阈值的目标指标、上线门槛,以及不确定情形的处理。附可直接复制的模板。
面向 SharePoint、Confluence、Drive 的权限优先 RAG
企业级 RAG 真正的难题是权限,而非检索质量。如何在检索层强制执行访问控制、把 ACL 带到每个 chunk 上,并避免泄露。
AI 生成代码的 QA
Lovable、Cursor、Claude Code 和 Replit 生成的代码在上线前会在哪里出问题,以及我们用来排查的生产就绪清单。
从 Lovable 和 Cursor 原型到生产:迁移清单
做到 demo 很快。做到生产是一个独立的项目。这是我们用来给 AI IDE 原型做加固的清单,涵盖认证、数据、密钥、托管,以及保留还是重建的抉择。
Vibe-Coded 软件审计:上线前会出什么问题
你上线了从没读过的软件。这是我们对 AI 生成代码所做的结构化通读,我们最先检查的七件事,以及什么会卡住上线、什么可以等。
面向欧盟企业的 RAG 生产就绪清单
做一个 RAG demo 很容易。做一个可信赖、在 GDPR 与《AI 法案》下站得住脚、又付得起的 RAG 助手则不然。这是我们在上线前会跑的检索、锚定、成本、合规与安全检查。
奥地利做 AI MVP 和初创产品的最佳软件公司(2026)
奥地利不存在唯一最佳的软件公司。一份诚实、公道的创始人指南,教你按所处阶段、预算和产品的 AI 核心程度选对类别,外加签约前该问的十个问题。
2026 年在奥地利做一个 AI MVP 要多少钱?
按层级划分的诚实 EUR 区间、把数字推高或拉低的因素、自建/购买/微调的判断、人们忘掉的持续成本,以及奥地利的资助叠加如何改变真实价格。
什么时候不该雇用 Wavect
一份诚实的清单,列出 Wavect 不是对的人选的六种情况、该转而找谁,以及我们真正最擅长的那一小块工作。
软件工作室能否申请奥地利的 Forschungsprämie?
奥地利的 Forschungsprämie 以现金返还符合条件研发成本的 14%,即使亏损也能拿到。哪些开发成本算数、什么会被 FFG 驳回,以及它与德国 Forschungszulage 的对比。
什么时候值得构建一套 LLM 评测?成本、ROI 与信任裁判
当风险、调用量和 prompt 变更频率超过测试框架的成本时,构建 LLM 评测才值得。模型账单是每次运行几美元;真正的成本是一个你能信任的数据集和裁判。
为什么跨链桥不断被掏空
Ronin、Wormhole 和 Nomad 三者合计损失超过 11 亿美元。根源是信任模型,而不是代码。以及,你到底需不需要一座桥。
奥地利创业资助究竟如何叠加
aws Preseed、FFG Basisprogramm 和 14% 的 Forschungsprämie 可以合法叠加,但双重资助规则会抵消重叠的欧元。上限、完整算例,以及申请的顺序。
React Native vs Flutter:必须在本地招聘的 DACH 创始人该怎么选
每个对比都跳过的变量是:在因斯布鲁克、维也纳、慕尼黑或苏黎世你实际能招到谁。为什么 React Native 通常赢下 DACH 的招聘数学。
LoRaWAN vs NB-IoT vs Sigfox:如何为 IoT 传感器试点编制预算
一个决定主导你试点 80% 的成本,而且不是无线本身。你拥有的私有网络 vs 你租用的运营商订阅,附一个完整的 TCO 交叉算例。
专注力是新的瓶颈
LLM 把瓶颈从打字搬到了专注力。编排上限、N 个代理之后的七种失败模式,以及我们如何控制代理数量。
智能合约安全检查清单(30 项)
我们在 Solidity 代码送外部审计前会跑的 30 项内部清单。编译器、访问控制、重入、gas 攻击面。
奥地利 Fractional CTO 日费率
因斯布鲁克、维也纳、林茨的 Fractional CTO 真实日费率区间。Pre-seed、Seed、Series A、scale-up 阶段每天的欧元到底买到什么。
5 人创业团队的 EU AI Act 成本
3 万到 8 万欧元的逐项拆解。法律审查、风险分级、技术文档、合规评估、数据治理、上市后监控。
奥地利 SaaS:Werkvertrag vs T&M
谁承担范围风险、ABGB 下验收怎么走、账务上各自怎么处理,以及奥地利项目何时该选哪种合同模型。
我们交付的产品。多少失败了
Wavect 交付产品的整体结果分布。多少做到了规模化、多少被下线、多少落在不上不下的中间地带。
21 个 Web3 项目。Gas 成本复盘
21 个项目里 gas 成本到底烧在了哪里,以及今天我们会怎么选链。Ethereum、Arbitrum、Optimism、Polygon、Base、Solana 横向对比。
Scope Creep 比率。真实数字
固定价与 T&M 项目里实际的范围变更频率。为什么签字的 Werkvertrag SoW 才是合同的关键,而不是价格本身。
何时 Fractional CTO 胜过招人
奥地利招一位资深 CTO 的全负载第一年成本,对比 Fractional 顾问月费。各自什么时候赢,什么时候是错的选择。
奥地利 2026:MiCA + FMA 现实
从工程视角看奥地利加密合规手册。CASP 分类、资本下限、FMA 接触点,以及创始人反复问的那些问题。
DACH SaaS:GDPR + EU AI Act
5 人团队的合规叠加。Annex III 风险判定决策树,加上一张谁负责哪项控制的责任矩阵。
为什么 40% 的 AI 代理项目会死
我们在 AI 代理项目里反复看到的八种模式。它们长什么样、怎么把项目搞死,以及早期发现时的低成本修法。
2026:RAG vs Fine-Tuning vs Long-Context
决策树已经变了。新的交叉点在哪里,以及 100MB 语料库、每月 10k 次查询的欧元成本模型。
2026 LLM API 成本:架构要变
token 已经便宜了,架构要跟着价格曲线走。上下文窗口巨大、路由成为关键的 2026 年,要做的七步动作。
Ethereum 到 Solana 迁移成本
Ethereum 到 Solana 迁移的实话拆解。账户模型、EVM 到 SVM 工具差距、indexer 重建、钱包 UX、代币标准、重新部署成本。
加密之外的零知识应用
六个非加密的 ZK 用例。隐私保护的 KYC、年龄验证、供应链溯源、私密凭证、机密 ML 推理。
生产环境的账户抽象
ERC-4337 修好的六件事,对比它修不好的六件事。再加上 EIP-7702、bundler 中心化风险,以及 paymaster 经济模型。
软件项目定价的正确方式
所有人都讨厌按小时计费,所以他们要求固定价格。问题是,软件项目的固定价格同样有缺陷。
为什么人们觉得外包公司很烂
软件有缺陷、截止日期一拖再拖、账单出乎意料。这些噩梦都是真实的,但外包公司真正的问题可能不是你想的那样。
为什么测试驱动开发值得投入
测试给人留下了一个假象:它成本高、拖慢开发速度、阻碍工程部门。而现实是,它能为你省下大钱。
软件:一个有生命的有机体
软件永远没有完成的一天,但大多数公司还是把它当成「能做完」来做预算。以下是如何停止烧钱,开始打造用户口口相传的产品。
逃离功能陷阱
大多数产品死于功能过多,而非过少。以下是如何停止什么都做,开始专注于真正重要的那件事。
通往产品市场契合的道路
人人都在谈PMF,几乎没人能做到。保证你永远无法实现PMF的最快方式?从第一天就专注于错误的事情。
