2026 年 DACH 地区的内部 AI 助手到底要花多少钱
管理者会问一个简单的问题:一个覆盖公司文档的内部 AI 助手,按人按月到底要花多少钱?得到的回答通常是两种没什么用的说法之一。要么是一个吓人的五位数,背后假设了一个没人需要的自托管 GPU 集群;要么是一个轻描淡写的“几乎不要钱,token 现在很便宜”。两者都不对,因为一个覆盖 SharePoint、Confluence 和 Google Drive 的 RAG 助手,真实成本不是一笔大开支。它是好几笔小开支,外加所有人都会忘记的那一项:把它持续维持运行。
这是工程与流程视角,不是供应商推销。这里讲的是把 AI 在内部铺开,和为你的客户构建 AI 产品是不同的活儿;内部搭建这一侧我们放在 AI Enablement 下做。下面的数字是方向性的,取自 2026 年的公开价格,你的数字会有出入。在做预算之前请重新核对当前价格。
想要一个贴合你 setup 的真实数字?
预约免费咨询到底是什么在推高内部 AI 助手的成本?
几乎所有人都盯着 LLM 账单,而对一个内部助手来说,那很少是最大的一笔。成本由三件你在花掉第一个 token 之前就能掌控的事情决定:
- 有多少人用,用得有多猛。十个每天查询 30 次的重度用户,比 200 个每周打开两次的偶尔用户花得更多。重要的单位是每天的查询数,不是人头数。
- 为了回答它要读多少。每个回答都会把检索到的文档片段塞进 prompt。每次调用塞进十页上下文,你的输入 token 账单就翻倍,哪怕问题只有一行。
- 索引要多新。文档一改就立刻重新 embed,比每晚同步一次更贵。大多数内部知识不会分分钟变化,这是大多数团队白白放掉的一笔节省。
先把这三个假设写到纸上。它们对月账单的影响,比你之后做的任何供应商选择都大。
成本构成,逐项来看是哪些?
这里是一个自管 RAG 助手的完整成本项,附 2026 年的方向性区间。请把数字当作公开价格的快照,而非报价,并在投入前重新核对。
| 构成 | 它是什么 | 大致月成本 | 说明 |
|---|---|---|---|
| Embedding(初始 + 更新) | 把你的文档变成向量,使其可被检索 | ~$0 到 $30 | 一次性批量 embedding 很便宜。OpenAI text-embedding-3-small 约为每 1M token $0.02,大模型约 $0.13。一个中等规模的语料库做一次 embedding 只要个位数美元,之后每天的增量近乎为零。 |
| 向量数据库 | 存储并检索这些向量 | ~$0 到 $150+ | 免费档够做原型。托管的生产档(Pinecone、Qdrant Cloud、Weaviate Cloud)在中等规模下常从约 $50 到 $150/月起;在你自己的 VM 上自托管 Qdrant 可以更便宜,代价是运维。 |
| LLM 回答 token | 根据检索到的上下文写出每个回答的模型 | ~$20 到几百 | 可变的那一项。由每天查询数乘上下文大小乘模型单价决定。中端模型加上精简的上下文能把它压小;把每个查询都路由到带臃肿上下文的 frontier 模型,就是它爆炸的方式。 |
| 检索 + 编排 | 胶水层:查询处理、重排、权限过滤 | ~$0 到 $40 | 大多是你自己的算力。可选的重排器会增加少量每次查询的成本;带权限的检索增加的是延迟,不是太多花费。 |
| 托管 | 应用服务器、API 网关、日志、监控 | ~$20 到 $100 | 一个小容器加一个托管网关。在你扩大用户量之前,金额温和且平稳。 |
| 维护 | 保持其正确:连接器维护、评估运行、模型升级 | 真正的数字 | 这不是一条 SaaS 项。它是工程师时间,一年下来通常远超上面每一行。诚实的预算会在这里放一个经常性的数字。 |
注意这个规律。2026 年,基础设施那几行便宜得出人意料。决定这个项目值不值得的成本在最后一行,而它正是任何供应商报价都不包含的那一项。

"向量库和 token 是便宜的部分。贵的部分是那个在文档变化之后还把回答保持正确的工程师。把这一项预算进去,否则项目会烂掉。"
自建还是购买:到底哪个更便宜?
那些打包好的“覆盖你知识库的 AI”产品会报一个按席位的价格,往往落在一个付费生产力席位的区间里。这干净、可预测,对一个文档很通用的小团队来说,可能就是对的选择。代价出现在两处:不管一个用户一个月查一次还是一天查五十次,你都按席位付费;而你的数据路由和检索逻辑,是供应商替你定的。
自管 setup 把这个关系反过来。每次查询的成本很低,你只为实际运行的部分付费,但你要扛起搭建和维护。盈亏平衡点不只看席位数,而是看控制权。一旦你需要镜像你 SharePoint 和 Confluence 访问规则的带权限检索,或者数据不能离开你的基础设施,现成的按席位价格就不再是故事的全部了。我们在如何在内部铺开 AI 而不造出没人用的摆设里更深入地谈了这个铺开决策。
DACH 数据驻留在哪里会增加成本?
对一家 DACH 公司来说,问题很少是能力,几乎总是数据去了哪里。在 GDPR 和 EU AI Act 之下,个人数据、客户记录和内部文档通常不能发往一个在欧盟之外处理的模型端点。这个约束会在几个具体的地方增加成本,只要你提前规划,没有一处是致命的:
- 欧盟区域的模型端点。主流供应商提供欧盟数据驻留选项(例如位于 Sweden Central 或 Germany West Central 的 Azure OpenAI Data Zone 部署)。处理成本大体与标准价相当;在适用加价的地方,欧盟区域的加价通常是温和的,而不是翻几倍。
- 托管在欧盟的向量库和应用。把向量数据库和应用服务器固定到一个欧盟区域,是个配置选择,不是一个价格档。它主要是把最便宜的全球选项从桌面上拿走,从而把托管成本稍微推高一点。
- 合规工作本身。真正的驻留成本是这套审查:数据处理协议、处理活动记录,以及确认没有任何来自欧盟之外的维护访问能触及数据。这是一次性投入加上一笔较小的经常性复核,而在设计阶段做远比事后改造便宜。
从一开始就做,驻留是个几乎不动每席位数字的设计选择。事后才加,它是一次重建,那是昂贵的版本。
按席位按月到底多少钱,来算一个例子?
仅供示意。你的数字会有出入,在你相信它之前应当重新核对当前价格。重点是账单的形状,不是确切的数字。
假设一家 DACH 公司有 50 个活跃用户,每人每天大约 10 次查询(每月约 11,000 次查询),语料库为几十万个文档片段,由一个欧盟区域的中端模型以精简检索(每个回答取少量片段)作答,每晚重新索引,并使用一个托管向量库。
| 项 | 方向性月成本 |
|---|---|
| Embedding(一次性批量 embedding 之后的每晚增量) | ~$5 到 $20 |
| 托管向量库(生产档,欧盟区域) | ~$50 到 $150 |
| LLM 回答 token(中端模型,精简上下文) | ~$60 到 $250 |
| 托管、网关、监控 | ~$30 到 $100 |
| 基础设施小计 | ~$150 到 $520 / 月 |
| 分摊到 50 个席位 | ~$3 到 $10 每席位 / 月 |
| 维护(工程师时间,摊销后) | 一年里占主导的那一项 |
所以一个 50 席位内部助手的运行基础设施,常常落在每席位个位数欧元的区间。这个数字会让那些原本预期四位数月账单的人吃一惊。代价在我们留到最后的那一行:维护是把一个看起来便宜的 setup 变成真实年度成本的东西,也是决定这个助手是否还可信的东西。
怎样在不让它烂掉的前提下保持便宜?
让生产级 AI 构建保持可负担的那套纪律,在这里同样适用。成本杠杆,按它们见效的顺序:
- 路由到最便宜的够用模型。大多数内部问题用不上你最贵的模型。把 frontier 模型留给困难的少数,每次查询的成本就会大幅下降。
- 检索得更少、更精准。最大的单项 token 浪费,就是往每个回答里塞太多片段。好的检索加上一个重排器,给模型发去几段相关片段,而不是十页。这是对 LLM 那一行影响最大的杠杆。
- 缓存重复项。内部团队问同样的那几个问题,远比面向客户的用户频繁,这让缓存格外有效。更深入的 token 机制见如何在 2026 年降低 LLM token 成本。
- 按计划重新索引,而不是每次敲键。每晚或接近实时的同步,对大多数内部知识已经足够,并能把 embedding 开销压到接近零。
有一条任何成本表都捕捉不到的谦逊提醒:一个悄悄给出错误答案的便宜助手,是所有结果里最贵的。你需要一个评估集,一种在文档变化之后衡量回答质量的方法,以及一个以盯着它为本职的人。那条维护项不是可有可无的填充。它是“团队信任的工具”和“团队不再打开的工具”之间的分界。我们在像 Twinsoft AI 这样的生产 AI 工作中看到了同样的纪律见效,正是那个评估框架让成本优化变得安全。
最终思考
关于 2026 年 DACH 地区的内部 AI 助手要花多少钱,诚实的答案是:运行的基础设施比大多数管理者预期的更便宜,在中等规模下常常是每席位每月个位数欧元,因为 embedding、向量存储和 token 的价格都塌了。真正决定项目的成本是维护,也就是在文档变化时把回答保持正确的工程师时间,而这一行在一年里会盖过基础设施。
对一家 DACH 公司而言,数据驻留若从一开始就设计进去,只增加温和的成本;若事后才硬加上去,就是一次昂贵的重建。先把你的三个假设写到纸上,席位、每天的查询数,以及每个回答需要多少上下文,然后路由到最便宜的够用模型、精准检索,并诚实地为维护做预算。一个你团队拥有的可信助手,远比一个悄悄漂移的便宜助手更有价值。
想要一份贴合你基础设施的算账方案?
预约免费咨询