Kevin Riedl

11 min 阅读 · 21 Jun 2026

2026 年 AI 应用的欧盟数据驻留:OpenAI、Azure OpenAI、Mistral、Hetzner 还是自托管?

如果你在欧洲构建 AI 应用并且需要把数据留在欧盟,2026 年现实可行的选项有:带欧盟数据驻留的 OpenAI API(需经销售开通,静态存储位于欧洲经济区)、采用 EU Data Zone 部署的 Azure OpenAI(在超大规模云厂商中文档最完善的区域内处理保证)、Mistral(欧盟总部,默认欧盟)、带欧盟跨区推理配置的 AWS Bedrock,或者在德国或芬兰的 Hetzner GPU 上 自托管开放权重模型。只有 Mistral 和 Hetzner 完全脱离美国司法管辖。几乎每个人都会踩的陷阱是:"欧盟数据驻留"通常指数据在欧盟的静态存储,而不是模型在欧盟运行。这是两项独立的保证。要明确地同时索取这两项。

这是工程视角,不是销售说辞,而且保质期很短。驻留方案在 2025 与 2026 年间变动很大。下文每一项断言都标注为 2026 年中;在签署任何合同或确定架构之前,请重新核对所链接的厂商页面。

需要帮助挑选并搭建一套符合欧盟要求的 AI 技术栈吗?

 预约免费咨询

先把术语理清

欧盟 AI 采购中的大部分混乱,都源于把含义不同的术语搞混。在比较任何东西之前,先把这些钉死。

  • 数据驻留是一项位置主张:数据物理上位于何处。它是一种惯例,并非 GDPR 中定义的术语。
  • 数据主权是一项司法管辖主张:哪国法律管辖这些数据。位于美资云上的欧盟数据可以驻留在欧盟,却仍可依据美国 CLOUD Act 被触及。这里的法律依据是 GDPR 第五章关于数据传输的规定,而不是"驻留"这个词。
  • 静态存储是你的数据被持久化保存之处。处理或推理则是 GPU 实际执行调用之处。依据 GDPR 第 4 条第 2 款,"处理"明确同时包括存储和使用数据,因此即使存储留在欧盟,在非欧盟区域发生的一次推理调用本身就是一次处理行为。
  • 零数据保留(ZDR)意味着厂商完全不持久化你的请求或响应。"不拿你的数据训练"只意味着他们不会用它来训练;至于是否记录或存储,则只字未提。这二者相互独立。厂商可以拒绝用你的数据训练,同时仍为滥用监控保留它 30 天。

需要记住的一句话:欧盟数据驻留几乎总是指数据在欧盟的静态存储。区域内处理是一项独立、更狭义且往往更新的保证。切勿假定驻留就等于仅在欧盟推理。

一览对比

主要选项在真正决定一桩采购的各个维度上如何排布。所有条目均为 2026 年中,应逐厂商重新核实。

维度OpenAI APIAzure OpenAIMistralAWS BedrockHetzner(自托管)
欧盟静态存储是(按项目,需经销售)是(客户所在地)是,默认是(你调用的区域)是(由你掌控)
欧盟区域内处理独立附加项;需确认范围是,通过 EU Data Zone默认欧盟;可能存在传输是,通过欧盟推理配置是,完全
默认不训练是(自 2023 年起)付费:是。免费:否不适用(归你所有)
零数据保留需审批开通通过修改后的滥用监控Scale 套餐,需申请是(模式:none),常需开通天然具备
自助注册否(销售)
美国 CLOUD Act 风险敞口是(美国公司)是(美国公司)否(欧盟公司)是(美国公司)否(德/芬公司)
运维负担低到中
前沿模型质量最高最高强(欧盟)目录广泛开放权重的上限

只有 Mistral 和 Hetzner 总部在欧盟,因此处于美国 CLOUD Act 触及范围之外,而该法即便对驻留欧盟的数据也适用于那些超大规模云厂商。对于美国厂商,客户自管加密密钥是常见的补充措施,并非根治之法。

OpenAI API

OpenAI 提供按项目配置的数据驻留,区域中包括欧洲(欧洲经济区与瑞士),覆盖 API 平台与 ChatGPT Enterprise。它经由销售开通,而非自助,通常在新项目上设置。重要的细微之处在于:默认保证是所选区域内的静态存储。区域内推理是另一回事,所以如果你需要原始 API 的模型本身也在欧盟运行,请向其销售团队明确确认,而不要想当然。自 2023 年 3 月起,除非你主动选择加入,发送至 API 的数据不会被用于训练 OpenAI 模型;ZDR 可用但需审批,它会去除约 30 天的滥用监控保留期。请注意 2026 年针对较新模型的数据驻留端点的提价。

Azure OpenAI

在超大规模云厂商中,Azure 给出了最清晰的区域内处理说法,因为部署类型决定推理在何处运行。Global 部署可能在全球任意 Azure 区域处理。Data Zone 部署只在指定区内处理,而 EU Data Zone 将处理限定在 EU Data Boundary 内。区域部署则留在部署所在区域。静态存储在以上所有情形下都保持在你所选的地理范围内。两个值得点名的陷阱:除非你选择 Data Zone 的 Batch 变体,否则 Batch 作业默认走 Global 处理;而 EU Data Zone(涵盖若干区域的处理范围)与更广义的 EU Data Boundary 驻留承诺并不相同。面向欧洲经济区部署的人工审核员位于欧洲经济区,这是一个实打实的卖点。Azure OpenAI 不会调用 OpenAI 自己的服务,也不会把你的数据分享给模型提供方。

Mistral

Mistral 总部在欧盟,并声明默认情况下你的数据托管在欧盟;使用美国端点是一项明确的选择加入。有两点要弄对。第一,官方措辞是"欧盟",而非某个具体国家,所以不要写它"托管在瑞典",因为瑞典那处设施是未来的推理中心,而非当下 La Plateforme 数据所在之处。第二,训练默认值因套餐而异:付费套餐和 Scale 套餐默认退出训练,而免费层级则默认加入,除非你去更改。ZDR 在 Scale 套餐上针对无状态调用提供,需申请开通。为获得最大掌控,Mistral 还提供自托管和专用 VPC 部署,其开放权重模型可自行部署。一点需注意:在 Bedrock 或 Azure 等云市场上,驻留随你所选的云区域而定,而非随 Mistral 的欧盟默认值。

Hetzner 与自托管

Hetzner 是通用托管,而非托管式 LLM API,所以你要自带模型和推理栈。你得到的是对存储与处理的完全掌控,全程在欧盟境内,依据第 28 条数据处理协议,且不涉及任何第三方模型提供方。其自有的欧盟数据中心位于德国(纽伦堡、法尔肯施泰因)和芬兰(赫尔辛基),并提供单 GPU 独立服务器:粗略地说,一张约 20 GB 的卡用于较小模型的推理,一张 96 GB 的卡用于训练或运行量化后的 70B 模型。这些园区通过 ISO 27001 认证。这份掌控的代价是实打实的:容量规划、量化选择、批处理、自动扩缩、可用性、补丁修复和监控现在都归你负责。

如果你完全基于开放权重自托管,要留意许可证。Mistral 的大多数开放模型采用 Apache 2.0,限制最少。Llama 并非 OSI 开源;其社区许可证带有一条宽泛的月活跃用户条款和一项署名要求,欧盟团队在依赖多模态变体之前,应当仔细核查现行的可接受使用政策。Qwen 的许可证因模型而异。自托管的胜场在于掌控,而非低用量下的成本或质量,因为那时一块专用 GPU 处于闲置。

决策树

选择第一个契合你硬性约束的分支,而非你偏好的那个。

  1. 任何美国实体都绝不能有能力访问这些数据。在 Hetzner 上自托管开放权重,或以自托管或本地部署方式运行 Mistral。这是仅有的处于欧盟司法管辖下的选项。
  2. 你需要欧盟驻留、低运维和前沿质量,并且在有数据处理协议与标准合同条款的前提下,可接受由美国公司处理。采用 EU Data Zone 部署的 Azure OpenAI,或者在与销售确认推理驻留范围之后采用 OpenAI API 的欧盟驻留。
  3. 你想要一套总部在欧盟、投入最少的托管式 API。使用付费套餐或 Scale 套餐的 Mistral,默认关闭训练,必要时加上 ZDR。
  4. 你已经在 AWS 上落地,想要把推理限定在欧盟。使用带欧盟跨区推理配置的 Bedrock,并在需要时加上零数据保留。
  5. 你有持续的高用量和内部 MLOps,想要把一切掌握在手里。在 Hetzner 上自托管开放权重,按模型规格配置,并遵循上述许可证注意事项。
Kevin Riedl

"合同上的欧盟数据驻留通常意味着你的数据存储在欧盟。它并不意味着模型在欧盟运行。这是两个不同的承诺,而多数团队只索取了前一个。"

驻留在大局中的位置

驻留只是构建一套站得住脚的欧盟 AI 系统的其中一项输入,而非全部答案。更棘手的问题往往是检索质量、按用户的权限、评测和成本,我们在面向欧盟的 RAG 生产就绪清单中加以讨论。而驻留处在一个更广的合规栈之中,涉及 RAG 数据流、GDPR 和《AI 法案》,我们在GDPR 与《AI 法案》如何为 DACH 地区 SaaS 叠加中加以厘清。要趁早把驻留模型搞对,因为在上线之后再去改造数据所在位置,是你可能做的代价最高的事情之一。

常见问题

欧盟数据驻留是否意味着我的提示词在欧盟处理?
不一定。它通常保证的是在欧盟的静态存储。区域内处理是一项独立的保证,每家厂商的叫法各不相同,所以要单独确认处理位置,而不要假定驻留已经把它涵盖在内。
"不拿我的数据训练"和零数据保留是一回事吗?
不是。"不训练"意味着你的数据不会被用于改进模型。零数据保留意味着它根本不会被存储。厂商可以做到前者,却仍为滥用监控保留你的数据约 30 天。
哪家厂商能免受美国 CLOUD Act 的影响?
只有总部在欧盟的厂商,实践中就是 Mistral 和 Hetzner。OpenAI、Azure 和 Bedrock 等美国厂商即便对驻留欧盟的数据,仍可依据美国法律被触及。客户自管加密密钥能减小但无法消除这一风险敞口。
Azure 里的 EU Data Zone 是什么?
一种把推理限定在 EU Data Boundary 内的部署类型。它有别于更广义的 EU Data Boundary 驻留承诺,且区内区域的确切清单会随时间变化,所以请查阅微软的最新文档。
Azure Batch 会留在欧盟吗?
只有当你使用 Data Zone 的 Batch 变体时才会。普通 Batch 默认走 Global 处理,可能在全球任意 Azure 区域运行。
Mistral 托管在瑞典吗?
不是。官方措辞默认是"欧盟",如今主要是法国和欧盟分包处理方。瑞典那处场地是未来的推理数据中心,而非当下 La Plateforme 数据所在之处。
我能在自助套餐上获得 OpenAI 的欧盟驻留吗?
不能。它需经销售开通,并按项目配置,通常在新项目上设置。此外,2026 年针对较新模型的数据驻留端点有提价。
在 Hetzner 上自托管究竟何时才真正值得?
当你需要在欧盟对存储和处理的完全掌控、且不涉及任何第三方厂商时,或者当你有持续的高用量和内部 MLOps 时。它的胜场在于掌控,而非低用量下的成本或质量,因为那时 GPU 处于闲置。
哪种开放权重模型最适合欧盟商业自托管?
Mistral 的 Apache-2.0 模型限制最少。Llama 带有一条宽泛的月活跃用户条款,外加署名要求和一项需核查的欧盟可接受使用注意事项,而 Qwen 的许可证则因模型而异。在做出承诺前,请阅读每张模型卡。
这些情况多久会变一次?
经常变。驻留方案在 2025 与 2026 年间一直在变动。请把这里的每一项断言都当作 2026 年中的情况,并在做出合同或架构承诺之前重新核实厂商页面。

最终思考

欧盟数据驻留不是一个开关。它是一组相互独立的承诺:存储位置、处理位置、保留、训练和司法管辖。代价最大的错误,是把合同上的"欧盟数据驻留"当作涵盖了这整组承诺,而它通常只指静态存储。

按约束的硬性程度排序,决定你究竟需要其中哪些承诺。如果任何美国实体都绝不能触及这些数据,你就是在 Mistral 和在欧盟基础设施上自托管之间做选择。如果合同性保障可以接受,那么 Azure 的 EU Data Zone 和 OpenAI 的欧盟驻留就是低运维的前沿选项。然后在每一项断言旁写上日期,因为等你读到它时,这一切又已经变了。

在签约之前,想就你的欧盟 AI 架构听听第二意见吗?

 预约免费咨询
Kevin Riedl

11 min 阅读 · 21 Jun 2026