2026 年 LLM 网关对比：LiteLLM vs OpenRouter vs Portkey vs RouteLLM

大多数团队把产品直接接到某一家供应商的 SDK 上。一开始没问题，直到出问题。供应商一宕机，你的应用跟着倒下。然后财务来问，为什么一个失控的任务一个下午就烧掉了一个月的预算。然后出了一个新模型，对你一半的流量来说更便宜也更好，可换过去意味着要动每一处调用点。于是团队开始往上拧重试、花费上限、第二家供应商、一个缓存，一个季度下来，就在自己的代码里草草搭出了半层 agent 基础设施，没有人真正负责它。

这层缺失的东西有个名字：LLM 网关。一个端点摆在多家供应商前面，把回退、缓存、花费上限和路由都收在一处。这是工程视角，不是供应商推销。下面的功能与价格信息是方向性的，时间为 2026 年 6 月，取自各工具的公开文档与官网，投入前请重新核对。参考点来自 Wavect 在 AI 产品上的工作，我们把网关放在了生产流量前面，也和它的取舍一起过了日子。

把 AI 产品接到了单一供应商上？

预约免费咨询

LLM 网关到底做什么？

网关是一个代理，坐在你的应用和模型供应商之间。你的代码调用一个端点，通常是 OpenAI 的请求格式，网关把这个调用翻译并转发给应该来处理它的供应商。这一道接缝，正是你拿到那些本来要手搓的功能的地方：

一个端点覆盖多家供应商。把 Claude 换成 GPT、换成 Gemini、换成开源权重模型，只要改一个配置值，而不是改一处调用点。供应商 SDK 的锁定消失了。
回退。当一家供应商返回错误或超时，网关会向另一个模型或另一家供应商重试，这样单点宕机不会把你的产品一起拖下水。
缓存。相同或语义相似的请求可以返回一份已存的响应，完全跳过模型调用，在重复流量上同时省成本和延迟。
花费上限与 key。按 key、按用户、按团队设预算和速率限制，这样一个坏循环不能掏空账户，你也能给每个团队发一个受限的虚拟 key。
路由。把简单的大多数发给便宜模型，把困难的少数发给 frontier 模型，可以按规则，也可以按学习出来的策略。
可观测性。一处就能看到每个请求的成本、延迟和 token，按模型、key 和功能拆开。

路由是多数人冲着来的那个成本杠杆，它的经济账我们在如何在 2026 年降低 LLM token 成本里讲过。这篇文章讲的是给你这个杠杆、外加这一整层其余部分的那些工具。

LiteLLM、OpenRouter、Portkey 和 RouteLLM 有什么区别？

这四个名字常被一起提起，但它们不是同一类东西。两个是完整网关，一个是托管聚合器，一个是路由研究框架。下面是每一个的轮廓，能力已在 2026 年 6 月对照各工具自己的文档核实。请当作快照，投入前重新核对。

工具	类型	托管方式	路由 / 回退	缓存	可观测性	最适合
LiteLLM	开源代理（OSS + 付费企业版）	自托管（或托管版）	有，跨 100+ 供应商的负载均衡与回退	有，含基于 Redis	日志、花费跟踪、集成（Langfuse、OTel）	想在自己基础设施上拥有完全控制的团队
OpenRouter	托管聚合器 / 市场	由其代为运行（SaaS）	有，供应商故障转移	透传供应商侧 prompt 缓存	仪表盘与用量分析	用一个 key 快速接入 300+ 模型
Portkey	网关 + 可观测性 + 护栏（OSS 核心 + 云）	核心自托管，或云；企业版可气隙部署	有，跨 1,600+ 模型的路由、回退、重试	有	深，日志、追踪、分析、50+ 护栏	想要内建护栏与可观测性的生产团队
RouteLLM	开源路由框架（研究）	自托管，由你嵌入	只做路由决策，不是完整网关	无	无	在自己的栈里构建成本-质量路由器

LiteLLM 是开源主力：一个你自己部署的代理，把 100+ 供应商归一到一个 OpenAI 格式的端点后面，并把虚拟 key、预算、速率限制、回退和日志集中在一个你在自己 repo 里版本化的配置文件里。OpenRouter 是托管聚合器：一个 key、数百个模型、由其代为运行，带一个市场模式，让你在新模型上线当天就能用上，而不用在每家供应商都开账户。Portkey 是一个以可观测性和护栏为主打的网关；它在 2026 年把核心网关开源，同时也卖云版。RouteLLM 是另一类：来自 LMSYS 和伯克利的研究框架，用来训练和服务路由决策本身，而不是围绕它的网关。

"这四个里三个是网关，一个是路由器。拿 RouteLLM 和 LiteLLM 比，就是拿大脑和身体比。多数团队两者都需要，而多数团队先去拿身体。"

自托管还是托管：你该选哪个？

这是第一个真正的决定，通常它就决定了工具。取舍是控制权和数据驻留，对上运维负担。

托管（OpenRouter、Portkey 云）。一个下午就拿到这层，没有基础设施要运维。代价是一个你控制不了的依赖，而在 OpenRouter，是数据经由第三方流转，欧盟团队得对照自己的数据驻留立场来权衡。OpenRouter 的目录价大体与各供应商公布的价格一致，但要查平台和信用卡手续费，小额充值时它们可能加上可观的百分比，还有每月请求量超过某个门槛后的 BYOK 费用。做预算前请重新核实当前费用。
自托管（LiteLLM、Portkey 核心、RouteLLM）。你在自己的基础设施上运行代理，所以数据路径和升级节奏都归你。LiteLLM 作为开源免费，没有用量费，但你要运维代理外加它的 Postgres 和 Redis，那份运维时间才是真正的成本。对一个有 DevOps 能力、又有合规要求的团队，这通常是对的选择。对一个赶时间的两人产品团队，这是它还不需要的额外开销。

诚实的默认：先用托管来证明这层值得它的位置，等数据驻留、规模上的成本或控制权逼出这个问题时，再转到自托管。这呼应了我们在 AI 产品项目中一以贯之的自建对外购逻辑，包括像 Twinsoft AI 这样的工作。

成本跟踪和可观测性做得怎么样？

财务为什么这么晚才注意到账单，是因为供应商的 SDK 几乎不给你按功能或团队看花费的视角。网关就是这个视角所在的地方，而这四个工具深浅各异。

LiteLLM 按 key、用户和团队跟踪花费，强制预算和速率限制，并把日志送往 Langfuse 和 OpenTelemetry 这类工具。它很扎实，而且因为是你的部署，数据留在你手里。
Portkey 以可观测性为主打。日志、追踪和分析就是产品本身，它按记录的日志而非原始请求计费，所以价格跟着你观测多少走。如果你想开箱即用的仪表盘、护栏和审计轨迹，它是四个里最深的。
OpenRouter 给你一个用量仪表盘和你所调用模型的分析，对很多团队够用，而且零配置。
RouteLLM 这些都不给你。它是路由决策，不是围绕它的平台，所以可观测性是你自己在外面包出来的东西。

我们总会补一句提醒：花费仪表盘告诉你付了多少，不告诉你质量有没有守住。一个悄悄把更难的查询发给更便宜模型的路由器，在成本图上看着像赢，在生产里却是输。你需要在网关旁边放一个评估框架来抓住这点，而没有哪个网关自带它。这份纪律在你身上。

RouteLLM 放在哪里合适，那些数字是真的吗？

RouteLLM 是这四个里唯一纯粹围绕路由决策的：给定一个查询，把它发给强模型还是便宜模型。公布的数字确实亮眼，值得谨慎引用。LMSYS 和伯克利团队报告，在用了增强训练数据后，他们的矩阵分解路由器只把 14% 的调用发给强模型，就达到约 95% 的 GPT-4 性能，他们把这折算成比随机基线便宜约 75%，在 MT Bench 评测上降本超过 85%。

请把这些数字当作方向性的，并按来源的口径来读：它们来自 RouteLLM 的原始论文，在特定数据集（MT Bench、MMLU、GSM8K）上、对照一个 GPT-4 级强模型测得，2024 年发表，并在 ICLR 2025 上展示。你的流量不是这些基准，所以在你工作负载上的节省会有出入。诚实的要点是那个形态，而不是确切的百分比：一个学习出来的路由器能守住大部分质量，只把少数调用发给昂贵模型。在信任它之前，你仍然得在自己的评估上把它证明一遍。

在实践中，你不会用 RouteLLM 来取代网关。你可以让 RouteLLM 当路由大脑，在外面包一个网关来做回退、key、缓存和可观测性；或者你用网关自带的更简单的路由规则，省掉这个框架。当路由是你最大的单一成本杠杆、而基于规则的路由正把节省留在桌上时，RouteLLM 才挣到它的位置。

你该怎么选？

把工具映射到真正约束你的那条限制上，而不是最长的功能清单：

今天就要，没有基础设施可运维。选托管方案。要模型广度、一个 key 就够，选 OpenRouter；如果还想从第一天起就有可观测性和护栏，选 Portkey 云。
数据驻留或完全控制要紧。自托管。想要一个轻量、被广泛使用的开源代理，选 LiteLLM；如果可观测性和护栏是头等要求，选 Portkey 的开源核心。
可观测性和护栏是优先项。Portkey 是围着它们建的。其他几个会记日志；Portkey 把日志做成了产品。
路由是你最大的成本杠杆。把 RouteLLM 作为路由大脑放进你选定的网关里，并在自己的评估上证明节省。
你拿不准。先用一个托管网关，给它装上仪表，让两周真实的按功能花费数据告诉你该优化什么。数据回答这个问题，比对比表更快。

只要你让应用始终说 OpenAI 的请求格式，这些里没有哪个是永久承诺。这正是整个模式安静的好处：网关是你能换掉的那个，恰恰因为它把你代码所依赖的那道接缝标准化了。

最终思考

LLM 网关是大多数团队在意识到它有名字之前，就草草重建过的那一层。早早放进去，你就在一处、在一个端点后面拿到回退、缓存、花费上限、路由和可观测性，而你的代码可以继续调用这个端点，同时你换掉它背后的东西。

这四个工具不能互换。LiteLLM 是自托管的开源主力。OpenRouter 是通往众多模型最快的托管路径。Portkey 以可观测性和护栏为主打，既给你开源也给你云。RouteLLM 是路由大脑，不是网关，数字亮眼但与基准绑定，你必须在自己的流量上重新证明。按约束你的那条限制来选，先定托管还是自托管，再装上仪表，让你自己的花费和评估数据，而不是某家供应商的图表，来决定下一步优化什么。

想要对你的 AI 基础设施层来个第二意见？