OrcaRouter —— 一个 AI 网关：自适应 LLM 路由与治理

面向生产的 AI 网关

每一次请求都用对模型、扛得住故障——智能路由加自动容灾。

路由更准，数据可证。

每条提示词都会被向量化，并由一个持续从真实流量在线学习的模型完成路由。在公开的 RouterArena 排行榜（Jun 2026）上，它以 75.5% 的准确率领跑——领先于 GPT-5、Azure、Martian 和 NotDiamond。

contextual embeddingsonline learning<1ms overheadRouterArena

* 基于 RouterArena 排行榜数据，2026 年 6 月。

某家厂商挂了。没人察觉。

当某个厂商限流或返回 5xx 时，OrcaRouter 会在响应开始前将请求重试到 200+ 个可用模型中的健康模型——让上游的临时故障不波及你的用户。

200+ modelsauto-failoverno 429

路由由你做主。

orcarouter/auto 是智能默认值，而非黑盒。每个工作区都可以指定你想要的目标——在达到质量标准前提下选最便宜的模型、选质量最高的模型，或在两者间取得平衡——也可以让它从你自己的流量中学习如何权衡。你绝不会被锁定在单一策略上。

per-workspaceno markup either way<1ms overhead

每一笔花费、每一次调用都看得清、可举证。

看清一切。凡事可查证。

清楚看到每个请求的成本、由哪个模型处理、耗时多久、以及为何失败——完整的结构化日志，可供你筛选、重放，并复制为可直接运行的 cURL。路由绝不是黑盒。

Per-request logsgrade · model · costcopy-as-cURL

零加价。零黑箱。

你按每个厂商的确切价格付费——我们每个 Token 加价 $0，永远如此。每个请求都会显示评级、所选模型、厂商、延迟和价格，因此成本完全透明可查，而非不透明的混合费率。

$0 / tokenprovider costglass-box receipt

改提示词、开缓存，不发版即刻生效。

改提示词，不改代码。

在命名标签背后对提示词进行版本管理，支持 A/B 分流和一键回滚。移动一个标签，每个请求都会立即采用它——无需重新部署、无需改代码、无需更新客户端。

VersionedA/BInstant rollbackNo deploy

付费一次。复用免费。

重复和已缓存的提示词 Token 会按厂商的缓存费率计费——通常只是输入价格的一小部分——覆盖 5 分钟和 1 小时的临时窗口。同样的答案，更少的花费，每张账单上都带有 cached_tokens。

cache_controlcached_tokens5m / 1h windows

安全护栏、预算、智能体防火墙强制生效，风险始终可控。

真能拦下东西的安全护栏。

PII Shield 和内容策略会在上游调用计费之前运行。被拦截的请求会返回干净的 400，并且永不计费——安全护栏在请求过程中内联执行，而非事后记录。

PII Shieldenforced pre-billingclean 400

对你的团队安全。对你的智能体也安全。

为人员设定预算和角色；为智能体提供基于风险评分的防火墙。每一次工具调用和 MCP 调用在执行前都会被评级为 ALLOW、REVIEW 或 BLOCK，异常检测则会对照学习到的一周内各时段的历史基线，标记速率和成本的激增。

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection

为智能体时代而生。在你需要之前，就已就位。

完全掌控

需要的不止一种模式？那就写规则。

当默认策略不够用时，用代码来表达路由——可版本管理、可评审，几秒即可生效。无需重新部署，也无需改动客户端。

routing.yaml

version: 1
rules:
  - id: hard_agent_task
    when: task_class == "agent" && difficulty >= 0.6
    use:
      model: "claude-opus-4-7"
      reasoning_effort: high   # spend where it matters
  - id: short_prompts
    when: request.input_tokens < 500
    use: { delegate: cheapest }
default:
  delegate: balanced   # fall back to the chosen mode

YAML + CELversion-controlledlive in seconds

查看路由文档

接入

60 秒上线。

改一个 URL。你现有的 SDK、模型名、流式都照常工作。

步骤 1

🔗

把 SDK 指向我们

把 base_url 改成 api.orcarouter.ai/v1，换上 API 密钥。其他代码不用改。

→

步骤 2

⚡

我们负责路由、安全护栏与观测

每次调用都会被路由到最佳模型、按你的安全护栏校验并计量——打分在 <1ms 内完成，内置故障转移、缓存与完整日志。

→

步骤 3

✓

你只需在一个端点上线

流量按官方公开价直连各家厂商的一方 API——我们每 Token 加价 $0。一个兼容 OpenAI 的端点，搞定路由、可观测性与治理。

所有模型。一张价目表。

200+ 模型实时并排比价——就是你直接付给厂商的价。我们额外加价 $0。

查看全部 200+ 模型 →

模型	路由到	输入 /M	输出 /M	上下文	质量
obsidian/gemma-4-26B-A4B新	—	$0.250	$2.90	262K	4.0
obsidian/Qwen3.6-35B-A3B新	—	$0.310	$4.21	262K	4.0
anthropic/claude-sonnet-5新	Anthropic Direct	$2.00	$10.00	1M	9.0
kling/kling-3-turbo新	—	$0.112 /call	—	—	—
z-ai/glm-5.2新	Zhipu AI	$1.40	$4.40	1M	9.0
kimi/kimi-k2.7-code新	Moonshot	$0.950	$4.00	262K	8.0
anthropic/claude-fable-5新	Anthropic Direct	$10.00	$50.00	1M	10.0
qwen/qwen3.7-plus	Alibaba Cloud	$0.350	$1.42	1M	8.0
minimax/minimax-m3	—	$0.300	$1.20	1M	9.0
anthropic/claude-opus-4.8	Anthropic Direct	$5.00	$25.00	1M	10.0
google/gemini-3.5-flash	Google Direct	$1.50	$9.00	1M	9.0
qwen/qwen3.7-max	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.7-max-2026-05-20	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.6-flash	Alibaba Cloud	$0.250	$1.50	1M	7.0
qwen/qwen3.6-35b-a3b	Alibaba Cloud	$0.248	$1.48	262K	8.0
+ 还有 194 个模型 · 价格每 60 秒更新

你的 OpenAI 客户端调用的一切，全都支持。

流式、工具调用、结构化输出、视觉、嵌入与音频——原样路由到每一个模型。

模型	流式	工具	结构化	视觉	嵌入	音频
openai/gpt-5.5-pro	支持	支持	支持	支持	不支持	不支持
anthropic/claude-opus-4.7	支持	支持	支持	支持	不支持	不支持
google/gemini-3.1-pro-preview	支持	支持	支持	支持	不支持	支持
anthropic/claude-fable-5	支持	支持	支持	支持	不支持	不支持
grok/grok-4.3	支持	支持	支持	支持	不支持	不支持

价格

路由免费。
为功能付费。

你的 Token 花费，我们一分不抽——平台只靠可选的团队版功能盈利，始终与你的用量利益一致。

零加价保证

你按厂商公开价格直接支付给他们。我们不在 Token 成本上加任何费用。路由免费；可选的 Team 计划支撑平台运转。

$0.00路由费

Hacker

免费

永久免费。所有 Token 零加价。

✓ 路由——200+ 模型，自动故障转移

✓ 观测——基础仪表盘

✓ 管理——提示词版本化

✓ 3 个 API 密钥 · 0% Token 加价

免费开始

团队版

$499/mo

仍然零加价。为功能付费。

✓ 包含 Hacker 全部功能

✓ 最多 10 个团队席位

✓ 合规强制执行与报告

✓ 无限 API 密钥

✓ 优先支持

开始使用 →

企业版

定制

99.99% SLA、私有部署，企业级保障到位。

✓ 包含 Team 全部功能

✓ 私有化 / 本地部署

✓ 99.99% 可用性 SLA

✓ 专属基础设施

✓ 专属支持与定制定价

一个网关，接入所有大模型。智能路由 · 安全上线 · 降本增效

沿用现有工具链，零迁移成本。

路由更准，数据可证。

某家厂商挂了。没人察觉。

路由由你做主。

看清一切。凡事可查证。

零加价。零黑箱。

改提示词，不改代码。

付费一次。复用免费。

真能拦下东西的安全护栏。

对你的团队安全。对你的智能体也安全。

需要的不止一种模式？那就写规则。

60 秒上线。

把 SDK 指向我们

我们负责路由、安全护栏与观测

你只需在一个端点上线

所有模型。一张价目表。

你的 OpenAI 客户端调用的一切，全都支持。

路由免费。
为功能付费。

Hacker

团队版

企业版

独立审计认证，持续保持合规。

更聪明、更安全、更省钱。

产品

资源

法律

关注

一个网关，接入所有大模型。 智能路由 · 安全上线 · 降本增效

沿用现有工具链，零迁移成本。

路由更准，数据可证。

某家厂商挂了。没人察觉。

路由由你做主。

看清一切。凡事可查证。

零加价。零黑箱。

改提示词，不改代码。

付费一次。复用免费。

真能拦下东西的安全护栏。

对你的团队安全。对你的智能体也安全。

需要的不止一种模式？那就写规则。

60 秒上线。

把 SDK 指向我们

我们负责路由、安全护栏与观测

你只需在一个端点上线

所有模型。一张价目表。

你的 OpenAI 客户端调用的一切，全都支持。

路由免费。为功能付费。

Hacker

团队版

企业版

独立审计认证，持续保持合规。

更聪明、更安全、更省钱。

产品

资源

法律

关注

一个网关，接入所有大模型。智能路由 · 安全上线 · 降本增效

路由免费。
为功能付费。