零加价 · 更高可用性 · 更优价格

一个网关,接入所有大模型。 智能路由 · 安全上线 · 降本增效

把每一次调用都交给最合适的模型——质量对齐前沿大模型,成本最高省 40%。自适应路由、负载均衡、安全护栏、智能体防火墙、可观测性与治理一站到位,全部通过单一 OpenAI 兼容端点接入,不改代码、不被锁定。

无需信用卡 · 60 秒即可上线

在 RouterArena 上超越 GPT-5 与 Azure有已发表的研究支撑
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

只改一行代码,即可用上 200+ 模型——我们按难度自动选前沿或开源,平台不赚一分差价。

OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
200+
个模型,一个端点
0%
Token 加价,永不收取
75.5%
路由准确率
<50ms
流式中途故障转移
在用 OrcaRouter?聊聊吧。
你的反馈,决定下一次发布。
集成

沿用现有工具链,零迁移成本。

OpenAI 接口直接兼容;智能体可走 OrcaRouter MCP 服务器接入——你的 SDK、框架、编辑器一个都不用换。

OrcaRouter MCP 服务器OpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURL等更多
面向生产的 AI 网关

每一次请求都用对模型、扛得住故障——智能路由加自动容灾。

路由更准,数据可证。

每条提示词都会被向量化,并由一个持续从真实流量在线学习的模型完成路由。在公开的 RouterArena 排行榜(Jun 2026)上,它以 75.5% 的准确率领跑——领先于 GPT-5、Azure、Martian 和 NotDiamond。

contextual embeddingsonline learning<1ms overheadRouterArena
* 基于 RouterArena 排行榜数据,2026 年 6 月。

某家厂商挂了。没人察觉。

当某个厂商限流或返回 5xx 时,OrcaRouter 会在响应开始前将请求重试到 200+ 个可用模型中的健康模型——让上游的临时故障不波及你的用户。

200+ modelsauto-failoverno 429

路由由你做主。

orcarouter/auto 是智能默认值,而非黑盒。每个工作区都可以指定你想要的目标——在达到质量标准前提下选最便宜的模型、选质量最高的模型,或在两者间取得平衡——也可以让它从你自己的流量中学习如何权衡。你绝不会被锁定在单一策略上。

per-workspaceno markup either way<1ms overhead

每一笔花费、每一次调用都看得清、可举证。

看清一切。凡事可查证。

清楚看到每个请求的成本、由哪个模型处理、耗时多久、以及为何失败——完整的结构化日志,可供你筛选、重放,并复制为可直接运行的 cURL。路由绝不是黑盒。

Per-request logsgrade · model · costcopy-as-cURL

零加价。零黑箱。

你按每个厂商的确切价格付费——我们每个 Token 加价 $0,永远如此。每个请求都会显示评级、所选模型、厂商、延迟和价格,因此成本完全透明可查,而非不透明的混合费率。

$0 / tokenprovider costglass-box receipt

改提示词、开缓存,不发版即刻生效。

改提示词,不改代码。

在命名标签背后对提示词进行版本管理,支持 A/B 分流和一键回滚。移动一个标签,每个请求都会立即采用它——无需重新部署、无需改代码、无需更新客户端。

VersionedA/BInstant rollbackNo deploy

付费一次。复用免费。

重复和已缓存的提示词 Token 会按厂商的缓存费率计费——通常只是输入价格的一小部分——覆盖 5 分钟和 1 小时的临时窗口。同样的答案,更少的花费,每张账单上都带有 cached_tokens。

cache_controlcached_tokens5m / 1h windows

安全护栏、预算、智能体防火墙强制生效,风险始终可控。

真能拦下东西的安全护栏。

PII Shield 和内容策略会在上游调用计费之前运行。被拦截的请求会返回干净的 400,并且永不计费——安全护栏在请求过程中内联执行,而非事后记录。

PII Shieldenforced pre-billingclean 400

对你的团队安全。对你的智能体也安全。

为人员设定预算和角色;为智能体提供基于风险评分的防火墙。每一次工具调用和 MCP 调用在执行前都会被评级为 ALLOW、REVIEW 或 BLOCK,异常检测则会对照学习到的一周内各时段的历史基线,标记速率和成本的激增。

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
为智能体时代而生。在你需要之前,就已就位。

完全掌控

需要的不止一种模式?那就写规则。

当默认策略不够用时,用代码来表达路由——可版本管理、可评审,几秒即可生效。无需重新部署,也无需改动客户端。

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

接入

60 秒上线。

改一个 URL。你现有的 SDK、模型名、流式都照常工作。

步骤 1
🔗

把 SDK 指向我们

base_url 改成 api.orcarouter.ai/v1,换上 API 密钥。其他代码不用改。

步骤 2

我们负责路由、安全护栏与观测

每次调用都会被路由到最佳模型、按你的安全护栏校验并计量——打分在 <1ms 内完成,内置故障转移、缓存与完整日志。

步骤 3

你只需在一个端点上线

流量按官方公开价直连各家厂商的一方 API——我们每 Token 加价 $0。一个兼容 OpenAI 的端点,搞定路由、可观测性与治理。


所有模型。一张价目表。

200+ 模型实时并排比价——就是你直接付给厂商的价。我们额外加价 $0。

查看全部 200+ 模型 →
模型路由到输入 /M输出 /M上下文质量
obsidian/gemma-4-26B-A4B$0.250$2.90262K4.0
obsidian/Qwen3.6-35B-A3B$0.310$4.21262K4.0
anthropic/claude-sonnet-5Anthropic Direct$2.00$10.001M9.0
kling/kling-3-turbo$0.112 /call
z-ai/glm-5.2Zhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5Anthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ 还有 194 个模型 · 价格每 60 秒更新

你的 OpenAI 客户端调用的一切,全都支持。

流式、工具调用、结构化输出、视觉、嵌入与音频——原样路由到每一个模型。

模型流式工具结构化视觉嵌入音频
openai/gpt-5.5-pro支持支持支持支持不支持不支持
anthropic/claude-opus-4.7支持支持支持支持不支持不支持
google/gemini-3.1-pro-preview支持支持支持支持不支持支持
anthropic/claude-fable-5支持支持支持支持不支持不支持
grok/grok-4.3支持支持支持支持不支持不支持
价格

路由免费。
为功能付费。

你的 Token 花费,我们一分不抽——平台只靠可选的团队版功能盈利,始终与你的用量利益一致。

零加价保证
你按厂商公开价格直接支付给他们。我们不在 Token 成本上加任何费用。路由免费;可选的 Team 计划支撑平台运转。
$0.00路由费

Hacker

免费
永久免费。所有 Token 零加价。
✓ 路由——200+ 模型,自动故障转移
✓ 观测——基础仪表盘
✓ 管理——提示词版本化
✓ 3 个 API 密钥 · 0% Token 加价
免费开始

企业版

定制
99.99% SLA、私有部署,企业级保障到位。
✓ 包含 Team 全部功能
✓ 私有化 / 本地部署
✓ 99.99% 可用性 SLA
✓ 专属基础设施
✓ 专属支持与定制定价
信任与合规

独立审计认证,持续保持合规。

审计报告须在保密协议下提供——请在下方申请副本。

更聪明、更安全、更省钱。

换一行代码。迁移就这么简单。

用 GitHub 注册——赠送 $5 Token 额度。无需信用卡。一分钟内即可上线。