路由更准,数据可证。
每条提示词都会被向量化,并由一个持续从真实流量在线学习的模型完成路由。在公开的 RouterArena 排行榜(Jun 2026)上,它以 75.5% 的准确率领跑——领先于 GPT-5、Azure、Martian 和 NotDiamond。
把每一次调用都交给最合适的模型——质量对齐前沿大模型,成本最高省 40%。自适应路由、负载均衡、安全护栏、智能体防火墙、可观测性与治理一站到位,全部通过单一 OpenAI 兼容端点接入,不改代码、不被锁定。
无需信用卡 · 60 秒即可上线
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="orcarouter/auto", # router picks the best model per requestmessages=[{"role": "user", "content": "..."}])# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓
只改一行代码,即可用上 200+ 模型——我们按难度自动选前沿或开源,平台不赚一分差价。
OpenAI 接口直接兼容;智能体可走 OrcaRouter MCP 服务器接入——你的 SDK、框架、编辑器一个都不用换。
每一次请求都用对模型、扛得住故障——智能路由加自动容灾。
每条提示词都会被向量化,并由一个持续从真实流量在线学习的模型完成路由。在公开的 RouterArena 排行榜(Jun 2026)上,它以 75.5% 的准确率领跑——领先于 GPT-5、Azure、Martian 和 NotDiamond。
当某个厂商限流或返回 5xx 时,OrcaRouter 会在响应开始前将请求重试到 200+ 个可用模型中的健康模型——让上游的临时故障不波及你的用户。
orcarouter/auto 是智能默认值,而非黑盒。每个工作区都可以指定你想要的目标——在达到质量标准前提下选最便宜的模型、选质量最高的模型,或在两者间取得平衡——也可以让它从你自己的流量中学习如何权衡。你绝不会被锁定在单一策略上。
每一笔花费、每一次调用都看得清、可举证。
清楚看到每个请求的成本、由哪个模型处理、耗时多久、以及为何失败——完整的结构化日志,可供你筛选、重放,并复制为可直接运行的 cURL。路由绝不是黑盒。
你按每个厂商的确切价格付费——我们每个 Token 加价 $0,永远如此。每个请求都会显示评级、所选模型、厂商、延迟和价格,因此成本完全透明可查,而非不透明的混合费率。
改提示词、开缓存,不发版即刻生效。
在命名标签背后对提示词进行版本管理,支持 A/B 分流和一键回滚。移动一个标签,每个请求都会立即采用它——无需重新部署、无需改代码、无需更新客户端。
重复和已缓存的提示词 Token 会按厂商的缓存费率计费——通常只是输入价格的一小部分——覆盖 5 分钟和 1 小时的临时窗口。同样的答案,更少的花费,每张账单上都带有 cached_tokens。
安全护栏、预算、智能体防火墙强制生效,风险始终可控。
PII Shield 和内容策略会在上游调用计费之前运行。被拦截的请求会返回干净的 400,并且永不计费——安全护栏在请求过程中内联执行,而非事后记录。
为人员设定预算和角色;为智能体提供基于风险评分的防火墙。每一次工具调用和 MCP 调用在执行前都会被评级为 ALLOW、REVIEW 或 BLOCK,异常检测则会对照学习到的一周内各时段的历史基线,标记速率和成本的激增。
当默认策略不够用时,用代码来表达路由——可版本管理、可评审,几秒即可生效。无需重新部署,也无需改动客户端。
改一个 URL。你现有的 SDK、模型名、流式都照常工作。
把 base_url 改成 api.orcarouter.ai/v1,换上 API 密钥。其他代码不用改。
每次调用都会被路由到最佳模型、按你的安全护栏校验并计量——打分在 <1ms 内完成,内置故障转移、缓存与完整日志。
流量按官方公开价直连各家厂商的一方 API——我们每 Token 加价 $0。一个兼容 OpenAI 的端点,搞定路由、可观测性与治理。
200+ 模型实时并排比价——就是你直接付给厂商的价。我们额外加价 $0。
| 模型 | 路由到 | 输入 /M | 输出 /M | 上下文 | 质量 |
|---|---|---|---|---|---|
| obsidian/gemma-4-26B-A4B新 | — | $0.250 | $2.90 | 262K | 4.0 |
| obsidian/Qwen3.6-35B-A3B新 | — | $0.310 | $4.21 | 262K | 4.0 |
| anthropic/claude-sonnet-5新 | Anthropic Direct | $2.00 | $10.00 | 1M | 9.0 |
| kling/kling-3-turbo新 | — | $0.112 /call | — | — | — |
| z-ai/glm-5.2新 | Zhipu AI | $1.40 | $4.40 | 1M | 9.0 |
| kimi/kimi-k2.7-code新 | Moonshot | $0.950 | $4.00 | 262K | 8.0 |
| anthropic/claude-fable-5新 | Anthropic Direct | $10.00 | $50.00 | 1M | 10.0 |
| qwen/qwen3.7-plus | Alibaba Cloud | $0.350 | $1.42 | 1M | 8.0 |
| minimax/minimax-m3 | — | $0.300 | $1.20 | 1M | 9.0 |
| anthropic/claude-opus-4.8 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| google/gemini-3.5-flash | Google Direct | $1.50 | $9.00 | 1M | 9.0 |
| qwen/qwen3.7-max | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.7-max-2026-05-20 | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.6-flash | Alibaba Cloud | $0.250 | $1.50 | 1M | 7.0 |
| qwen/qwen3.6-35b-a3b | Alibaba Cloud | $0.248 | $1.48 | 262K | 8.0 |
| + 还有 194 个模型 · 价格每 60 秒更新 | |||||
流式、工具调用、结构化输出、视觉、嵌入与音频——原样路由到每一个模型。
| 模型 | 流式 | 工具 | 结构化 | 视觉 | 嵌入 | 音频 |
|---|---|---|---|---|---|---|
| openai/gpt-5.5-pro | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 |
| anthropic/claude-opus-4.7 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 |
| google/gemini-3.1-pro-preview | 支持 | 支持 | 支持 | 支持 | 不支持 | 支持 |
| anthropic/claude-fable-5 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 |
| grok/grok-4.3 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 |
你的 Token 花费,我们一分不抽——平台只靠可选的团队版功能盈利,始终与你的用量利益一致。
审计报告须在保密协议下提供——请在下方申请副本。
换一行代码。迁移就这么简单。
用 GitHub 注册——赠送 $5 Token 额度。无需信用卡。一分钟内即可上线。