OrcaRouter 为每个请求匹配最合适的模型:复杂推理交给前沿模型,常规任务交给开源模型。重要时刻享受前沿品质,其余时刻只付开源价格。零加价。零迁移。一个 API。
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="gpt-4o",messages=[{"role": "user", "content": "..."}])# → routed to cheapest live backend, zero markup ✓
你的流量直达上游供应商,中间没有影子代理。日志里看到的供应商,就是真正承接请求的那一家。
上游供应商的数据和使用条款直接适用于你的流量。挑选与你政策匹配的供应商即可。
每次调用都记录供应商、公开标价、走的路由。事后可在仪表盘里复现任何路由决策。
改一个 URL。你现有的 SDK、模型名、流式都照常工作。
把 base_url 改成 api.orcarouter.ai/v1,换上 API 密钥。其他代码不用改。
每次请求在 1ms 内检测供应商实时健康和价格。为该模型选择最便宜的可用直连后端。
流量直连供应商。你按公开价格付给他们。我们在上面加 0 美元——订阅费收的是方案,不是你的 token。
实时路由到最便宜的可用后端。价格每 60 秒刷新。
| 模型 | 路由到 | 输入 /M | 输出 /M | 上下文 | 质量 |
|---|---|---|---|---|---|
| claude-opus-4-7 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| claude-sonnet-4-6 | Anthropic Direct | $3.00 | $15.00 | 1M | 7.0 |
| gpt-5.5 | OpenAI Direct | $5.00 | $30.00 | 1M | 10.0 |
| gemini-3.1-pro-preview | Google Direct | $4.00 | $18.00 | 1M | 10.0 |
| deepseek-v4-pro | DeepSeek | $0.560 | $1.12 | 1M | 9.0 |
| qwen3.6-plus | Alibaba Cloud | $0.500 | $3.00 | 1M | 8.0 |
| kimi-k2.6 | Moonshot | $0.900 | $3.75 | 256K | 9.0 |
| seedance-2.0 | ByteDance | from $0.07 /sec | — | — | 10.0 |
| + 还有 194 个模型 · 价格每 60 秒更新 | |||||
在生产中运行 AI 所需的一切,无需自己对接多个供应商。
供应商价格每 60 秒刷新。每次请求自动打到最便宜的可用后端。
供应商中途挂了?我们无感切换,你的应用看不到错误。
按团队或服务签发密钥,内置花费上限、模型白名单、速率限制。
精确查看每次请求的成本、经手供应商和节省金额。
改一行。一样的 SDK、模型名、流式格式。零迁移成本。
按密钥、团队或组织设置硬性和柔性上限。每月自动重置。Slack + webhook 告警。
每次请求都告诉你由哪个供应商承接、对方公开标价是多少、走的什么路由。每次都能核对,事后也能复现。
每次响应都标注上游供应商(Anthropic Direct、OpenAI Direct、Bedrock、Vertex 等),在仪表盘和响应头中可见。
每个 token 的费用即供应商公开标价。任何请求都可以在几秒内对照供应商定价页核对。
故障切换、健康度切换、最便宜后端选择都带时间戳记录在日志里。任何请求的路由路径都能回放。
我们绝不从你的 token 花费中抽成。收入来自可选的团队功能。
用 GitHub 注册 — $5 token 免费。无需信用卡。改一行代码就能上线。