可量化、更精準的路由。
每段提示都會被嵌入,並由一個持續從真實流量線上學習的模型進行路由。在公開的 RouterArena 排行榜(Jun 2026)上,它以 75.5% 的準確率領先——超越 GPT-5、Azure、Martian 與 NotDiamond。
把每一次呼叫都交給最合適的模型——品質對齊前沿 AI,成本最高省 40%。自適應路由、負載平衡、安全護欄、代理防火牆、可觀測性與治理一站到位,全部透過單一 OpenAI 相容端點接入,不改程式碼、不被綁定。
無需信用卡 · 60 秒即可上線
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="orcarouter/auto", # router picks the best model per requestmessages=[{"role": "user", "content": "..."}])# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓
只改一行程式碼,即可用上 200+ 模型——我們依難度自動選前沿或開源,平台不賺一分差價。
OpenAI 介面直接相容;代理可走 OrcaRouter MCP 伺服器接入——你的 SDK、框架、編輯器一個都不用換。
每一個請求都用對模型、扛得住故障——智慧路由加自動故障轉移。
每段提示都會被嵌入,並由一個持續從真實流量線上學習的模型進行路由。在公開的 RouterArena 排行榜(Jun 2026)上,它以 75.5% 的準確率領先——超越 GPT-5、Azure、Martian 與 NotDiamond。
當某個供應商限流或回傳 5xx 時,OrcaRouter 會在回應開始前將請求重試到 200+ 個可用模型中的健康模型——讓上游的暫時故障不波及你的使用者。
orcarouter/auto 是智慧預設值,而非黑盒。每個工作區都能指定你想要的目標——在達到品質門檻的前提下選最便宜的模型、選品質最高的模型,或在兩者間取得平衡——也可以讓它從你自己的流量中學習如何取捨。你絕不會被鎖定在單一策略上。
每一筆花費、每一次呼叫都看得清、可舉證。
清楚掌握每個請求的成本、由哪個模型處理、花了多少時間,以及失敗的原因——完整的結構化日誌讓你能夠篩選、重播,並複製成可直接執行的 cURL。路由絕不是黑箱。
你支付每個供應商各自的確切價格——我們永遠不對每個 Token 加收 $0 以外的費用。每個請求都會顯示評級、所選模型、供應商、延遲與價格,因此成本完全透明可查,而非不透明的混合費率。
改提示詞、開快取,免重新部署即可生效。
以具名標籤管理提示詞版本,支援 A/B 分流與一鍵回滾。移動一個標籤,所有請求便立即套用——無需重新部署、無需改動程式碼、無需更新用戶端。
重複與已快取的提示詞 Token 會以供應商的快取費率計費——通常只是輸入價格的一小部分——涵蓋 5 分鐘與 1 小時的暫存窗口。相同的回答、更低的花費,且每張收據上都附有 cached_tokens。
安全護欄、預算、代理防火牆強制生效,風險始終可控。
PII Shield 與內容政策會在上游呼叫計費之前先行執行。被攔截的請求會回傳乾淨的 400,且絕不收費——安全護欄以行內方式即時執行,而非事後記錄。
為人員設定預算與角色;為代理(agent)設定風險評分防火牆。每一次工具呼叫與 MCP 呼叫在執行前都會被評為 ALLOW、REVIEW 或 BLOCK,異常偵測則會依據學習而來的每週各時段基準,標記出速率與成本的突增。
當預設策略不夠用時,用程式碼來表達路由——可版本控管、可審查,數秒即可生效。無需重新部署,也無需變更用戶端。
改一個 URL。你現有的 SDK、模型名、串流都照常工作。
把 base_url 改成 api.orcarouter.ai/v1,換上 API 金鑰。其他程式碼不用改。
每次呼叫都會被路由到最佳模型、依你的安全護欄檢查並計量——<1ms 內完成評分,內建故障轉移、快取與完整日誌。
流量直達各供應商的第一方 API,採用其公開費率——我們每個 Token 加收 $0。路由、可觀測性與治理,盡在單一 OpenAI 相容端點。
200+ 模型,提供即時、並排的價格——就是你直接付給供應商的價。我們額外加價 $0。
| 模型 | 路由到 | 輸入 /M | 輸出 /M | 上下文 | 品質 |
|---|---|---|---|---|---|
| obsidian/Qwen3.6-35B-A3B新 | — | $0.310 | $4.21 | 262K | 4.0 |
| obsidian/gemma-4-26B-A4B新 | — | $0.250 | $2.90 | 262K | 4.0 |
| anthropic/claude-sonnet-5新 | Anthropic Direct | $2.00 | $10.00 | 1M | 9.0 |
| kling/kling-3-turbo新 | — | $0.112 /call | — | — | — |
| z-ai/glm-5.2新 | Zhipu AI | $1.40 | $4.40 | 1M | 9.0 |
| kimi/kimi-k2.7-code新 | Moonshot | $0.950 | $4.00 | 262K | 8.0 |
| anthropic/claude-fable-5新 | Anthropic Direct | $10.00 | $50.00 | 1M | 10.0 |
| qwen/qwen3.7-plus | Alibaba Cloud | $0.350 | $1.42 | 1M | 8.0 |
| minimax/minimax-m3 | — | $0.300 | $1.20 | 1M | 9.0 |
| anthropic/claude-opus-4.8 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| google/gemini-3.5-flash | Google Direct | $1.50 | $9.00 | 1M | 9.0 |
| qwen/qwen3.7-max | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.7-max-2026-05-20 | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.6-flash | Alibaba Cloud | $0.250 | $1.50 | 1M | 7.0 |
| qwen/qwen3.6-35b-a3b | Alibaba Cloud | $0.248 | $1.48 | 262K | 8.0 |
| + 還有 194 個模型 · 價格每 60 秒更新 | |||||
串流、工具呼叫、結構化輸出、視覺、嵌入與音訊——跨每個模型原封不動路由。
| 模型 | 串流 | 工具 | 結構化 | 視覺 | 嵌入 | 音訊 |
|---|---|---|---|---|---|---|
| anthropic/claude-opus-4.7 | 支援 | 支援 | 支援 | 支援 | 不支援 | 不支援 |
| grok/grok-4.3 | 支援 | 支援 | 支援 | 支援 | 不支援 | 不支援 |
| anthropic/claude-fable-5 | 支援 | 支援 | 支援 | 支援 | 不支援 | 不支援 |
| google/gemini-3.1-pro-preview | 支援 | 支援 | 支援 | 支援 | 不支援 | 支援 |
| anthropic/claude-opus-4.8 | 支援 | 支援 | 支援 | 支援 | 不支援 | 不支援 |
你的 Token 花費,我們一分不抽——平台只靠可選的團隊版功能獲利,始終與你的用量利益一致。
稽核報告須於保密協議下提供——請於下方申請副本。
換一行。這就是全部的遷移。
用 GitHub 註冊——免費送 $5 Token。免信用卡。不到一分鐘即可上線。