零加價 · 更高可用性 · 更優價格

一個閘道,接入所有模型。 智慧路由 · 安全上線 · 成本更省

把每一次呼叫都交給最合適的模型——品質對齊前沿 AI,成本最高省 40%。自適應路由、負載平衡、安全護欄、代理防火牆、可觀測性與治理一站到位,全部透過單一 OpenAI 相容端點接入,不改程式碼、不被綁定。

無需信用卡 · 60 秒即可上線

在 RouterArena 上超越 GPT-5 與 Azure有已發表的研究支撐
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

只改一行程式碼,即可用上 200+ 模型——我們依難度自動選前沿或開源,平台不賺一分差價。

Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
200+
個模型,一個端點
0%
Token 加價,永遠沒有
75.5%
路由準確率
<50ms
串流中故障轉移
在用 OrcaRouter?來聊聊。
你的回饋,決定下一次發布。
整合

沿用現有工具鏈,零遷移成本。

OpenAI 介面直接相容;代理可走 OrcaRouter MCP 伺服器接入——你的 SDK、框架、編輯器一個都不用換。

OrcaRouter MCP 伺服器OpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURL等更多
面向生產的 AI 閘道

每一個請求都用對模型、扛得住故障——智慧路由加自動故障轉移。

可量化、更精準的路由。

每段提示都會被嵌入,並由一個持續從真實流量線上學習的模型進行路由。在公開的 RouterArena 排行榜(Jun 2026)上,它以 75.5% 的準確率領先——超越 GPT-5、Azure、Martian 與 NotDiamond。

contextual embeddingsonline learning<1ms overheadRouterArena
* 基於 RouterArena 排行榜資料,2026 年 6 月。

供應商當機。沒人察覺。

當某個供應商限流或回傳 5xx 時,OrcaRouter 會在回應開始前將請求重試到 200+ 個可用模型中的健康模型——讓上游的暫時故障不波及你的使用者。

200+ modelsauto-failoverno 429

路由由你決定。

orcarouter/auto 是智慧預設值,而非黑盒。每個工作區都能指定你想要的目標——在達到品質門檻的前提下選最便宜的模型、選品質最高的模型,或在兩者間取得平衡——也可以讓它從你自己的流量中學習如何取捨。你絕不會被鎖定在單一策略上。

per-workspaceno markup either way<1ms overhead

每一筆花費、每一次呼叫都看得清、可舉證。

全程可見。任何結果皆可驗證。

清楚掌握每個請求的成本、由哪個模型處理、花了多少時間,以及失敗的原因——完整的結構化日誌讓你能夠篩選、重播,並複製成可直接執行的 cURL。路由絕不是黑箱。

Per-request logsgrade · model · costcopy-as-cURL

零加價。零黑盒。

你支付每個供應商各自的確切價格——我們永遠不對每個 Token 加收 $0 以外的費用。每個請求都會顯示評級、所選模型、供應商、延遲與價格,因此成本完全透明可查,而非不透明的混合費率。

$0 / tokenprovider costglass-box receipt

改提示詞、開快取,免重新部署即可生效。

改提示詞。不必改程式碼。

以具名標籤管理提示詞版本,支援 A/B 分流與一鍵回滾。移動一個標籤,所有請求便立即套用——無需重新部署、無需改動程式碼、無需更新用戶端。

VersionedA/BInstant rollbackNo deploy

付一次。重複使用免費。

重複與已快取的提示詞 Token 會以供應商的快取費率計費——通常只是輸入價格的一小部分——涵蓋 5 分鐘與 1 小時的暫存窗口。相同的回答、更低的花費,且每張收據上都附有 cached_tokens。

cache_controlcached_tokens5m / 1h windows

安全護欄、預算、代理防火牆強制生效,風險始終可控。

真正攔得住的安全護欄。

PII Shield 與內容政策會在上游呼叫計費之前先行執行。被攔截的請求會回傳乾淨的 400,且絕不收費——安全護欄以行內方式即時執行,而非事後記錄。

PII Shieldenforced pre-billingclean 400

對你的團隊安全。對你的代理也是。

為人員設定預算與角色;為代理(agent)設定風險評分防火牆。每一次工具呼叫與 MCP 呼叫在執行前都會被評為 ALLOW、REVIEW 或 BLOCK,異常偵測則會依據學習而來的每週各時段基準,標記出速率與成本的突增。

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
為代理時代而生。在你需要之前,就已就緒。

完全掌控

需要的不只一種模式?那就寫規則。

當預設策略不夠用時,用程式碼來表達路由——可版本控管、可審查,數秒即可生效。無需重新部署,也無需變更用戶端。

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

接入

60 秒上線。

改一個 URL。你現有的 SDK、模型名、串流都照常工作。

步驟 1
🔗

把 SDK 指向我們

base_url 改成 api.orcarouter.ai/v1,換上 API 金鑰。其他程式碼不用改。

步驟 2

我們負責路由、把關與觀測

每次呼叫都會被路由到最佳模型、依你的安全護欄檢查並計量——<1ms 內完成評分,內建故障轉移、快取與完整日誌。

步驟 3

你只需在一個端點上線

流量直達各供應商的第一方 API,採用其公開費率——我們每個 Token 加收 $0。路由、可觀測性與治理,盡在單一 OpenAI 相容端點。


所有模型。一張價目表。

200+ 模型,提供即時、並排的價格——就是你直接付給供應商的價。我們額外加價 $0。

檢視全部 200+ 模型 →
模型路由到輸入 /M輸出 /M上下文品質
obsidian/Qwen3.6-35B-A3B$0.310$4.21262K4.0
obsidian/gemma-4-26B-A4B$0.250$2.90262K4.0
anthropic/claude-sonnet-5Anthropic Direct$2.00$10.001M9.0
kling/kling-3-turbo$0.112 /call
z-ai/glm-5.2Zhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5Anthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ 還有 194 個模型 · 價格每 60 秒更新

你的 OpenAI 用戶端原本就會呼叫的一切。

串流、工具呼叫、結構化輸出、視覺、嵌入與音訊——跨每個模型原封不動路由。

模型串流工具結構化視覺嵌入音訊
anthropic/claude-opus-4.7支援支援支援支援不支援不支援
grok/grok-4.3支援支援支援支援不支援不支援
anthropic/claude-fable-5支援支援支援支援不支援不支援
google/gemini-3.1-pro-preview支援支援支援支援不支援支援
anthropic/claude-opus-4.8支援支援支援支援不支援不支援
價格

路由免費。
為功能付費。

你的 Token 花費,我們一分不抽——平台只靠可選的團隊版功能獲利,始終與你的用量利益一致。

零加價保證
你按供應商公開價格直接支付給他們。我們不在 Token 成本上加任何費用。路由免費;可選的 Team 計畫支撐平台運轉。
$0.00路由費

Hacker

免費
永久免費。所有 Token 零加價。
✓ 路由——200+ 模型,自動故障轉移
✓ 觀測——基本儀表板
✓ 管理——提示版本控管
✓ 3 個 API 金鑰 · 0% Token 加價
免費開始

企業版

客製
99.99% SLA、私有部署,企業級保障到位。
✓ 包含 Team 全部功能
✓ 私有 / 地端部署
✓ 99.99% 正常運行 SLA
✓ 專屬基礎設施
✓ 專屬支援與客製定價
信任與合規

獨立稽核認證,持續維持合規。

稽核報告須於保密協議下提供——請於下方申請副本。

更聰明、更安全、更省成本。

換一行。這就是全部的遷移。

用 GitHub 註冊——免費送 $5 Token。免信用卡。不到一分鐘即可上線。