OrcaRouter — 一個 AI 閘道：自適應 LLM 路由與治理

面向生產的 AI 閘道

每一個請求都用對模型、扛得住故障——智慧路由加自動故障轉移。

可量化、更精準的路由。

每段提示都會被嵌入，並由一個持續從真實流量線上學習的模型進行路由。在公開的 RouterArena 排行榜（Jun 2026）上，它以 75.5% 的準確率領先——超越 GPT-5、Azure、Martian 與 NotDiamond。

contextual embeddingsonline learning<1ms overheadRouterArena

* 基於 RouterArena 排行榜資料，2026 年 6 月。

供應商當機。沒人察覺。

當某個供應商限流或回傳 5xx 時，OrcaRouter 會在回應開始前將請求重試到 200+ 個可用模型中的健康模型——讓上游的暫時故障不波及你的使用者。

200+ modelsauto-failoverno 429

路由由你決定。

orcarouter/auto 是智慧預設值，而非黑盒。每個工作區都能指定你想要的目標——在達到品質門檻的前提下選最便宜的模型、選品質最高的模型，或在兩者間取得平衡——也可以讓它從你自己的流量中學習如何取捨。你絕不會被鎖定在單一策略上。

per-workspaceno markup either way<1ms overhead

每一筆花費、每一次呼叫都看得清、可舉證。

全程可見。任何結果皆可驗證。

清楚掌握每個請求的成本、由哪個模型處理、花了多少時間，以及失敗的原因——完整的結構化日誌讓你能夠篩選、重播，並複製成可直接執行的 cURL。路由絕不是黑箱。

Per-request logsgrade · model · costcopy-as-cURL

零加價。零黑盒。

你支付每個供應商各自的確切價格——我們永遠不對每個 Token 加收 $0 以外的費用。每個請求都會顯示評級、所選模型、供應商、延遲與價格，因此成本完全透明可查，而非不透明的混合費率。

$0 / tokenprovider costglass-box receipt

改提示詞、開快取，免重新部署即可生效。

改提示詞。不必改程式碼。

以具名標籤管理提示詞版本，支援 A/B 分流與一鍵回滾。移動一個標籤，所有請求便立即套用——無需重新部署、無需改動程式碼、無需更新用戶端。

VersionedA/BInstant rollbackNo deploy

付一次。重複使用免費。

重複與已快取的提示詞 Token 會以供應商的快取費率計費——通常只是輸入價格的一小部分——涵蓋 5 分鐘與 1 小時的暫存窗口。相同的回答、更低的花費，且每張收據上都附有 cached_tokens。

cache_controlcached_tokens5m / 1h windows

安全護欄、預算、代理防火牆強制生效，風險始終可控。

真正攔得住的安全護欄。

PII Shield 與內容政策會在上游呼叫計費之前先行執行。被攔截的請求會回傳乾淨的 400，且絕不收費——安全護欄以行內方式即時執行，而非事後記錄。

PII Shieldenforced pre-billingclean 400

對你的團隊安全。對你的代理也是。

為人員設定預算與角色；為代理（agent）設定風險評分防火牆。每一次工具呼叫與 MCP 呼叫在執行前都會被評為 ALLOW、REVIEW 或 BLOCK，異常偵測則會依據學習而來的每週各時段基準，標記出速率與成本的突增。

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection

為代理時代而生。在你需要之前，就已就緒。

完全掌控

需要的不只一種模式？那就寫規則。

當預設策略不夠用時，用程式碼來表達路由——可版本控管、可審查，數秒即可生效。無需重新部署，也無需變更用戶端。

routing.yaml

version: 1
rules:
  - id: hard_agent_task
    when: task_class == "agent" && difficulty >= 0.6
    use:
      model: "claude-opus-4-7"
      reasoning_effort: high   # spend where it matters
  - id: short_prompts
    when: request.input_tokens < 500
    use: { delegate: cheapest }
default:
  delegate: balanced   # fall back to the chosen mode

YAML + CELversion-controlledlive in seconds

查看路由文件

接入

60 秒上線。

改一個 URL。你現有的 SDK、模型名、串流都照常工作。

步驟 1

🔗

把 SDK 指向我們

把 base_url 改成 api.orcarouter.ai/v1，換上 API 金鑰。其他程式碼不用改。

→

步驟 2

⚡

我們負責路由、把關與觀測

每次呼叫都會被路由到最佳模型、依你的安全護欄檢查並計量——<1ms 內完成評分，內建故障轉移、快取與完整日誌。

→

步驟 3

✓

你只需在一個端點上線

流量直達各供應商的第一方 API，採用其公開費率——我們每個 Token 加收 $0。路由、可觀測性與治理，盡在單一 OpenAI 相容端點。

所有模型。一張價目表。

200+ 模型，提供即時、並排的價格——就是你直接付給供應商的價。我們額外加價 $0。

檢視全部 200+ 模型 →

模型	路由到	輸入 /M	輸出 /M	上下文	品質
obsidian/Qwen3.6-35B-A3B新	—	$0.310	$4.21	262K	4.0
obsidian/gemma-4-26B-A4B新	—	$0.250	$2.90	262K	4.0
anthropic/claude-sonnet-5新	Anthropic Direct	$2.00	$10.00	1M	9.0
kling/kling-3-turbo新	—	$0.112 /call	—	—	—
z-ai/glm-5.2新	Zhipu AI	$1.40	$4.40	1M	9.0
kimi/kimi-k2.7-code新	Moonshot	$0.950	$4.00	262K	8.0
anthropic/claude-fable-5新	Anthropic Direct	$10.00	$50.00	1M	10.0
qwen/qwen3.7-plus	Alibaba Cloud	$0.350	$1.42	1M	8.0
minimax/minimax-m3	—	$0.300	$1.20	1M	9.0
anthropic/claude-opus-4.8	Anthropic Direct	$5.00	$25.00	1M	10.0
google/gemini-3.5-flash	Google Direct	$1.50	$9.00	1M	9.0
qwen/qwen3.7-max	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.7-max-2026-05-20	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.6-flash	Alibaba Cloud	$0.250	$1.50	1M	7.0
qwen/qwen3.6-35b-a3b	Alibaba Cloud	$0.248	$1.48	262K	8.0
+ 還有 194 個模型 · 價格每 60 秒更新

你的 OpenAI 用戶端原本就會呼叫的一切。

串流、工具呼叫、結構化輸出、視覺、嵌入與音訊——跨每個模型原封不動路由。

模型	串流	工具	結構化	視覺	嵌入	音訊
anthropic/claude-opus-4.7	支援	支援	支援	支援	不支援	不支援
grok/grok-4.3	支援	支援	支援	支援	不支援	不支援
anthropic/claude-fable-5	支援	支援	支援	支援	不支援	不支援
google/gemini-3.1-pro-preview	支援	支援	支援	支援	不支援	支援
anthropic/claude-opus-4.8	支援	支援	支援	支援	不支援	不支援

價格

路由免費。
為功能付費。

你的 Token 花費，我們一分不抽——平台只靠可選的團隊版功能獲利，始終與你的用量利益一致。

零加價保證

你按供應商公開價格直接支付給他們。我們不在 Token 成本上加任何費用。路由免費；可選的 Team 計畫支撐平台運轉。

$0.00路由費

Hacker

免費

永久免費。所有 Token 零加價。

✓ 路由——200+ 模型，自動故障轉移

✓ 觀測——基本儀表板

✓ 管理——提示版本控管

✓ 3 個 API 金鑰 · 0% Token 加價

免費開始

團隊版

$499/mo

仍然零加價。為功能付費。

✓ 包含 Hacker 全部功能

✓ 最多 10 個團隊席位

✓ 合規強制執行與報告

✓ 無限 API 金鑰

✓ 優先支援

開始使用 →

企業版

客製

99.99% SLA、私有部署，企業級保障到位。

✓ 包含 Team 全部功能

✓ 私有 / 地端部署

✓ 99.99% 正常運行 SLA

✓ 專屬基礎設施

✓ 專屬支援與客製定價

一個閘道，接入所有模型。智慧路由 · 安全上線 · 成本更省

沿用現有工具鏈，零遷移成本。

可量化、更精準的路由。

供應商當機。沒人察覺。

路由由你決定。

全程可見。任何結果皆可驗證。

零加價。零黑盒。

改提示詞。不必改程式碼。

付一次。重複使用免費。

真正攔得住的安全護欄。

對你的團隊安全。對你的代理也是。

需要的不只一種模式？那就寫規則。

60 秒上線。

把 SDK 指向我們

我們負責路由、把關與觀測

你只需在一個端點上線

所有模型。一張價目表。

你的 OpenAI 用戶端原本就會呼叫的一切。

路由免費。
為功能付費。

Hacker

團隊版

企業版

獨立稽核認證，持續維持合規。

更聰明、更安全、更省成本。

產品

資源

法律

關注

一個閘道，接入所有模型。 智慧路由 · 安全上線 · 成本更省

沿用現有工具鏈，零遷移成本。

可量化、更精準的路由。

供應商當機。沒人察覺。

路由由你決定。

全程可見。任何結果皆可驗證。

零加價。零黑盒。

改提示詞。不必改程式碼。

付一次。重複使用免費。

真正攔得住的安全護欄。

對你的團隊安全。對你的代理也是。

需要的不只一種模式？那就寫規則。

60 秒上線。

把 SDK 指向我們

我們負責路由、把關與觀測

你只需在一個端點上線

所有模型。一張價目表。

你的 OpenAI 用戶端原本就會呼叫的一切。

路由免費。為功能付費。

Hacker

團隊版

企業版

獨立稽核認證，持續維持合規。

更聰明、更安全、更省成本。

產品

資源

法律

關注

一個閘道，接入所有模型。智慧路由 · 安全上線 · 成本更省

路由免費。
為功能付費。