マークアップゼロ · 高い可用性 · より良い価格

ひとつのゲートウェイで、すべてのモデルを。 賢くルーティング。安全にリリース。コストは最小限に。

OrcaRouter はすべてのプロンプトを評価し、インテリジェントにルーティングします。フロンティア品質の AI を最大 40% 低コストで。アダプティブルーティング、ロードバランシング、ガードレール、エージェントファイアウォール、可観測性、ガバナンス — すべて単一の OpenAI 互換エンドポイントで。

クレジットカード不要 · 60 秒で利用開始

RouterArena で GPT-5 と Azure を上回る公開された研究に基づく
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

わずか1行。各プロンプトを評価し、フロンティアまたはOSSへルーティング、上乗せは$0。

Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
200+
モデルを、ひとつのエンドポイントで
0%
トークンの上乗せは一切なし
75.5%
ルーティング精度
<50ms
ストリーム途中でのフェイルオーバー
OrcaRouter を使ってる?話そう。
あなたのフィードバックが、次のリリースを決める。
インテグレーション

使い慣れたツールでそのまま動く

OpenAI 互換でそのまま、またはエージェントを OrcaRouter MCP サーバー経由で接続 — お使いの SDK、フレームワーク、エディタをそのまま。

OrcaRouter MCP サーバーOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLなど
本番環境向け AI ゲートウェイ

すべてのリクエストをスマートにルーティングし、自動でフェイルオーバー。

計測可能なほど高精度なルーティング。

すべてのプロンプトを埋め込み、実トラフィックからオンラインで学習し続けるモデルがルーティング。公開RouterArenaリーダーボード(Jun 2026)では精度75.5%でトップ——GPT-5、Azure、Martian、NotDiamondを上回る。

contextual embeddingsonline learning<1ms overheadRouterArena
* RouterArena リーダーボードのデータに基づく(2026年6月)。

プロバイダーがダウン。誰も気づかない。

プロバイダーがレート制限や 5xx を返した場合、OrcaRouter は応答が始まる前に 200+ のモデルから正常なものへリクエストを再試行します — 上流の一時的な障害がユーザーに影響しません。

200+ modelsauto-failoverno 429

ルーティングは、あなたの思いどおりに。

orcarouter/auto は賢いデフォルトであり、ブラックボックスではありません。ワークスペースごとに目的を指定できます——品質基準を満たす最も安価なモデル、最高品質、その両立のいずれか——あるいは、実際のトラフィックからトレードオフを学習させることも可能です。単一の挙動に縛られることは決してありません。

per-workspaceno markup either way<1ms overhead

すべての呼び出しを可視化し、証跡を残す——コスト、モデル、レイテンシ、その理由まで。

すべてを可視化。すべてを証明。

各リクエストがいくらかかったか、どのモデルが処理したか、どれだけ時間がかかったか、なぜ失敗したかを正確に把握できます——フィルタリング、リプレイ、実行可能なcURLとしてコピーできる完全な構造化ログを提供します。ルーティングが決してブラックボックスになることはありません。

Per-request logsgrade · model · costcopy-as-cURL

上乗せゼロ。ブラックボックスもゼロ。

各プロバイダーには、その正確な価格をお支払いいただきます——トークンあたり$0、決して上乗せしません。すべてのリクエストにグレード、選択されたモデル、プロバイダー、レイテンシ、価格が表示されるため、コストは不透明なブレンドレートではなく、グラスボックスです。

$0 / tokenprovider costglass-box receipt

再デプロイなしで、プロンプトのバージョン管理とキャッシュを。

変えるのはプロンプト。コードではなく。

名前付きラベルの背後でプロンプトをバージョン管理し、A/B分割とワンクリックのロールバックに対応します。ラベルを移動すれば、すべてのリクエストが即座にそれを反映します——再デプロイも、コード変更も、クライアントの更新も不要です。

VersionedA/BInstant rollbackNo deploy

支払いは一度。再利用は無料。

繰り返しおよびキャッシュされたプロンプトトークンは、5分および1時間のエフェメラルウィンドウにわたって、プロバイダーのキャッシュレート——多くの場合、入力価格のごく一部——で課金されます。同じ回答を、より少ない支出で、すべてのレシートにcached_tokensを記載してお届けします。

cache_controlcached_tokens5m / 1h windows

ガードレール、予算、そして実際に効くエージェントファイアウォール。

ちゃんと止めるガードレール。

PII Shieldとコンテンツポリシーは、上流への呼び出しが課金される前に実行されます。ブロックされたリクエストはクリーンな400を返し、決して課金されません——ガードレールは後からログに記録されるのではなく、インラインで適用されます。

PII Shieldenforced pre-billingclean 400

チームにも、エージェントにも安全。

人にはバジェットとロールを、エージェントにはリスクスコアリング型のファイアウォールを。すべてのツール呼び出しとMCP呼び出しは、実行される前にALLOW、REVIEW、BLOCKのいずれかに格付けされ、異常検知が学習済みの週内時間帯ベースラインに対してレートとコストの急増をフラグ付けします。

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
エージェント時代のために。必要になる前に。

完全なコントロール

モードだけでは足りない? ルールを書きましょう。

デフォルトでは不十分なときは、ルーティングをコードとして記述できます——バージョン管理でき、レビュー可能で、数秒で反映。再デプロイもクライアントの変更も不要です。

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

セットアップ

60 秒でライブ。

URL を 1 つ変更するだけ。既存の SDK、モデル名、ストリーミングがそのまま動作します。

ステップ 1
🔗

SDK を当社に向ける

base_urlapi.orcarouter.ai/v1 に設定し、API キーを入れ替えます。他のコード変更は不要です。

ステップ 2

ルーティング、ガード、観測はおまかせ

すべての呼び出しを最適なモデルへルーティングし、ガードレールで検査し、計測——判定は1ms未満。フェイルオーバー、キャッシュ、完全なログを標準装備。

ステップ 3

あとは、ひとつのエンドポイントでリリースするだけ

トラフィックは各プロバイダーのファーストパーティAPIへ公開レートで直送——トークンあたりの上乗せは$0。ルーティング、可観測性、ガバナンスをひとつのOpenAI互換エンドポイントで。


すべてのモデル。1つの価格表。

200+のモデルをライブで横並び表示 — プロバイダーへ直接支払う額そのまま。上乗せは$0。

200+ モデルをすべて見る →
モデルルーティング先入力 /M出力 /Mコンテキスト品質
kling/kling-3-turboNEW$0.112 /call
z-ai/glm-5.2NEWZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeNEWMoonshot$0.950$4.00262K8.0
qwen/qwen3.7-plusNEWAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3NEW$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
openai/gpt-5.5-proOpenAI Direct$30.00$180.0010.0
openai/gpt-5.5OpenAI Direct$5.00$30.0010.0
deepseek/deepseek-v4-proDeepSeek$0.435$0.8701M8.0
deepseek/deepseek-v4-flashDeepSeek$0.090$0.1801M7.0
+ 194 のモデル · 価格は 60 秒ごとに更新

あなたのOpenAIクライアントが呼ぶすべてに対応。

ストリーミング、ツール呼び出し、構造化出力、ビジョン、エンベディング、オーディオ — すべてのモデルでそのままルーティング。

モデルストリーミングツール構造化出力ビジョンエンベディングオーディオ
anthropic/claude-opus-4.8対応対応対応対応非対応非対応
google/gemini-3.1-pro-preview対応対応対応対応非対応対応
openai/gpt-5.5-pro対応対応対応対応非対応非対応
anthropic/claude-opus-4.7対応対応対応対応非対応非対応
grok/grok-4.3対応対応対応対応非対応非対応
料金

ルーティングは無料。
お支払いは機能に。

トークン支出から一切を取ることはありません。収益はオプションのチーム機能から得られます。

ゼロマークアップ保証
プロバイダーに公表レートで直接お支払いいただきます。トークンコストに何も上乗せしません。ルーティングは無料です。オプションの Team プランがプラットフォームを支えます。
$0.00ルーティング料金

ハッカー

無料
永久無料。全トークンでゼロマークアップ。
✓ ルーティング — 200+ モデル、自動フェイルオーバー
✓ 可観測性 — 基本ダッシュボード
✓ 管理 — プロンプトのバージョン管理
✓ 3 API キー · 0% トークン上乗せ
無料で始める

エンタープライズ

カスタム
SLA コミット + プライベートデプロイ。
✓ Team のすべて
✓ プライベート / オンプレミスデプロイ
✓ 99.99% 稼働 SLA
✓ 専用インフラ
✓ 専任サポートとカスタム価格
信頼性とコンプライアンス

第三者監査済み。継続的にコンプライアンスを維持。

監査レポートはNDAのもとで提供しています。以下からコピーをご請求ください。

もっと賢く、もっと安全に、もっと低コストに。

1行を差し替えるだけ。それが移行のすべて。

GitHubでサインアップ — $5分のトークンが無料。クレジットカード不要。1分以内に稼働。