計測可能なほど高精度なルーティング。
すべてのプロンプトを埋め込み、実トラフィックからオンラインで学習し続けるモデルがルーティング。公開RouterArenaリーダーボード(Jun 2026)では精度75.5%でトップ——GPT-5、Azure、Martian、NotDiamondを上回る。
OrcaRouter はすべてのプロンプトを評価し、インテリジェントにルーティングします。フロンティア品質の AI を最大 40% 低コストで。アダプティブルーティング、ロードバランシング、ガードレール、エージェントファイアウォール、可観測性、ガバナンス — すべて単一の OpenAI 互換エンドポイントで。
クレジットカード不要 · 60 秒で利用開始
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="orcarouter/auto", # router picks the best model per requestmessages=[{"role": "user", "content": "..."}])# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓
わずか1行。各プロンプトを評価し、フロンティアまたはOSSへルーティング、上乗せは$0。
OpenAI 互換でそのまま、またはエージェントを OrcaRouter MCP サーバー経由で接続 — お使いの SDK、フレームワーク、エディタをそのまま。
すべてのリクエストをスマートにルーティングし、自動でフェイルオーバー。
すべてのプロンプトを埋め込み、実トラフィックからオンラインで学習し続けるモデルがルーティング。公開RouterArenaリーダーボード(Jun 2026)では精度75.5%でトップ——GPT-5、Azure、Martian、NotDiamondを上回る。
プロバイダーがレート制限や 5xx を返した場合、OrcaRouter は応答が始まる前に 200+ のモデルから正常なものへリクエストを再試行します — 上流の一時的な障害がユーザーに影響しません。
orcarouter/auto は賢いデフォルトであり、ブラックボックスではありません。ワークスペースごとに目的を指定できます——品質基準を満たす最も安価なモデル、最高品質、その両立のいずれか——あるいは、実際のトラフィックからトレードオフを学習させることも可能です。単一の挙動に縛られることは決してありません。
すべての呼び出しを可視化し、証跡を残す——コスト、モデル、レイテンシ、その理由まで。
各リクエストがいくらかかったか、どのモデルが処理したか、どれだけ時間がかかったか、なぜ失敗したかを正確に把握できます——フィルタリング、リプレイ、実行可能なcURLとしてコピーできる完全な構造化ログを提供します。ルーティングが決してブラックボックスになることはありません。
各プロバイダーには、その正確な価格をお支払いいただきます——トークンあたり$0、決して上乗せしません。すべてのリクエストにグレード、選択されたモデル、プロバイダー、レイテンシ、価格が表示されるため、コストは不透明なブレンドレートではなく、グラスボックスです。
再デプロイなしで、プロンプトのバージョン管理とキャッシュを。
名前付きラベルの背後でプロンプトをバージョン管理し、A/B分割とワンクリックのロールバックに対応します。ラベルを移動すれば、すべてのリクエストが即座にそれを反映します——再デプロイも、コード変更も、クライアントの更新も不要です。
繰り返しおよびキャッシュされたプロンプトトークンは、5分および1時間のエフェメラルウィンドウにわたって、プロバイダーのキャッシュレート——多くの場合、入力価格のごく一部——で課金されます。同じ回答を、より少ない支出で、すべてのレシートにcached_tokensを記載してお届けします。
ガードレール、予算、そして実際に効くエージェントファイアウォール。
PII Shieldとコンテンツポリシーは、上流への呼び出しが課金される前に実行されます。ブロックされたリクエストはクリーンな400を返し、決して課金されません——ガードレールは後からログに記録されるのではなく、インラインで適用されます。
人にはバジェットとロールを、エージェントにはリスクスコアリング型のファイアウォールを。すべてのツール呼び出しとMCP呼び出しは、実行される前にALLOW、REVIEW、BLOCKのいずれかに格付けされ、異常検知が学習済みの週内時間帯ベースラインに対してレートとコストの急増をフラグ付けします。
デフォルトでは不十分なときは、ルーティングをコードとして記述できます——バージョン管理でき、レビュー可能で、数秒で反映。再デプロイもクライアントの変更も不要です。
URL を 1 つ変更するだけ。既存の SDK、モデル名、ストリーミングがそのまま動作します。
base_url を api.orcarouter.ai/v1 に設定し、API キーを入れ替えます。他のコード変更は不要です。
すべての呼び出しを最適なモデルへルーティングし、ガードレールで検査し、計測——判定は1ms未満。フェイルオーバー、キャッシュ、完全なログを標準装備。
トラフィックは各プロバイダーのファーストパーティAPIへ公開レートで直送——トークンあたりの上乗せは$0。ルーティング、可観測性、ガバナンスをひとつのOpenAI互換エンドポイントで。
200+のモデルをライブで横並び表示 — プロバイダーへ直接支払う額そのまま。上乗せは$0。
| モデル | ルーティング先 | 入力 /M | 出力 /M | コンテキスト | 品質 |
|---|---|---|---|---|---|
| kling/kling-3-turboNEW | — | $0.112 /call | — | — | — |
| z-ai/glm-5.2NEW | Zhipu AI | $1.40 | $4.40 | 1M | 9.0 |
| kimi/kimi-k2.7-codeNEW | Moonshot | $0.950 | $4.00 | 262K | 8.0 |
| qwen/qwen3.7-plusNEW | Alibaba Cloud | $0.350 | $1.42 | 1M | 8.0 |
| minimax/minimax-m3NEW | — | $0.300 | $1.20 | 1M | 9.0 |
| anthropic/claude-opus-4.8 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| google/gemini-3.5-flash | Google Direct | $1.50 | $9.00 | 1M | 9.0 |
| qwen/qwen3.7-max | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.7-max-2026-05-20 | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.6-flash | Alibaba Cloud | $0.250 | $1.50 | 1M | 7.0 |
| qwen/qwen3.6-35b-a3b | Alibaba Cloud | $0.248 | $1.48 | 262K | 8.0 |
| openai/gpt-5.5-pro | OpenAI Direct | $30.00 | $180.00 | — | 10.0 |
| openai/gpt-5.5 | OpenAI Direct | $5.00 | $30.00 | — | 10.0 |
| deepseek/deepseek-v4-pro | DeepSeek | $0.435 | $0.870 | 1M | 8.0 |
| deepseek/deepseek-v4-flash | DeepSeek | $0.090 | $0.180 | 1M | 7.0 |
| + 194 のモデル · 価格は 60 秒ごとに更新 | |||||
ストリーミング、ツール呼び出し、構造化出力、ビジョン、エンベディング、オーディオ — すべてのモデルでそのままルーティング。
| モデル | ストリーミング | ツール | 構造化出力 | ビジョン | エンベディング | オーディオ |
|---|---|---|---|---|---|---|
| anthropic/claude-opus-4.8 | 対応 | 対応 | 対応 | 対応 | 非対応 | 非対応 |
| google/gemini-3.1-pro-preview | 対応 | 対応 | 対応 | 対応 | 非対応 | 対応 |
| openai/gpt-5.5-pro | 対応 | 対応 | 対応 | 対応 | 非対応 | 非対応 |
| anthropic/claude-opus-4.7 | 対応 | 対応 | 対応 | 対応 | 非対応 | 非対応 |
| grok/grok-4.3 | 対応 | 対応 | 対応 | 対応 | 非対応 | 非対応 |
トークン支出から一切を取ることはありません。収益はオプションのチーム機能から得られます。
監査レポートはNDAのもとで提供しています。以下からコピーをご請求ください。
1行を差し替えるだけ。それが移行のすべて。
GitHubでサインアップ — $5分のトークンが無料。クレジットカード不要。1分以内に稼働。