Satu gateway · setiap model · semua lalu lintas AI Anda

Satu Gateway. Setiap Model. Rutekan Lebih Cerdas. Rilis Lebih Aman. Hemat Lebih Banyak.

OrcaRouter menilai setiap prompt dan merutekannya secara cerdas. AI berkualitas frontier dengan biaya hingga 40% lebih rendah. Perutean adaptif, penyeimbangan beban, guardrail, firewall agen, observabilitas, dan tata kelola — semua melalui satu endpoint yang kompatibel dengan OpenAI.

Tanpa kartu kredit · aktif dalam 60 detik

Mengungguli GPT-5 & Azure di RouterArenaDidukung riset yang dipublikasikan
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Satu baris. Kami menilai setiap prompt, merutekan ke frontier atau OSS, dan menambahkan $0.

Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
200+
model, satu endpoint
0%
markup token, selamanya
75.5%
akurasi perutean
<50ms
failover di tengah-stream
Sedang membangun dengan ini? Bicara dengan kami.
Masukan membentuk rilis berikutnya.
Integrasi

Bekerja dengan alat yang sudah Anda gunakan

Drop-in kompatibel-OpenAI, atau hubungkan agen melalui server MCP OrcaRouter — pertahankan SDK, framework, dan editor Anda.

Server MCP OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLdan lainnya
Gateway AI untuk produksi

Perutean cerdas dan failover otomatis di setiap permintaan.

Perutean yang terukur lebih akurat.

Setiap prompt disematkan dan dirutekan oleh model yang terus belajar secara online dari lalu lintas nyata. Di papan peringkat publik RouterArena (Jun 2026), ia memimpin dalam akurasi — di depan GPT-5, Azure, Martian, dan NotDiamond — pada 75,5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* Berdasarkan data papan peringkat RouterArena, Juni 2026.

Sebuah penyedia mati. Tidak ada yang menyadarinya.

Saat sebuah penyedia membatasi laju atau 5xx, OrcaRouter mencoba lagi permintaan ke model yang sehat di antara 200+ opsi sebelum respons dimulai — sehingga gangguan upstream sementara tidak muncul ke pengguna Anda.

200+ modelsauto-failoverno 429

Perutean sesuai keinginan Anda.

orcarouter/auto adalah default cerdas, bukan kotak hitam. Arahkan setiap ruang kerja ke tujuan yang Anda inginkan — model termurah yang melampaui standar kualitas Anda, kualitas tertinggi, atau keseimbangan keduanya — atau biarkan ia mempelajari trade-off dari lalu lintas Anda sendiri. Anda tidak pernah terkunci pada satu perilaku.

per-workspaceno markup either way<1ms overhead

Lihat dan buktikan setiap panggilan — biaya, model, latensi, dan alasannya.

Lihat semuanya. Buktikan apa pun.

Lihat persis berapa biaya setiap permintaan, model mana yang melayaninya, berapa lama waktunya, dan mengapa gagal — log terstruktur lengkap yang dapat Anda filter, putar ulang, dan salin sebagai cURL yang dapat dijalankan. Sebuah rute tidak pernah jadi kotak hitam.

Per-request logsgrade · model · costcopy-as-cURL

Tanpa markup. Tanpa kotak hitam.

Anda membayar setiap penyedia dengan harga persisnya — kami menambah $0 per token, selamanya. Setiap permintaan menampilkan nilai, model terpilih, penyedia, latensi, dan harga, sehingga biaya bersifat kotak kaca, bukan tarif gabungan yang buram.

$0 / tokenprovider costglass-box receipt

Prompt berversi dan caching — tanpa redeploy.

Ubah prompt. Bukan kode.

Buat versi prompt di balik label bernama dengan pembagian A/B dan rollback satu klik. Pindahkan sebuah label dan setiap permintaan langsung mengikutinya — tanpa redeploy, tanpa perubahan kode, tanpa pembaruan klien.

VersionedA/BInstant rollbackNo deploy

Bayar sekali. Pakai ulang gratis.

Token prompt yang berulang dan ter-cache ditagih dengan tarif cache penyedia — sering kali sebagian kecil dari harga input — lintas jendela ephemeral 5 menit dan 1 jam. Jawaban yang sama, pengeluaran lebih sedikit, dengan cached_tokens di setiap struk.

cache_controlcached_tokens5m / 1h windows

Guardrail, anggaran, dan firewall agen yang menegakkan.

Guardrail yang menghentikan banyak hal.

PII Shield dan kebijakan konten berjalan sebelum panggilan upstream ditagih. Permintaan yang diblokir mengembalikan 400 yang bersih dan tidak pernah dikenai biaya — guardrail ditegakkan inline, bukan dicatat setelahnya.

PII Shieldenforced pre-billingclean 400

Aman untuk tim Anda. Dan agen Anda.

Anggaran dan peran untuk orang; firewall berskor risiko untuk agen. Setiap panggilan alat dan MCP dinilai ALLOW, REVIEW, atau BLOCK sebelum dijalankan, dan deteksi anomali menandai lonjakan laju dan biaya terhadap baseline jam-dalam-minggu yang dipelajari.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Dibuat untuk era agen. Sebelum Anda membutuhkannya.

Kontrol penuh

Butuh lebih dari sekadar mode? Tulis aturannya.

Saat default tidak cukup, ekspresikan perutean sebagai kode — terkontrol-versi, dapat ditinjau, dan aktif dalam hitungan detik. Tanpa redeploy, tanpa perubahan klien.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Penyiapan

Aktif dalam 60 detik.

Satu perubahan URL. SDK, nama model, dan streaming Anda yang ada semuanya berfungsi persis seperti sebelumnya.

Langkah 1
🔗

Arahkan SDK Anda ke kami

Atur base_url ke api.orcarouter.ai/v1 dan ganti kunci API Anda. Tidak perlu perubahan kode lainnya.

Langkah 2

Kami merutekan, menjaga & mengamati

Setiap panggilan dirutekan ke model terbaik, diperiksa terhadap guardrail Anda, dan diukur — dinilai dalam kurang dari 1ms, dengan failover, caching, dan log lengkap bawaan.

Langkah 3

Anda rilis, di satu endpoint

Lalu lintas langsung ke API pihak-pertama setiap penyedia pada tarif resmi mereka — kami menambahkan $0 per token. Satu endpoint kompatibel-OpenAI untuk perutean, observabilitas, dan tata kelola.


Setiap model. Satu daftar harga.

200+ model dengan harga langsung berdampingan — sesuai yang akan Anda bayar ke penyedia. Kami menambahkan $0 di atasnya.

Lihat semua 200+ model →
ModelDirutekan keInput /MOutput /MKonteksKualitas
z-ai/glm-5.2BARUZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeBARUMoonshot$0.950$4.00262K8.0
qwen/qwen3.7-plusBARUAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3BARU$0.300$1.201M9.0
anthropic/claude-opus-4.8BARUAnthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashBARUGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxBARUAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20BARUAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
openai/gpt-5.5-proOpenAI Direct$30.00$180.0010.0
openai/gpt-5.5OpenAI Direct$5.00$30.0010.0
deepseek/deepseek-v4-proDeepSeek$0.456$0.9101M9.0
deepseek/deepseek-v4-flashDeepSeek$0.147$0.2941M8.0
anthropic/claude-opus-4.7Anthropic Direct$5.00$25.001M10.0
+ 194 model lagi · Harga diperbarui setiap 60 detik

Semua yang sudah dipanggil klien OpenAI Anda.

Streaming, panggilan alat, keluaran terstruktur, vision, embedding, dan audio — dirutekan tanpa perubahan di setiap model.

ModelStreamingAlatTerstrukturVisionEmbeddingAudio
google/gemini-3.1-pro-previewdidukungdidukungdidukungdidukungtidak didukungdidukung
grok/grok-4.3didukungdidukungdidukungdidukungtidak didukungtidak didukung
openai/gpt-5.5-prodidukungdidukungdidukungdidukungtidak didukungtidak didukung
anthropic/claude-opus-4.7didukungdidukungdidukungdidukungtidak didukungtidak didukung
anthropic/claude-opus-4.8didukungdidukungdidukungdidukungtidak didukungtidak didukung
Harga

Perutean itu gratis.
Bayar untuk fitur.

Kami tidak pernah mengambil potongan dari pengeluaran token Anda. Pendapatan kami berasal dari fitur tim opsional.

Jaminan tanpa markup
Anda membayar penyedia secara langsung pada tarif resmi mereka. Kami tidak menambahkan apa pun di atas biaya token. Perutean gratis; paket Team opsional mendanai platform.
$0.00biaya perutean

Hacker

Gratis
Selamanya. Tanpa markup pada semua token.
✓ Rutekan — 200+ model, failover otomatis
✓ Amati — dasbor dasar
✓ Kelola — pembuatan versi prompt
✓ 3 kunci API · markup token 0%
Mulai gratis

Enterprise

Kustom
Komitmen SLA + deployment privat.
✓ Semua di Team
✓ Deployment privat / on-prem
✓ SLA uptime 99,99%
✓ Infrastruktur khusus
✓ Dukungan khusus & harga kustom
Kepercayaan & Kepatuhan

Diaudit secara independen. Patuh secara berkelanjutan.

Laporan audit tersedia di bawah NDA — minta salinan di bawah.

Lebih cerdas, lebih aman, hemat biaya.

Ganti satu baris. Itulah migrasinya.

Daftar dengan GitHub — token senilai $5 gratis. Tanpa kartu kredit. Anda aktif dalam kurang dari satu menit.

© 2026 OrcaRouter