Eén gateway · elk model · al uw AI-verkeer

Eén gateway. Elk model. Routeer slimmer. Lever veiliger. Geef minder uit.

OrcaRouter beoordeelt elke prompt en routeert die intelligent. AI van topkwaliteit tegen tot 40% lagere kosten. Adaptieve routering, load balancing, guardrails, agent-firewall, observability en governance — allemaal via één OpenAI-compatibel endpoint.

Geen creditcard · binnen 60 sec. live

Verslaat GPT-5 en Azure op RouterArenaOnderbouwd door gepubliceerd onderzoek
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Eén regel. Wij beoordelen elke prompt, routeren naar frontier of OSS, en voegen $0 toe.

Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
200+
modellen, één endpoint
0%
tokenmarge, ooit
75.5%
routeringsnauwkeurigheid
<50ms
failover midden in de stream
Hierop aan het bouwen? Neem contact met ons op.
Feedback bepaalt de volgende release.
Integraties

Werkt met de tools die u al gebruikt

Drop-in OpenAI-compatibel, of verbind agents via de OrcaRouter MCP-server — behoud uw SDK, framework en editor.

OrcaRouter MCP-serverOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLen meer
AI-gateway voor productie

Slimme routering en automatische failover bij elk verzoek.

Routering die meetbaar nauwkeuriger is.

Elke prompt wordt geëmbed en gerouteerd door een model dat online blijft leren van echt verkeer. Op het openbare RouterArena-leaderboard (jun 2026) staat het bovenaan qua nauwkeurigheid — vóór GPT-5, Azure, Martian en NotDiamond — met 75,5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* Op basis van RouterArena-leaderboardgegevens, juni 2026.

Een provider valt uit. Niemand merkt het.

Wanneer een provider een rate-limit oplegt of 5xx's geeft, probeert OrcaRouter het verzoek opnieuw bij een gezond model uit 200+ opties voordat het antwoord begint — zodat tijdelijke storingen bovenstrooms niet zichtbaar worden voor uw gebruikers.

200+ modelsauto-failoverno 429

Routeer op jouw voorwaarden.

orcarouter/auto is een slimme standaard, geen black box. Wijs elke werkruimte op het doel dat je wilt — het goedkoopste model dat je kwaliteitslat haalt, de hoogste kwaliteit of een balans tussen beide — of laat het de afweging leren van je eigen verkeer. Je zit nooit vast aan één gedrag.

per-workspaceno markup either way<1ms overhead

Zie en bewijs elke aanroep — kosten, model, latentie en waarom.

Zie alles. Bewijs alles.

Zie precies wat elk verzoek kostte, welk model het bediende, hoe lang het duurde en waarom het mislukte — volledige gestructureerde logs die u kunt filteren, opnieuw afspelen en kopiëren als een uitvoerbare cURL. Een route is nooit een black box.

Per-request logsgrade · model · costcopy-as-cURL

Geen marge. Geen black boxes.

U betaalt elke provider zijn exacte prijs — wij voegen nooit $0 per token toe. Elk verzoek toont de beoordeling, het gekozen model, de provider, de latentie en de prijs, zodat de kosten een glass-box zijn, geen ondoorzichtig gemengd tarief.

$0 / tokenprovider costglass-box receipt

Versiebeheerde prompts en caching — zonder herimplementatie.

Wijzig prompts. Geen code.

Versiebeheer prompts achter benoemde labels met A/B-splitsingen en rollback met één klik. Verplaats een label en elk verzoek pikt het direct op — geen herimplementatie, geen codewijziging, geen client-update.

VersionedA/BInstant rollbackNo deploy

Eén keer betalen. Gratis hergebruiken.

Herhaalde en gecachete prompttokens worden afgerekend tegen het cachetarief van de provider — vaak een fractie van de invoerprijs — over efemere vensters van 5 minuten en 1 uur. Dezelfde antwoorden, lagere kosten, met cached_tokens op elke bon.

cache_controlcached_tokens5m / 1h windows

Guardrails, budgetten en een agent-firewall die afdwingt.

Guardrails die dingen tegenhouden.

PII Shield en contentbeleid draaien voordat de bovenstroomse aanroep wordt afgerekend. Een geblokkeerd verzoek geeft een nette 400 terug en wordt nooit in rekening gebracht — guardrails inline afgedwongen, niet achteraf gelogd.

PII Shieldenforced pre-billingclean 400

Veilig voor uw team. En uw agents.

Budgetten en rollen voor mensen; een risicobeoordeelde firewall voor agents. Elke tool- en MCP-aanroep wordt beoordeeld als ALLOW, REVIEW of BLOCK voordat die wordt uitgevoerd, en anomaliedetectie markeert piekende snelheid en kosten ten opzichte van geleerde baselines per uur van de week.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Gebouwd voor het agent-tijdperk. Voordat u het nodig had.

Volledige controle

Meer nodig dan een modus? Schrijf de regel.

Wanneer de standaard niet genoeg is, druk je routering uit als code — versiebeheerd, beoordeelbaar en binnen seconden live. Geen herdeployment, geen clientwijziging.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Configuratie

Live in 60 seconden.

Eén URL-wijziging. Je bestaande SDK, modelnamen en streaming werken precies als voorheen.

Stap 1
🔗

Richt je SDK op ons

Stel base_url in op api.orcarouter.ai/v1 en wissel je API-sleutel om. Geen andere codewijzigingen nodig.

Stap 2

Wij routeren, bewaken & observeren

Elke aanroep wordt gerouteerd naar het beste model, getoetst aan je guardrails en gemeten — gegradeerd in minder dan 1ms, met failover, caching en volledige logs ingebouwd.

Stap 3

Jij levert, op één endpoint

Verkeer gaat rechtstreeks naar de first-party API van elke provider tegen hun gepubliceerde tarief — we voegen $0 per token toe. Eén OpenAI-compatibel endpoint voor routering, observability en governance.


Elk model. Eén prijslijst.

200+ modellen met live, zij-aan-zij prijzen — wat u de provider rechtstreeks zou betalen. Wij voegen er $0 bovenop toe.

Alle 200+ modellen bekijken →
ModelGerouteerd naarInvoer /MUitvoer /MContextKwaliteit
z-ai/glm-5.2NEWZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeNEWMoonshot$0.950$4.00262K8.0
qwen/qwen3.7-plusNEWAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3NEW$0.300$1.201M9.0
anthropic/claude-opus-4.8NEWAnthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashNEWGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxNEWAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20NEWAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
openai/gpt-5.5-proOpenAI Direct$30.00$180.0010.0
openai/gpt-5.5OpenAI Direct$5.00$30.0010.0
deepseek/deepseek-v4-proDeepSeek$0.456$0.9101M9.0
deepseek/deepseek-v4-flashDeepSeek$0.147$0.2941M8.0
anthropic/claude-opus-4.7Anthropic Direct$5.00$25.001M10.0
+ 194 modellen meer · Prijzen worden elke 60 seconden bijgewerkt

Alles wat uw OpenAI-client al aanroept.

Streaming, tool calls, gestructureerde uitvoer, vision, embeddings en audio — onveranderd gerouteerd naar elk model.

ModelStreamingToolsGestructureerdVisionEmbeddingsAudio
google/gemini-3.1-pro-previewondersteundondersteundondersteundondersteundniet ondersteundondersteund
anthropic/claude-opus-4.7ondersteundondersteundondersteundondersteundniet ondersteundniet ondersteund
openai/gpt-5.5-proondersteundondersteundondersteundondersteundniet ondersteundniet ondersteund
anthropic/claude-opus-4.8ondersteundondersteundondersteundondersteundniet ondersteundniet ondersteund
grok/grok-4.3ondersteundondersteundondersteundondersteundniet ondersteundniet ondersteund
Prijzen

Routering is gratis.
Betaal voor functies.

We nemen nooit een deel van je token-uitgaven. Onze omzet komt uit optionele teamfuncties.

Garantie van nul marge
Je betaalt providers rechtstreeks tegen hun gepubliceerde tarieven. We voegen niets toe bovenop de tokenkosten. Routering is gratis; het optionele Team-abonnement financiert het platform.
$0.00routeringskosten

Hacker

Gratis
Voor altijd. Nul marge op alle tokens.
✓ Route — 200+ modellen, auto-failover
✓ Observeren — basisdashboard
✓ Beheren — promptversionering
✓ 3 API-sleutels · 0% tokenmarge
Gratis starten

Enterprise

Op maat
SLA-toezeggingen + private implementatie.
✓ Alles in Team
✓ Privé / on-prem implementatie
✓ 99,99% uptime-SLA
✓ Toegewijde infrastructuur
✓ Toegewijde support en aangepaste prijzen
Vertrouwen en compliance

Onafhankelijk geaudit. Doorlopend compliant.

Auditrapporten beschikbaar onder NDA — vraag hieronder een kopie aan.

Slimmer, veiliger, kostenefficiënt.

Vervang één regel. Dat is de migratie.

Registreren met GitHub — $5 aan tokens gratis. Geen creditcard nodig. U bent binnen een minuut live.