OrcaRouter — Eén AI-gateway: adaptieve LLM-routing & governance

AI-gateway voor productie

Slimme routering en automatische failover bij elk verzoek.

Routering die meetbaar nauwkeuriger is.

Elke prompt wordt geëmbed en gerouteerd door een model dat online blijft leren van echt verkeer. Op het openbare RouterArena-leaderboard (jun 2026) staat het bovenaan qua nauwkeurigheid — vóór GPT-5, Azure, Martian en NotDiamond — met 75,5%.

contextual embeddingsonline learning<1ms overheadRouterArena

* Op basis van RouterArena-leaderboardgegevens, juni 2026.

Een provider valt uit. Niemand merkt het.

Wanneer een provider een rate-limit oplegt of 5xx's geeft, probeert OrcaRouter het verzoek opnieuw bij een gezond model uit 200+ opties voordat het antwoord begint — zodat tijdelijke storingen bovenstrooms niet zichtbaar worden voor uw gebruikers.

200+ modelsauto-failoverno 429

Routeer op jouw voorwaarden.

orcarouter/auto is een slimme standaard, geen black box. Wijs elke werkruimte op het doel dat je wilt — het goedkoopste model dat je kwaliteitslat haalt, de hoogste kwaliteit of een balans tussen beide — of laat het de afweging leren van je eigen verkeer. Je zit nooit vast aan één gedrag.

per-workspaceno markup either way<1ms overhead

Zie en bewijs elke aanroep — kosten, model, latentie en waarom.

Zie alles. Bewijs alles.

Zie precies wat elk verzoek kostte, welk model het bediende, hoe lang het duurde en waarom het mislukte — volledige gestructureerde logs die u kunt filteren, opnieuw afspelen en kopiëren als een uitvoerbare cURL. Een route is nooit een black box.

Per-request logsgrade · model · costcopy-as-cURL

Geen marge. Geen black boxes.

U betaalt elke provider zijn exacte prijs — wij voegen nooit $0 per token toe. Elk verzoek toont de beoordeling, het gekozen model, de provider, de latentie en de prijs, zodat de kosten een glass-box zijn, geen ondoorzichtig gemengd tarief.

$0 / tokenprovider costglass-box receipt

Versiebeheerde prompts en caching — zonder herimplementatie.

Wijzig prompts. Geen code.

Versiebeheer prompts achter benoemde labels met A/B-splitsingen en rollback met één klik. Verplaats een label en elk verzoek pikt het direct op — geen herimplementatie, geen codewijziging, geen client-update.

VersionedA/BInstant rollbackNo deploy

Eén keer betalen. Gratis hergebruiken.

Herhaalde en gecachete prompttokens worden afgerekend tegen het cachetarief van de provider — vaak een fractie van de invoerprijs — over efemere vensters van 5 minuten en 1 uur. Dezelfde antwoorden, lagere kosten, met cached_tokens op elke bon.

cache_controlcached_tokens5m / 1h windows

Guardrails, budgetten en een agent-firewall die afdwingt.

Guardrails die dingen tegenhouden.

PII Shield en contentbeleid draaien voordat de bovenstroomse aanroep wordt afgerekend. Een geblokkeerd verzoek geeft een nette 400 terug en wordt nooit in rekening gebracht — guardrails inline afgedwongen, niet achteraf gelogd.

PII Shieldenforced pre-billingclean 400

Veilig voor uw team. En uw agents.

Budgetten en rollen voor mensen; een risicobeoordeelde firewall voor agents. Elke tool- en MCP-aanroep wordt beoordeeld als ALLOW, REVIEW of BLOCK voordat die wordt uitgevoerd, en anomaliedetectie markeert piekende snelheid en kosten ten opzichte van geleerde baselines per uur van de week.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection

Gebouwd voor het agent-tijdperk. Voordat u het nodig had.

Volledige controle

Meer nodig dan een modus? Schrijf de regel.

Wanneer de standaard niet genoeg is, druk je routering uit als code — versiebeheerd, beoordeelbaar en binnen seconden live. Geen herdeployment, geen clientwijziging.

routing.yaml

version: 1
rules:
  - id: hard_agent_task
    when: task_class == "agent" && difficulty >= 0.6
    use:
      model: "claude-opus-4-7"
      reasoning_effort: high   # spend where it matters
  - id: short_prompts
    when: request.input_tokens < 500
    use: { delegate: cheapest }
default:
  delegate: balanced   # fall back to the chosen mode

YAML + CELversion-controlledlive in seconds

Routeringsdocumentatie verkennen

Configuratie

Live in 60 seconden.

Eén URL-wijziging. Je bestaande SDK, modelnamen en streaming werken precies als voorheen.

Stap 1

🔗

Richt je SDK op ons

Stel base_url in op api.orcarouter.ai/v1 en wissel je API-sleutel om. Geen andere codewijzigingen nodig.

→

Stap 2

⚡

Wij routeren, bewaken & observeren

Elke aanroep wordt gerouteerd naar het beste model, getoetst aan je guardrails en gemeten — gegradeerd in minder dan 1ms, met failover, caching en volledige logs ingebouwd.

→

Stap 3

✓

Jij levert, op één endpoint

Verkeer gaat rechtstreeks naar de first-party API van elke provider tegen hun gepubliceerde tarief — we voegen $0 per token toe. Eén OpenAI-compatibel endpoint voor routering, observability en governance.

Elk model. Eén prijslijst.

200+ modellen met live, zij-aan-zij prijzen — wat u de provider rechtstreeks zou betalen. Wij voegen er $0 bovenop toe.

Alle 200+ modellen bekijken →

Model	Gerouteerd naar	Invoer /M	Uitvoer /M	Context	Kwaliteit
z-ai/glm-5.2NEW	Zhipu AI	$1.40	$4.40	1M	9.0
kimi/kimi-k2.7-codeNEW	Moonshot	$0.950	$4.00	262K	8.0
qwen/qwen3.7-plusNEW	Alibaba Cloud	$0.350	$1.42	1M	8.0
minimax/minimax-m3NEW	—	$0.300	$1.20	1M	9.0
anthropic/claude-opus-4.8NEW	Anthropic Direct	$5.00	$25.00	1M	10.0
google/gemini-3.5-flashNEW	Google Direct	$1.50	$9.00	1M	9.0
qwen/qwen3.7-maxNEW	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.7-max-2026-05-20NEW	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.6-flash	Alibaba Cloud	$0.250	$1.50	1M	7.0
qwen/qwen3.6-35b-a3b	Alibaba Cloud	$0.248	$1.48	262K	8.0
openai/gpt-5.5-pro	OpenAI Direct	$30.00	$180.00	—	10.0
openai/gpt-5.5	OpenAI Direct	$5.00	$30.00	—	10.0
deepseek/deepseek-v4-pro	DeepSeek	$0.456	$0.910	1M	9.0
deepseek/deepseek-v4-flash	DeepSeek	$0.147	$0.294	1M	8.0
anthropic/claude-opus-4.7	Anthropic Direct	$5.00	$25.00	1M	10.0
+ 194 modellen meer · Prijzen worden elke 60 seconden bijgewerkt

Alles wat uw OpenAI-client al aanroept.

Streaming, tool calls, gestructureerde uitvoer, vision, embeddings en audio — onveranderd gerouteerd naar elk model.

Model	Streaming	Tools	Gestructureerd	Vision	Embeddings	Audio
google/gemini-3.1-pro-preview	ondersteund	ondersteund	ondersteund	ondersteund	niet ondersteund	ondersteund
anthropic/claude-opus-4.7	ondersteund	ondersteund	ondersteund	ondersteund	niet ondersteund	niet ondersteund
openai/gpt-5.5-pro	ondersteund	ondersteund	ondersteund	ondersteund	niet ondersteund	niet ondersteund
anthropic/claude-opus-4.8	ondersteund	ondersteund	ondersteund	ondersteund	niet ondersteund	niet ondersteund
grok/grok-4.3	ondersteund	ondersteund	ondersteund	ondersteund	niet ondersteund	niet ondersteund

Prijzen

Routering is gratis.
Betaal voor functies.

We nemen nooit een deel van je token-uitgaven. Onze omzet komt uit optionele teamfuncties.

Garantie van nul marge

Je betaalt providers rechtstreeks tegen hun gepubliceerde tarieven. We voegen niets toe bovenop de tokenkosten. Routering is gratis; het optionele Team-abonnement financiert het platform.

$0.00routeringskosten

Hacker

Gratis

Voor altijd. Nul marge op alle tokens.

✓ Route — 200+ modellen, auto-failover

✓ Observeren — basisdashboard

✓ Beheren — promptversionering

✓ 3 API-sleutels · 0% tokenmarge

Gratis starten

Team

$499/mo

Nog steeds geen marge. Betaal voor functies.

✓ Alles in Hacker

✓ Tot 10 teamplaatsen

✓ Compliance-handhaving & rapporten

✓ Onbeperkte API-sleutels

✓ Prioriteitssupport

Aan de slag →

Enterprise

Op maat

SLA-toezeggingen + private implementatie.

✓ Alles in Team

✓ Privé / on-prem implementatie

✓ 99,99% uptime-SLA

✓ Toegewijde infrastructuur

✓ Toegewijde support en aangepaste prijzen

Eén gateway. Elk model. Routeer slimmer. Lever veiliger. Geef minder uit.

Werkt met de tools die u al gebruikt

Routering die meetbaar nauwkeuriger is.

Een provider valt uit. Niemand merkt het.

Routeer op jouw voorwaarden.

Zie alles. Bewijs alles.

Geen marge. Geen black boxes.

Wijzig prompts. Geen code.

Eén keer betalen. Gratis hergebruiken.

Guardrails die dingen tegenhouden.

Veilig voor uw team. En uw agents.

Meer nodig dan een modus? Schrijf de regel.

Live in 60 seconden.

Richt je SDK op ons

Wij routeren, bewaken & observeren

Jij levert, op één endpoint

Elk model. Eén prijslijst.

Alles wat uw OpenAI-client al aanroept.

Routering is gratis.
Betaal voor functies.

Hacker

Team

Enterprise

Onafhankelijk geaudit. Doorlopend compliant.

Slimmer, veiliger, kostenefficiënt.

Product

Bronnen

Juridisch

Verbinden

Eén gateway. Elk model. Routeer slimmer. Lever veiliger. Geef minder uit.

Werkt met de tools die u al gebruikt

Routering die meetbaar nauwkeuriger is.

Een provider valt uit. Niemand merkt het.

Routeer op jouw voorwaarden.

Zie alles. Bewijs alles.

Geen marge. Geen black boxes.

Wijzig prompts. Geen code.

Eén keer betalen. Gratis hergebruiken.

Guardrails die dingen tegenhouden.

Veilig voor uw team. En uw agents.

Meer nodig dan een modus? Schrijf de regel.

Live in 60 seconden.

Richt je SDK op ons

Wij routeren, bewaken & observeren

Jij levert, op één endpoint

Elk model. Eén prijslijst.

Alles wat uw OpenAI-client al aanroept.

Routering is gratis.Betaal voor functies.

Hacker

Team

Enterprise

Onafhankelijk geaudit. Doorlopend compliant.

Slimmer, veiliger, kostenefficiënt.

Product

Bronnen

Juridisch

Verbinden

Routering is gratis.
Betaal voor functies.