Frontier-Qualität. Open-Source-Preise.

Eine API. Jedes Modell. Null Zwischenhändler.

OrcaRouter weist jeden Prompt dem passenden Modell zu: komplexes Reasoning an Frontier-Modelle, Routinearbeit an Open-Source-Modelle. Sie erhalten Frontier-Qualität, wenn sie zählt, und zahlen sonst Open-Source-Preise. Kein Aufschlag. Keine Migration. Eine API.

- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="gpt-4o",
messages=[{"role": "user", "content": "..."}]
)
# → routed to cheapest live backend, zero markup ✓
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
0%
Routing-Aufschlag. Jemals.
~40%
ø Kostenreduktion vs Listenpreis
200+
Modelle über 10+ Anbieter
<1ms
zusätzlicher Routing-Overhead
Baust du damit? Sag uns Bescheid.
Dein Feedback formt das nächste Release.
Wie das Routing funktioniert

Pass-Through nach Konstruktion.

Direkte Provider-Weiterleitung

Ihr Traffic fließt ohne dazwischengeschalteten Schatten-Proxy direkt an den Upstream-Provider. Der Provider in Ihren Logs ist der, der die Anfrage tatsächlich bedient hat.

Provider-Bedingungen gelten Ende-zu-Ende

Die Daten- und Nutzungsbedingungen jedes Upstream-Providers gelten direkt für Ihren Traffic. Wählen Sie den Provider, der zu Ihrer Policy passt.

🧾

Nachvollziehbarkeit pro Anfrage

Jeder Aufruf protokolliert Provider, öffentlichen Preis und gewählten Pfad. Jede Routing-Entscheidung lässt sich später im Dashboard nachvollziehen.


Einrichtung

In 60 Sekunden live.

Eine URL-Änderung. Ihr SDK, Modellnamen und Streaming funktionieren genau wie zuvor.

Schritt 1
🔗

SDK auf uns zeigen

Setzen Sie base_url auf api.orcarouter.ai/v1 und tauschen Sie Ihren API-Schlüssel. Keine weiteren Codeänderungen nötig.

Schritt 2

Wir routen in Echtzeit

Jede Anfrage prüft Live-Anbieterzustand und Preise in unter 1 ms. Wir wählen das günstigste verfügbare direkte Backend.

Schritt 3

Sie zahlen Anbieterkosten

Verkehr geht direkt zum Anbieter. Sie zahlen deren veröffentlichten Tarif an sie. Wir legen genau $0 oben drauf — unsere Gebühr ist auf den Plan, nicht Ihre Token.


Live-Preise

Jedes Modell.
Beste verfügbare Rate.

Echtzeit-Routing zum günstigsten verfügbaren Backend. Preise werden alle 60 Sek. aktualisiert.

Alle 200+ Modelle ansehen →
ModellWeitergeleitet anInput /MOutput /MKontextQualität
claude-opus-4-7Anthropic Direct$5.00$25.001M10.0
claude-sonnet-4-6Anthropic Direct$3.00$15.001M7.0
gpt-5.5OpenAI Direct$5.00$30.001M10.0
gemini-3.1-pro-previewGoogle Direct$4.00$18.001M10.0
deepseek-v4-proDeepSeek$0.560$1.121M9.0
qwen3.6-plusAlibaba Cloud$0.500$3.001M8.0
kimi-k2.6Moonshot$0.900$3.75256K9.0
seedance-2.0ByteDancefrom $0.07 /sec10.0
+ 194 weitere Modelle · Preise alle 60 Sek. aktualisiert
Plattform

Produktionstauglich vom ersten Tag an.

Alles für den produktiven Betrieb von KI, ohne mehrere Anbieterintegrationen zu verwalten.

Echtzeit-Preisrouting

Anbieterpreise werden alle 60 Sek. aktualisiert. Jede Anfrage trifft das günstigste verfügbare Backend.

Automatische Ausfallsicherung

Anbieter fällt mitten im Stream aus? Wir wechseln transparent. Ihre App sieht null Fehler.

🔑

API-Schlüsselverwaltung

Schlüssel pro Team oder Dienst mit integrierten Ausgabelimits, Modell-Whitelists und Rate-Limits ausgeben.

$

Kostenverfolgung pro Anfrage

Sehen Sie genau, was jede Anfrage gekostet hat, welcher Anbieter sie bearbeitet hat und wie viel Sie gespart haben.

OpenAI-kompatibel

Eine Zeile ändern. Gleiches SDK, gleiche Modellnamen, gleiches Streaming-Format. Null Migrationsaufwand.

🛡

Budget-Durchsetzung

Harte und weiche Limits pro Schlüssel, Team oder Organisation. Automatische monatliche Rücksetzung. Slack + Webhook-Alerts.


Alleinstellungsmerkmal

Glass-Box-Routing.

Jede Anfrage zeigt Ihnen den bedienenden Provider, dessen veröffentlichten Preis und den gewählten Pfad. Pro Aufruf überprüfbar und später reproduzierbar.

🔍

Provider-Zuordnung pro Anfrage

Jede Vervollständigung wird mit dem Upstream-Provider — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — markiert und in Dashboard und Headern angezeigt.

📒

Listenpreis-Hauptbuch

Jede Token-Berechnung entspricht dem öffentlichen Listenpreis des Providers. Sie können jede Anfrage in Sekunden mit der Preisseite des Providers abgleichen.

Wiedergabbare Routing-Entscheidungen

Failover-Ereignisse, Health-Swaps und Entscheidungen für das günstigste Backend werden mit Zeitstempel protokolliert. Sie können den Routing-Pfad jeder Anfrage nachvollziehen.


Preise

Routing ist kostenlos.
Bezahlen Sie für Features.

Wir nehmen nie einen Schnitt Ihrer Token-Ausgaben. Unser Umsatz kommt von optionalen Team-Features.

Null-Aufschlag-Garantie
Sie zahlen Anbietern direkt deren veröffentlichte Sätze. Wir fügen nichts auf Token-Kosten hinzu. Routing ist kostenlos; der optionale Team-Plan finanziert die Plattform.
$0.00Routing-Gebühr

Hacker

Kostenlos
Für immer. Null Aufschlag auf alle Token.
✓ 3 API-Schlüssel
✓ Alle 200+ Modelle
✓ Auto-Failover
✓ Basis-Dashboard
Kostenlos starten

Enterprise

Individuell
SLA-Zusagen + private Bereitstellung.
✓ Option für private Bereitstellung
✓ Benutzerdefinierte Routing-Regeln
✓ 99,99 % Uptime-SLA
✓ Dedizierter Support
✓ Audit-Logs & Compliance

Starten Sie intelligenteres Routing.

Mit GitHub anmelden — $5 in Tokens kostenlos. Keine Kreditkarte erforderlich. Tauschen Sie eine Zeile Code und Sie sind live.