OrcaRouter weist jeden Prompt dem passenden Modell zu: komplexes Reasoning an Frontier-Modelle, Routinearbeit an Open-Source-Modelle. Sie erhalten Frontier-Qualität, wenn sie zählt, und zahlen sonst Open-Source-Preise. Kein Aufschlag. Keine Migration. Eine API.
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="gpt-4o",messages=[{"role": "user", "content": "..."}])# → routed to cheapest live backend, zero markup ✓
Ihr Traffic fließt ohne dazwischengeschalteten Schatten-Proxy direkt an den Upstream-Provider. Der Provider in Ihren Logs ist der, der die Anfrage tatsächlich bedient hat.
Die Daten- und Nutzungsbedingungen jedes Upstream-Providers gelten direkt für Ihren Traffic. Wählen Sie den Provider, der zu Ihrer Policy passt.
Jeder Aufruf protokolliert Provider, öffentlichen Preis und gewählten Pfad. Jede Routing-Entscheidung lässt sich später im Dashboard nachvollziehen.
Eine URL-Änderung. Ihr SDK, Modellnamen und Streaming funktionieren genau wie zuvor.
Setzen Sie base_url auf api.orcarouter.ai/v1 und tauschen Sie Ihren API-Schlüssel. Keine weiteren Codeänderungen nötig.
Jede Anfrage prüft Live-Anbieterzustand und Preise in unter 1 ms. Wir wählen das günstigste verfügbare direkte Backend.
Verkehr geht direkt zum Anbieter. Sie zahlen deren veröffentlichten Tarif an sie. Wir legen genau $0 oben drauf — unsere Gebühr ist auf den Plan, nicht Ihre Token.
Echtzeit-Routing zum günstigsten verfügbaren Backend. Preise werden alle 60 Sek. aktualisiert.
| Modell | Weitergeleitet an | Input /M | Output /M | Kontext | Qualität |
|---|---|---|---|---|---|
| claude-opus-4-7 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| claude-sonnet-4-6 | Anthropic Direct | $3.00 | $15.00 | 1M | 7.0 |
| gpt-5.5 | OpenAI Direct | $5.00 | $30.00 | 1M | 10.0 |
| gemini-3.1-pro-preview | Google Direct | $4.00 | $18.00 | 1M | 10.0 |
| deepseek-v4-pro | DeepSeek | $0.560 | $1.12 | 1M | 9.0 |
| qwen3.6-plus | Alibaba Cloud | $0.500 | $3.00 | 1M | 8.0 |
| kimi-k2.6 | Moonshot | $0.900 | $3.75 | 256K | 9.0 |
| seedance-2.0 | ByteDance | from $0.07 /sec | — | — | 10.0 |
| + 194 weitere Modelle · Preise alle 60 Sek. aktualisiert | |||||
Alles für den produktiven Betrieb von KI, ohne mehrere Anbieterintegrationen zu verwalten.
Anbieterpreise werden alle 60 Sek. aktualisiert. Jede Anfrage trifft das günstigste verfügbare Backend.
Anbieter fällt mitten im Stream aus? Wir wechseln transparent. Ihre App sieht null Fehler.
Schlüssel pro Team oder Dienst mit integrierten Ausgabelimits, Modell-Whitelists und Rate-Limits ausgeben.
Sehen Sie genau, was jede Anfrage gekostet hat, welcher Anbieter sie bearbeitet hat und wie viel Sie gespart haben.
Eine Zeile ändern. Gleiches SDK, gleiche Modellnamen, gleiches Streaming-Format. Null Migrationsaufwand.
Harte und weiche Limits pro Schlüssel, Team oder Organisation. Automatische monatliche Rücksetzung. Slack + Webhook-Alerts.
Jede Anfrage zeigt Ihnen den bedienenden Provider, dessen veröffentlichten Preis und den gewählten Pfad. Pro Aufruf überprüfbar und später reproduzierbar.
Jede Vervollständigung wird mit dem Upstream-Provider — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — markiert und in Dashboard und Headern angezeigt.
Jede Token-Berechnung entspricht dem öffentlichen Listenpreis des Providers. Sie können jede Anfrage in Sekunden mit der Preisseite des Providers abgleichen.
Failover-Ereignisse, Health-Swaps und Entscheidungen für das günstigste Backend werden mit Zeitstempel protokolliert. Sie können den Routing-Pfad jeder Anfrage nachvollziehen.
Wir nehmen nie einen Schnitt Ihrer Token-Ausgaben. Unser Umsatz kommt von optionalen Team-Features.
Mit GitHub anmelden — $5 in Tokens kostenlos. Keine Kreditkarte erforderlich. Tauschen Sie eine Zeile Code und Sie sind live.
OrcaRouter