Zero marży. Wyższa dostępność. Lepsze ceny.

Jedna brama. Każdy model. Routuj mądrzej. Wdrażaj bezpieczniej. Płać mniej.

OrcaRouter ocenia każdy prompt i inteligentnie go routuje. AI w czołowej jakości nawet o 40% taniej. Adaptacyjny routing, równoważenie obciążenia, guardraile, firewall dla agentów, obserwowalność i nadzór — wszystko przez jeden endpoint zgodny z OpenAI.

Bez karty kredytowej · gotowe w 60 s

Wyprzedza GPT-5 i Azure na RouterArenaPoparte opublikowanymi badaniami
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Jedna linia. Oceniamy każdy prompt, kierujemy go do modelu frontier lub OSS i doliczamy $0.

Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
200+
modeli, jeden endpoint
0%
narzutu na tokeny, nigdy
75.5%
dokładność routingu
<50ms
przełączanie w trakcie strumienia
Budujesz na tym? Porozmawiajmy.
Twoja opinia kształtuje kolejną wersję.
Integracje

Działa z narzędziami, których już używasz

Zgodność z OpenAI od ręki lub podłącz agentów przez serwer MCP OrcaRouter — zachowaj swój SDK, framework i edytor.

Serwer MCP OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLi więcej
Bramka AI dla produkcji

Inteligentny routing i automatyczne przełączanie przy każdym żądaniu.

Routing wymiernie dokładniejszy.

Każdy prompt jest osadzany i routowany przez model, który uczy się online na podstawie realnego ruchu. W publicznym rankingu RouterArena (Jun 2026) prowadzi pod względem dokładności — przed GPT-5, Azure, Martian i NotDiamond — z wynikiem 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* Na podstawie danych rankingu RouterArena, czerwiec 2026.

Dostawca pada. Nikt tego nie zauważa.

Gdy dostawca ogranicza ruch lub zwraca 5xx, OrcaRouter ponawia żądanie do sprawnego modelu spośród ponad 200 opcji zanim rozpocznie się odpowiedź — przejściowe awarie po stronie dostawcy nie docierają do Twoich użytkowników.

200+ modelsauto-failoverno 429

Routing na Twoich zasadach.

orcarouter/auto to inteligentne ustawienie domyślne, a nie czarna skrzynka. Skieruj każdą przestrzeń roboczą na wybrany cel — najtańszy model spełniający Twój próg jakości, najwyższą jakość albo równowagę między nimi — lub pozwól, by sam nauczył się kompromisu na podstawie Twojego ruchu. Nigdy nie jesteś przywiązany do jednego zachowania.

per-workspaceno markup either way<1ms overhead

Zobacz i udowodnij każde wywołanie — koszt, model, opóźnienie i dlaczego.

Zobacz wszystko. Udowodnij cokolwiek.

Zobacz dokładnie, ile kosztowało każde żądanie, który model je obsłużył, jak długo trwało i dlaczego się nie powiodło — pełne ustrukturyzowane logi, które możesz filtrować, odtwarzać i kopiować jako gotowe do uruchomienia cURL. Trasa nigdy nie jest czarną skrzynką.

Per-request logsgrade · model · costcopy-as-cURL

Zero marży. Zero czarnych skrzynek.

Płacisz każdemu dostawcy jego dokładną cenę — nigdy nie doliczamy $0 za token. Każde żądanie pokazuje ocenę, wybrany model, dostawcę, opóźnienie i cenę, więc koszt jest przejrzysty jak szkło, a nie nieprzejrzystą uśrednioną stawką.

$0 / tokenprovider costglass-box receipt

Wersjonowane prompty i cache — bez ponownego wdrożenia.

Zmieniaj prompty. Nie kod.

Wersjonuj prompty pod nazwanymi etykietami z podziałami A/B i wycofaniem zmian jednym kliknięciem. Przenieś etykietę, a każde żądanie natychmiast ją podchwyci — bez ponownego wdrożenia, bez zmian w kodzie, bez aktualizacji klienta.

VersionedA/BInstant rollbackNo deploy

Zapłać raz. Korzystaj ponownie za darmo.

Powtarzane i buforowane tokeny promptów są rozliczane według stawki cache dostawcy — często ułamka ceny wejściowej — w 5-minutowych i 1-godzinnych oknach ulotnych. Te same odpowiedzi, mniejszy wydatek, z cached_tokens na każdym rachunku.

cache_controlcached_tokens5m / 1h windows

Zabezpieczenia, budżety i firewall agentów, który egzekwuje reguły.

Zabezpieczenia, które naprawdę blokują.

PII Shield i polityki treści działają, zanim wywołanie do dostawcy zostanie rozliczone. Zablokowane żądanie zwraca czysty 400 i nigdy nie jest obciążane opłatą — zabezpieczenia egzekwowane w locie, a nie zapisywane w logach po fakcie.

PII Shieldenforced pre-billingclean 400

Bezpieczne dla Twojego zespołu. I Twoich agentów.

Budżety i role dla ludzi; zapora oceniana pod kątem ryzyka dla agentów. Każde wywołanie narzędzia i MCP jest klasyfikowane jako ALLOW, REVIEW lub BLOCK przed uruchomieniem, a wykrywanie anomalii sygnalizuje skoki częstotliwości i kosztów względem wyuczonych bazowych poziomów dla danej godziny tygodnia.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Stworzone na erę agentów. Zanim go potrzebowałeś.

Pełna kontrola

Potrzebujesz czegoś więcej niż tryb? Napisz regułę.

Gdy ustawienie domyślne nie wystarcza, opisz routing jako kod — wersjonowany, możliwy do przeglądu i działający w kilka sekund. Bez ponownego wdrożenia i zmian po stronie klienta.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Konfiguracja

Działa w 60 sekund.

Jedna zmiana URL. Twoje SDK, nazwy modeli i streaming działają dokładnie jak wcześniej.

Krok 1
🔗

Skieruj swoje SDK do nas

Ustaw base_url na api.orcarouter.ai/v1 i zamień klucz API. Żadne inne zmiany kodu nie są potrzebne.

Krok 2

My routujemy, chronimy i obserwujemy

Każde wywołanie trafia do najlepszego modelu, jest sprawdzane względem Twoich zabezpieczeń i mierzone — oceniane w mniej niż 1ms, z wbudowanym przełączaniem, cache i pełnymi logami.

Krok 3

Ty wdrażasz, na jednym endpoincie

Ruch idzie wprost do natywnego API każdego dostawcy w jego oficjalnej stawce — dodajemy $0 za token. Jeden endpoint zgodny z OpenAI do routingu, obserwowalności i nadzoru.


Każdy model. Jeden cennik.

200+ modeli z aktualnymi cenami zestawionymi obok siebie — tyle, ile zapłaciłbyś dostawcy bezpośrednio. Doliczamy $0.

Zobacz wszystkie 200+ modeli →
ModelPrzekierowane doWejście /MWyjście /MKontekstJakość
obsidian/Qwen3.6-35B-A3BNOWY$0.310$4.21262K4.0
obsidian/gemma-4-26B-A4BNOWY$0.250$2.90262K4.0
anthropic/claude-sonnet-5NOWYAnthropic Direct$2.00$10.001M9.0
kling/kling-3-turboNOWY$0.112 /call
z-ai/glm-5.2NOWYZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeNOWYMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5NOWYAnthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ Kolejne 194 modele · Ceny aktualizowane co 60 sekund

Wszystko, co Twój klient OpenAI już wywołuje.

Streaming, wywołania narzędzi, ustrukturyzowane wyjścia, wizja, embeddingi i audio — kierowane bez zmian przez każdy model.

ModelStreamingNarzędziaUstrukturyzowaneWizjaEmbeddingiAudio
google/gemini-3.1-pro-previewobsługiwaneobsługiwaneobsługiwaneobsługiwanenieobsługiwaneobsługiwane
anthropic/claude-opus-4.8obsługiwaneobsługiwaneobsługiwaneobsługiwanenieobsługiwanenieobsługiwane
anthropic/claude-opus-4.7obsługiwaneobsługiwaneobsługiwaneobsługiwanenieobsługiwanenieobsługiwane
grok/grok-4.3obsługiwaneobsługiwaneobsługiwaneobsługiwanenieobsługiwanenieobsługiwane
openai/gpt-5.5-proobsługiwaneobsługiwaneobsługiwaneobsługiwanenieobsługiwanenieobsługiwane
Cennik

Routing jest darmowy.
Płać za funkcje.

Nigdy nie bierzemy prowizji z Twoich wydatków na tokeny. Nasze przychody pochodzą z opcjonalnych funkcji zespołowych.

Gwarancja zerowej marży
Płacisz dostawcom bezpośrednio według ich opublikowanych stawek. Nie doliczamy nic do kosztu tokenów. Routing jest darmowy; opcjonalny plan Team finansuje platformę.
$0.00opłata za routing

Hacker

Darmowy
Na zawsze. Zero marży na wszystkich tokenach.
✓ Routuj — 200+ modeli, auto-przełączanie
✓ Obserwuj — podstawowy dashboard
✓ Zarządzaj — wersjonowanie promptów
✓ 3 klucze API · 0% narzutu na tokeny
Zacznij za darmo

Enterprise

Niestandardowy
Zobowiązania SLA + prywatne wdrożenie.
✓ Wszystko z Team
✓ Wdrożenie prywatne / on-prem
✓ 99.99% SLA dostępności
✓ Dedykowana infrastruktura
✓ Dedykowane wsparcie i ceny na zamówienie
Zaufanie i zgodność

Niezależnie audytowane. Stale zgodne z przepisami.

Raporty z audytów dostępne na podstawie NDA — poproś o kopię poniżej.

Inteligentniej, bezpieczniej, oszczędnie.

Podmień jedną linię. To cała migracja.

Zarejestruj się przez GitHub — $5 w tokenach gratis. Bez karty kredytowej. Działasz w niespełna minutę.

© 2026 OrcaRouter