OrcaRouter — jedna brama AI: adaptacyjny routing i nadzór LLM

Bramka AI dla produkcji

Inteligentny routing i automatyczne przełączanie przy każdym żądaniu.

Routing wymiernie dokładniejszy.

Każdy prompt jest osadzany i routowany przez model, który uczy się online na podstawie realnego ruchu. W publicznym rankingu RouterArena (Jun 2026) prowadzi pod względem dokładności — przed GPT-5, Azure, Martian i NotDiamond — z wynikiem 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena

* Na podstawie danych rankingu RouterArena, czerwiec 2026.

Dostawca pada. Nikt tego nie zauważa.

Gdy dostawca ogranicza ruch lub zwraca 5xx, OrcaRouter ponawia żądanie do sprawnego modelu spośród ponad 200 opcji zanim rozpocznie się odpowiedź — przejściowe awarie po stronie dostawcy nie docierają do Twoich użytkowników.

200+ modelsauto-failoverno 429

Routing na Twoich zasadach.

orcarouter/auto to inteligentne ustawienie domyślne, a nie czarna skrzynka. Skieruj każdą przestrzeń roboczą na wybrany cel — najtańszy model spełniający Twój próg jakości, najwyższą jakość albo równowagę między nimi — lub pozwól, by sam nauczył się kompromisu na podstawie Twojego ruchu. Nigdy nie jesteś przywiązany do jednego zachowania.

per-workspaceno markup either way<1ms overhead

Zobacz i udowodnij każde wywołanie — koszt, model, opóźnienie i dlaczego.

Zobacz wszystko. Udowodnij cokolwiek.

Zobacz dokładnie, ile kosztowało każde żądanie, który model je obsłużył, jak długo trwało i dlaczego się nie powiodło — pełne ustrukturyzowane logi, które możesz filtrować, odtwarzać i kopiować jako gotowe do uruchomienia cURL. Trasa nigdy nie jest czarną skrzynką.

Per-request logsgrade · model · costcopy-as-cURL

Zero marży. Zero czarnych skrzynek.

Płacisz każdemu dostawcy jego dokładną cenę — nigdy nie doliczamy $0 za token. Każde żądanie pokazuje ocenę, wybrany model, dostawcę, opóźnienie i cenę, więc koszt jest przejrzysty jak szkło, a nie nieprzejrzystą uśrednioną stawką.

$0 / tokenprovider costglass-box receipt

Wersjonowane prompty i cache — bez ponownego wdrożenia.

Zmieniaj prompty. Nie kod.

Wersjonuj prompty pod nazwanymi etykietami z podziałami A/B i wycofaniem zmian jednym kliknięciem. Przenieś etykietę, a każde żądanie natychmiast ją podchwyci — bez ponownego wdrożenia, bez zmian w kodzie, bez aktualizacji klienta.

VersionedA/BInstant rollbackNo deploy

Zapłać raz. Korzystaj ponownie za darmo.

Powtarzane i buforowane tokeny promptów są rozliczane według stawki cache dostawcy — często ułamka ceny wejściowej — w 5-minutowych i 1-godzinnych oknach ulotnych. Te same odpowiedzi, mniejszy wydatek, z cached_tokens na każdym rachunku.

cache_controlcached_tokens5m / 1h windows

Zabezpieczenia, budżety i firewall agentów, który egzekwuje reguły.

Zabezpieczenia, które naprawdę blokują.

PII Shield i polityki treści działają, zanim wywołanie do dostawcy zostanie rozliczone. Zablokowane żądanie zwraca czysty 400 i nigdy nie jest obciążane opłatą — zabezpieczenia egzekwowane w locie, a nie zapisywane w logach po fakcie.

PII Shieldenforced pre-billingclean 400

Bezpieczne dla Twojego zespołu. I Twoich agentów.

Budżety i role dla ludzi; zapora oceniana pod kątem ryzyka dla agentów. Każde wywołanie narzędzia i MCP jest klasyfikowane jako ALLOW, REVIEW lub BLOCK przed uruchomieniem, a wykrywanie anomalii sygnalizuje skoki częstotliwości i kosztów względem wyuczonych bazowych poziomów dla danej godziny tygodnia.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection

Stworzone na erę agentów. Zanim go potrzebowałeś.

Pełna kontrola

Potrzebujesz czegoś więcej niż tryb? Napisz regułę.

Gdy ustawienie domyślne nie wystarcza, opisz routing jako kod — wersjonowany, możliwy do przeglądu i działający w kilka sekund. Bez ponownego wdrożenia i zmian po stronie klienta.

routing.yaml

version: 1
rules:
  - id: hard_agent_task
    when: task_class == "agent" && difficulty >= 0.6
    use:
      model: "claude-opus-4-7"
      reasoning_effort: high   # spend where it matters
  - id: short_prompts
    when: request.input_tokens < 500
    use: { delegate: cheapest }
default:
  delegate: balanced   # fall back to the chosen mode

YAML + CELversion-controlledlive in seconds

Poznaj dokumentację routingu

Konfiguracja

Działa w 60 sekund.

Jedna zmiana URL. Twoje SDK, nazwy modeli i streaming działają dokładnie jak wcześniej.

Krok 1

🔗

Skieruj swoje SDK do nas

Ustaw base_url na api.orcarouter.ai/v1 i zamień klucz API. Żadne inne zmiany kodu nie są potrzebne.

→

Krok 2

⚡

My routujemy, chronimy i obserwujemy

Każde wywołanie trafia do najlepszego modelu, jest sprawdzane względem Twoich zabezpieczeń i mierzone — oceniane w mniej niż 1ms, z wbudowanym przełączaniem, cache i pełnymi logami.

→

Krok 3

✓

Ty wdrażasz, na jednym endpoincie

Ruch idzie wprost do natywnego API każdego dostawcy w jego oficjalnej stawce — dodajemy $0 za token. Jeden endpoint zgodny z OpenAI do routingu, obserwowalności i nadzoru.

Każdy model. Jeden cennik.

200+ modeli z aktualnymi cenami zestawionymi obok siebie — tyle, ile zapłaciłbyś dostawcy bezpośrednio. Doliczamy $0.

Zobacz wszystkie 200+ modeli →

Model	Przekierowane do	Wejście /M	Wyjście /M	Kontekst	Jakość
obsidian/Qwen3.6-35B-A3BNOWY	—	$0.310	$4.21	262K	4.0
obsidian/gemma-4-26B-A4BNOWY	—	$0.250	$2.90	262K	4.0
anthropic/claude-sonnet-5NOWY	Anthropic Direct	$2.00	$10.00	1M	9.0
kling/kling-3-turboNOWY	—	$0.112 /call	—	—	—
z-ai/glm-5.2NOWY	Zhipu AI	$1.40	$4.40	1M	9.0
kimi/kimi-k2.7-codeNOWY	Moonshot	$0.950	$4.00	262K	8.0
anthropic/claude-fable-5NOWY	Anthropic Direct	$10.00	$50.00	1M	10.0
qwen/qwen3.7-plus	Alibaba Cloud	$0.350	$1.42	1M	8.0
minimax/minimax-m3	—	$0.300	$1.20	1M	9.0
anthropic/claude-opus-4.8	Anthropic Direct	$5.00	$25.00	1M	10.0
google/gemini-3.5-flash	Google Direct	$1.50	$9.00	1M	9.0
qwen/qwen3.7-max	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.7-max-2026-05-20	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.6-flash	Alibaba Cloud	$0.250	$1.50	1M	7.0
qwen/qwen3.6-35b-a3b	Alibaba Cloud	$0.248	$1.48	262K	8.0
+ Kolejne 194 modele · Ceny aktualizowane co 60 sekund

Wszystko, co Twój klient OpenAI już wywołuje.

Streaming, wywołania narzędzi, ustrukturyzowane wyjścia, wizja, embeddingi i audio — kierowane bez zmian przez każdy model.

Model	Streaming	Narzędzia	Ustrukturyzowane	Wizja	Embeddingi	Audio
google/gemini-3.1-pro-preview	obsługiwane	obsługiwane	obsługiwane	obsługiwane	nieobsługiwane	obsługiwane
anthropic/claude-opus-4.8	obsługiwane	obsługiwane	obsługiwane	obsługiwane	nieobsługiwane	nieobsługiwane
anthropic/claude-opus-4.7	obsługiwane	obsługiwane	obsługiwane	obsługiwane	nieobsługiwane	nieobsługiwane
grok/grok-4.3	obsługiwane	obsługiwane	obsługiwane	obsługiwane	nieobsługiwane	nieobsługiwane
openai/gpt-5.5-pro	obsługiwane	obsługiwane	obsługiwane	obsługiwane	nieobsługiwane	nieobsługiwane

Cennik

Routing jest darmowy.
Płać za funkcje.

Nigdy nie bierzemy prowizji z Twoich wydatków na tokeny. Nasze przychody pochodzą z opcjonalnych funkcji zespołowych.

Gwarancja zerowej marży

Płacisz dostawcom bezpośrednio według ich opublikowanych stawek. Nie doliczamy nic do kosztu tokenów. Routing jest darmowy; opcjonalny plan Team finansuje platformę.

$0.00opłata za routing

Hacker

Darmowy

Na zawsze. Zero marży na wszystkich tokenach.

✓ Routuj — 200+ modeli, auto-przełączanie

✓ Obserwuj — podstawowy dashboard

✓ Zarządzaj — wersjonowanie promptów

✓ 3 klucze API · 0% narzutu na tokeny

Zacznij za darmo

Zespół

$499/mo

Nadal zero marży. Płać za funkcje.

✓ Wszystko z Hacker

✓ Do 10 miejsc w zespole

✓ Egzekwowanie zgodności i raporty

✓ Nieograniczone klucze API

✓ Wsparcie priorytetowe

Zacznij →

Enterprise

Niestandardowy

Zobowiązania SLA + prywatne wdrożenie.

✓ Wszystko z Team

✓ Wdrożenie prywatne / on-prem

✓ 99.99% SLA dostępności

✓ Dedykowana infrastruktura

✓ Dedykowane wsparcie i ceny na zamówienie

Jedna brama. Każdy model. Routuj mądrzej. Wdrażaj bezpieczniej. Płać mniej.

Działa z narzędziami, których już używasz

Routing wymiernie dokładniejszy.

Dostawca pada. Nikt tego nie zauważa.

Routing na Twoich zasadach.

Zobacz wszystko. Udowodnij cokolwiek.

Zero marży. Zero czarnych skrzynek.

Zmieniaj prompty. Nie kod.

Zapłać raz. Korzystaj ponownie za darmo.

Zabezpieczenia, które naprawdę blokują.

Bezpieczne dla Twojego zespołu. I Twoich agentów.

Potrzebujesz czegoś więcej niż tryb? Napisz regułę.

Działa w 60 sekund.

Skieruj swoje SDK do nas

My routujemy, chronimy i obserwujemy

Ty wdrażasz, na jednym endpoincie

Każdy model. Jeden cennik.

Wszystko, co Twój klient OpenAI już wywołuje.

Routing jest darmowy.
Płać za funkcje.

Hacker

Zespół

Enterprise

Niezależnie audytowane. Stale zgodne z przepisami.

Inteligentniej, bezpieczniej, oszczędnie.

Produkt

Zasoby

Informacje prawne

Obserwuj

Jedna brama. Każdy model. Routuj mądrzej. Wdrażaj bezpieczniej. Płać mniej.

Działa z narzędziami, których już używasz

Routing wymiernie dokładniejszy.

Dostawca pada. Nikt tego nie zauważa.

Routing na Twoich zasadach.

Zobacz wszystko. Udowodnij cokolwiek.

Zero marży. Zero czarnych skrzynek.

Zmieniaj prompty. Nie kod.

Zapłać raz. Korzystaj ponownie za darmo.

Zabezpieczenia, które naprawdę blokują.

Bezpieczne dla Twojego zespołu. I Twoich agentów.

Potrzebujesz czegoś więcej niż tryb? Napisz regułę.

Działa w 60 sekund.

Skieruj swoje SDK do nas

My routujemy, chronimy i obserwujemy

Ty wdrażasz, na jednym endpoincie

Każdy model. Jeden cennik.

Wszystko, co Twój klient OpenAI już wywołuje.

Routing jest darmowy.Płać za funkcje.

Hacker

Zespół

Enterprise

Niezależnie audytowane. Stale zgodne z przepisami.

Inteligentniej, bezpieczniej, oszczędnie.

Produkt

Zasoby

Informacje prawne

Obserwuj

Routing jest darmowy.
Płać za funkcje.