Zero ricarico. Maggiore disponibilità. Prezzi migliori.

Un Gateway. Ogni Modello. Routing più intelligente. Deploy più sicuri. Spesa più bassa.

OrcaRouter valuta ogni prompt e lo instrada in modo intelligente. AI di qualità di frontiera con costi fino al 40% inferiori. Routing adattivo, bilanciamento del carico, guardrail, agent firewall, osservabilità e governance — tutto tramite un unico endpoint compatibile con OpenAI.

Nessuna carta di credito · attivo in 60 sec

Batte GPT-5 e Azure su RouterArenaSupportato da ricerca pubblicata
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Una riga. Valutiamo ogni prompt, instradiamo a frontier o OSS e aggiungiamo $0.

grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
200+
modelli, un endpoint
0%
markup sui token, mai
75.5%
accuratezza del routing
<50ms
failover a metà stream
Stai costruendo con questo? Parliamone.
Il tuo feedback plasma la prossima release.
Integrazioni

Funziona con gli strumenti che usi già

Compatibile con OpenAI da subito, oppure collega gli agent tramite il server MCP di OrcaRouter — mantieni il tuo SDK, framework ed editor.

Server MCP di OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLe altro
Il gateway AI per la produzione

Routing intelligente e failover automatico su ogni richiesta.

Un routing misurabilmente più accurato.

Ogni prompt viene trasformato in embedding e instradato da un modello che continua a imparare online dal traffico reale. Nella classifica pubblica RouterArena (Jun 2026) è in testa per accuratezza — davanti a GPT-5, Azure, Martian e NotDiamond — al 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* In base ai dati della classifica RouterArena, giugno 2026.

Un provider va giù. Nessuno se ne accorge.

Quando un provider limita il traffico o restituisce 5xx, OrcaRouter ritenta la richiesta su un modello integro tra oltre 200 opzioni prima che la risposta inizi — i guasti temporanei a monte non raggiungono i tuoi utenti.

200+ modelsauto-failoverno 429

Il routing alle tue condizioni.

orcarouter/auto è un'impostazione predefinita intelligente, non una scatola nera. Orienta ogni spazio di lavoro verso l'obiettivo che preferisci — il modello più economico che supera la tua soglia di qualità, la qualità più alta o un equilibrio tra i due — oppure lascia che impari il compromesso dal tuo stesso traffico. Non sei mai vincolato a un solo comportamento.

per-workspaceno markup either way<1ms overhead

Vedi e dimostra ogni chiamata — costo, modello, latenza e perché.

Vedi tutto. Dimostra tutto.

Vedi esattamente quanto è costata ogni richiesta, quale modello l'ha servita, quanto tempo ha richiesto e perché ha fallito — log strutturati completi che puoi filtrare, riprodurre e copiare come cURL eseguibile. Una rotta non è mai una scatola nera.

Per-request logsgrade · model · costcopy-as-cURL

Zero ricarico. Zero scatole nere.

Paghi a ciascun provider il suo prezzo esatto — aggiungiamo $0 per token, sempre. Ogni richiesta mostra la classificazione, il modello scelto, il provider, la latenza e il prezzo, così il costo è una scatola di vetro, non una tariffa miscelata e opaca.

$0 / tokenprovider costglass-box receipt

Prompt versionati e caching — senza redeploy.

Cambia i prompt. Non il codice.

Versiona i prompt dietro label con nome, con split A/B e rollback con un clic. Sposta una label e ogni richiesta la adotta all'istante — nessun redeploy, nessuna modifica al codice, nessun aggiornamento del client.

VersionedA/BInstant rollbackNo deploy

Paghi una volta. Riusi gratis.

I token di prompt ripetuti e in cache vengono fatturati alla tariffa di cache del provider — spesso una frazione del prezzo di input — su finestre effimere da 5 minuti e 1 ora. Stesse risposte, meno spesa, con cached_tokens su ogni ricevuta.

cache_controlcached_tokens5m / 1h windows

Guardrail, budget e un agent firewall che fa rispettare le regole.

Guardrail che bloccano davvero.

PII Shield e le policy sui contenuti vengono eseguite prima che la chiamata upstream venga fatturata. Una richiesta bloccata restituisce un 400 pulito e non viene mai addebitata — guardrail applicati inline, non registrati a posteriori.

PII Shieldenforced pre-billingclean 400

Sicuro per il tuo team. E per i tuoi agenti.

Budget e ruoli per le persone; un firewall con punteggio di rischio per gli agenti. Ogni chiamata a tool e MCP viene classificata ALLOW, REVIEW o BLOCK prima dell'esecuzione, e il rilevamento anomalie segnala picchi di frequenza e costo rispetto a baseline apprese per ora-della-settimana.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Creato per l'era degli agenti. Prima che ne avessi bisogno.

Controllo totale

Ti serve più di una modalità? Scrivi la regola.

Quando l'impostazione predefinita non basta, esprimi il routing come codice — versionato, revisionabile e attivo in pochi secondi. Senza ridistribuzioni né modifiche al client.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Configurazione

Live in 60 secondi.

Un cambio di URL. SDK, nomi modello e streaming funzionano come prima.

Passo 1
🔗

Punta il tuo SDK a noi

Imposta base_url su api.orcarouter.ai/v1 e cambia la tua chiave API. Nessun altro cambiamento di codice necessario.

Passo 2

Noi instradiamo, proteggiamo e osserviamo

Ogni chiamata viene instradata al modello migliore, verificata rispetto ai tuoi guardrail e contabilizzata — valutata in meno di 1ms, con failover, caching e log completi integrati.

Passo 3

Tu fai il deploy, su un solo endpoint

Il traffico va diretto all'API first-party di ogni provider alla tariffa ufficiale — noi aggiungiamo $0 per token. Un unico endpoint compatibile con OpenAI per routing, osservabilità e governance.


Ogni modello. Un solo listino.

200+ modelli con prezzi live, affiancati — quanto pagheresti direttamente al provider. Aggiungiamo $0 in più.

Vedi tutti i 200+ modelli →
ModelloInstradato aInput /MOutput /MContestoQualità
obsidian/gemma-4-26B-A4BNUOVO$0.250$2.90262K4.0
obsidian/Qwen3.6-35B-A3BNUOVO$0.310$4.21262K4.0
anthropic/claude-sonnet-5NUOVOAnthropic Direct$2.00$10.001M9.0
kling/kling-3-turboNUOVO$0.112 /call
z-ai/glm-5.2NUOVOZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeNUOVOMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5NUOVOAnthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ 194 modelli in più · Prezzi aggiornati ogni 60 secondi

Tutto ciò che il tuo client OpenAI già chiama.

Streaming, tool call, output strutturati, vision, embedding e audio — instradati invariati su ogni modello.

ModelloStreamingToolStrutturatoVisionEmbeddingAudio
grok/grok-4.3supportatosupportatosupportatosupportatonon supportatonon supportato
anthropic/claude-opus-4.7supportatosupportatosupportatosupportatonon supportatonon supportato
google/gemini-3.1-pro-previewsupportatosupportatosupportatosupportatonon supportatosupportato
openai/gpt-5.5-prosupportatosupportatosupportatosupportatonon supportatonon supportato
anthropic/claude-fable-5supportatosupportatosupportatosupportatonon supportatonon supportato
Prezzi

Il routing è gratis.
Paghi per le funzionalità.

Non prendiamo mai una quota della tua spesa in token. I ricavi vengono da funzionalità team opzionali.

Garanzia zero ricarico
Paghi i fornitori direttamente alle loro tariffe pubblicate. Non aggiungiamo nulla sui costi dei token. Il routing è gratuito; il piano Team opzionale finanzia la piattaforma.
$0.00tariffa di routing

Hacker

Gratis
Per sempre. Zero ricarico su tutti i token.
✓ Instrada — 200+ modelli, auto-failover
✓ Osserva — dashboard base
✓ Gestisci — versioning dei prompt
✓ 3 chiavi API · 0% markup sui token
Inizia gratis

Enterprise

Personalizzato
Impegni SLA + deployment privato.
✓ Tutto di Team
✓ Deployment privato / on-prem
✓ SLA uptime 99.99%
✓ Infrastruttura dedicata
✓ Supporto dedicato e prezzi su misura
Fiducia e conformità

Verificato in modo indipendente. Sempre conforme.

Report di audit disponibili in regime di NDA — richiedi una copia qui sotto.

Più intelligente, più sicuro, conveniente.

Cambia una riga. È tutta qui la migrazione.

Registrati con GitHub — $5 in token gratis. Nessuna carta di credito richiesta. Sei operativo in meno di un minuto.