OrcaRouter indirizza ogni prompt al modello giusto: ragionamento complesso ai modelli di frontiera, lavoro di routine ai modelli open source. Ottieni qualità di frontiera quando conta e paghi prezzi open source per il resto. Zero ricarico. Zero migrazione. Un'unica API.
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="gpt-4o",messages=[{"role": "user", "content": "..."}])# → routed to cheapest live backend, zero markup ✓
Il tuo traffico arriva al provider upstream senza alcun proxy ombra intermedio. Il provider che vedi nei log è quello che ha effettivamente servito la richiesta.
I termini di dati e utilizzo di ciascun provider upstream si applicano direttamente al tuo traffico. Scegli il provider che corrisponde alla tua policy.
Ogni chiamata registra il provider, il prezzo pubblico e la rotta seguita. Puoi riprodurre qualsiasi decisione di routing successivamente dalla dashboard.
Un cambio di URL. SDK, nomi modello e streaming funzionano come prima.
Imposta base_url su api.orcarouter.ai/v1 e cambia la tua chiave API. Nessun altro cambiamento di codice necessario.
Ogni richiesta controlla stato e prezzi dei provider in tempo reale in meno di 1ms. Scegliamo il backend diretto più economico disponibile.
Il traffico va direttamente al provider. Paghi la loro tariffa pubblicata. Aggiungiamo esattamente $0 sopra — la nostra commissione è sul piano, non sui tuoi token.
Routing in tempo reale al backend live più economico. Prezzi aggiornati ogni 60s.
| Modello | Instradato a | Input /M | Output /M | Contesto | Qualità |
|---|---|---|---|---|---|
| claude-opus-4-7 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| claude-sonnet-4-6 | Anthropic Direct | $3.00 | $15.00 | 1M | 7.0 |
| gpt-5.5 | OpenAI Direct | $5.00 | $30.00 | 1M | 10.0 |
| gemini-3.1-pro-preview | Google Direct | $4.00 | $18.00 | 1M | 10.0 |
| deepseek-v4-pro | DeepSeek | $0.560 | $1.12 | 1M | 9.0 |
| qwen3.6-plus | Alibaba Cloud | $0.500 | $3.00 | 1M | 8.0 |
| kimi-k2.6 | Moonshot | $0.900 | $3.75 | 256K | 9.0 |
| seedance-2.0 | ByteDance | from $0.07 /sec | — | — | 10.0 |
| + 194 modelli in più · Prezzi aggiornati ogni 60 secondi | |||||
Tutto il necessario per eseguire AI in produzione senza gestire più integrazioni provider.
I prezzi provider si aggiornano ogni 60s. Ogni richiesta va al backend più economico disponibile.
Il provider cade a metà stream? Cambiamo in modo trasparente. La tua app vede zero errori.
Emetti chiavi per team o servizio con limiti di spesa, whitelist modelli e rate limit integrati.
Vedi esattamente quanto è costata ogni richiesta, quale provider l'ha gestita e quanto hai risparmiato.
Cambia una riga. Stesso SDK, stessi nomi modello, stesso formato streaming. Zero sforzo di migrazione.
Limiti rigidi e morbidi per chiave, team o org. Ripristino automatico mensile. Avvisi Slack + webhook.
Ogni richiesta mostra il provider che l'ha servita, il prezzo pubblicato applicato e la rotta percorsa. Verificabile a ogni chiamata e riproducibile in seguito.
Ogni risposta è etichettata con il provider upstream — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — e compare nella dashboard e negli header.
Ogni addebito per token equivale al prezzo di listino pubblico del provider. Verifica qualsiasi richiesta rispetto alla pagina prezzi del provider in pochi secondi.
Failover, cambi di health e scelte del backend più economico vengono registrati con timestamp. Puoi riprodurre il percorso di routing di qualsiasi richiesta.
Non prendiamo mai una quota della tua spesa in token. I ricavi vengono da funzionalità team opzionali.
Registrati con GitHub — $5 in token gratis. Nessuna carta di credito richiesta. Cambia una riga di codice e sei live.
OrcaRouter