Zéro marge. Disponibilité accrue. Meilleurs prix.

Une passerelle. Tous les modèles. Routez plus intelligemment. Livrez en toute sécurité. Dépensez moins.

OrcaRouter évalue chaque prompt et le route intelligemment. Une IA de qualité de pointe jusqu'à 40 % moins chère. Routage adaptatif, répartition de charge, garde-fous, pare-feu d'agents, observabilité et gouvernance — le tout via un seul endpoint compatible OpenAI.

Sans carte bancaire · opérationnel en 60 s

Devance GPT-5 et Azure sur RouterArenaAppuyé par des recherches publiées
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Une ligne. On note chaque prompt, on route vers un modèle de pointe ou OSS, et on ajoute 0 $.

grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
200+
modèles, un seul endpoint
0%
de marge sur les tokens, jamais
75.5%
de précision de routage
<50ms
bascule en plein flux
Vous construisez avec ? Parlons-en.
Vos retours façonnent la prochaine version.
Intégrations

Compatible avec les outils que vous utilisez déjà

Compatible OpenAI clé en main, ou connectez vos agents via le serveur MCP OrcaRouter — conservez votre SDK, votre framework et votre éditeur.

Serveur MCP OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLet plus
La passerelle IA pour la production

Routage intelligent et bascule automatique à chaque requête.

Un routage mesurablement plus précis.

Chaque prompt est encodé puis routé par un modèle qui apprend en continu du trafic réel. Sur le classement public RouterArena (Jun 2026), il domine en précision — devant GPT-5, Azure, Martian et NotDiamond — à 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* D'après les données du classement RouterArena, juin 2026.

Un fournisseur tombe. Personne ne le remarque.

Quand un fournisseur limite le débit ou renvoie une erreur 5xx, OrcaRouter relance la requête vers un modèle sain parmi plus de 200 options avant le début de la réponse — les pannes amont passagères n'atteignent pas vos utilisateurs.

200+ modelsauto-failoverno 429

Le routage selon vos règles.

orcarouter/auto est un réglage par défaut intelligent, pas une boîte noire. Orientez chaque espace de travail vers l'objectif souhaité — le modèle le moins cher qui atteint votre seuil de qualité, la meilleure qualité, ou un équilibre entre les deux — ou laissez-le apprendre le compromis à partir de votre propre trafic. Vous n'êtes jamais enfermé dans un seul comportement.

per-workspaceno markup either way<1ms overhead

Voyez et prouvez chaque appel — coût, modèle, latence et pourquoi.

Voyez tout. Prouvez tout.

Voyez précisément ce qu'a coûté chaque requête, quel modèle l'a traitée, combien de temps elle a pris et pourquoi elle a échoué — des journaux structurés complets que vous pouvez filtrer, rejouer et copier sous forme de cURL exécutable. Une route n'est jamais une boîte noire.

Per-request logsgrade · model · costcopy-as-cURL

Zéro marge. Zéro boîte noire.

Vous payez à chaque fournisseur son prix exact — nous ajoutons $0 par token, à jamais. Chaque requête affiche la note, le modèle choisi, le fournisseur, la latence et le prix, afin que le coût soit transparent (glass-box) et non un taux mixte opaque.

$0 / tokenprovider costglass-box receipt

Prompts versionnés et cache — sans redéploiement.

Changez les prompts. Pas le code.

Versionnez vos prompts derrière des libellés nommés, avec répartition A/B et rollback en un clic. Déplacez un libellé et chaque requête l'adopte instantanément — pas de redéploiement, pas de changement de code, pas de mise à jour client.

VersionedA/BInstant rollbackNo deploy

Payez une fois. Réutilisez gratuitement.

Les tokens de prompt répétés et mis en cache sont facturés au tarif de cache du fournisseur — souvent une fraction du prix d'entrée — sur des fenêtres éphémères de 5 minutes et 1 heure. Mêmes réponses, moins de dépenses, avec cached_tokens sur chaque reçu.

cache_controlcached_tokens5m / 1h windows

Garde-fous, budgets et un pare-feu d'agents qui applique les règles.

Des garde-fous qui bloquent vraiment.

PII Shield et les politiques de contenu s'exécutent avant que l'appel en amont ne soit facturé. Une requête bloquée renvoie un 400 propre et n'est jamais facturée — des garde-fous appliqués en ligne, et non journalisés après coup.

PII Shieldenforced pre-billingclean 400

Sûr pour votre équipe. Et vos agents.

Des budgets et des rôles pour les personnes ; un pare-feu noté par risque pour les agents. Chaque appel d'outil et chaque appel MCP est noté ALLOW, REVIEW ou BLOCK avant son exécution, et la détection d'anomalies signale les pics de débit et de coût par rapport à des références apprises par heure de la semaine.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Conçu pour l'ère des agents. Avant que vous en ayez besoin.

Contrôle total

Besoin de plus qu’un mode ? Écrivez la règle.

Quand le réglage par défaut ne suffit pas, exprimez le routage sous forme de code — versionné, relisible et actif en quelques secondes. Sans redéploiement ni modification du client.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Installation

En ligne en 60 secondes.

Un changement d'URL. Votre SDK, noms de modèles et streaming fonctionnent comme avant.

Étape 1
🔗

Pointez votre SDK vers nous

Définissez base_url sur api.orcarouter.ai/v1 et changez votre clé API. Aucun autre changement de code nécessaire.

Étape 2

On route, protège & observe

Chaque appel est routé vers le meilleur modèle, vérifié selon vos garde-fous et mesuré — évalué en moins de 1ms, avec bascule, cache et logs complets intégrés.

Étape 3

Vous livrez, sur un seul endpoint

Le trafic va direct à l'API native de chaque fournisseur à son tarif public — on ajoute $0 par token. Un seul endpoint compatible OpenAI pour le routage, l'observabilité et la gouvernance.


Tous les modèles. Une seule grille tarifaire.

Plus de 200 modèles avec des tarifs en direct, côte à côte — ce que vous paieriez directement au fournisseur. On ajoute 0 $ par-dessus.

Voir les 200+ modèles →
ModèleRouté versEntrée /MSortie /MContexteQualité
obsidian/gemma-4-26B-A4BNOUVEAU$0.250$2.90262K4.0
obsidian/Qwen3.6-35B-A3BNOUVEAU$0.310$4.21262K4.0
anthropic/claude-sonnet-5NOUVEAUAnthropic Direct$2.00$10.001M9.0
kling/kling-3-turboNOUVEAU$0.112 /call
z-ai/glm-5.2NOUVEAUZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeNOUVEAUMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5NOUVEAUAnthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ 194 modèles supplémentaires · Prix mis à jour toutes les 60 s

Tout ce que votre client OpenAI appelle déjà.

Streaming, appels d'outils, sorties structurées, vision, embeddings et audio — routés sans modification sur tous les modèles.

ModèleStreamingOutilsStructuréVisionEmbeddingsAudio
grok/grok-4.3pris en chargepris en chargepris en chargepris en chargenon pris en chargenon pris en charge
openai/gpt-5.5-propris en chargepris en chargepris en chargepris en chargenon pris en chargenon pris en charge
anthropic/claude-opus-4.7pris en chargepris en chargepris en chargepris en chargenon pris en chargenon pris en charge
anthropic/claude-opus-4.8pris en chargepris en chargepris en chargepris en chargenon pris en chargenon pris en charge
google/gemini-3.1-pro-previewpris en chargepris en chargepris en chargepris en chargenon pris en chargepris en charge
Tarifs

Le routage est gratuit.
Payez pour les fonctionnalités.

Nous ne prenons jamais une part de vos dépenses de tokens. Nos revenus viennent des fonctionnalités d'équipe optionnelles.

Garantie sans majoration
Vous payez les fournisseurs directement à leurs tarifs publiés. Nous n'ajoutons rien aux coûts des tokens. Le routage est gratuit ; le plan Team optionnel finance la plateforme.
$0.00frais de routage

Hacker

Gratuit
À vie. Aucune majoration sur tous les tokens.
✓ Router — 200+ modèles, bascule auto
✓ Observer — tableau de bord de base
✓ Gérer — versionnage des prompts
✓ 3 clés API · 0% de marge sur les tokens
Commencer gratuitement

Entreprise

Sur mesure
Engagements SLA + déploiement privé.
✓ Tout du forfait Team
✓ Déploiement privé / sur site
✓ SLA de disponibilité 99.99%
✓ Infrastructure dédiée
✓ Support dédié & tarif sur mesure
Confiance & conformité

Audité de manière indépendante. Conformité continue.

Rapports d'audit disponibles sous NDA — demandez une copie ci-dessous.

Plus intelligent, plus sûr, économique.

Changez une ligne. Voilà toute la migration.

Inscrivez-vous avec GitHub — 5 $ de tokens offerts. Sans carte bancaire. Vous êtes opérationnel en moins d'une minute.

© 2026 OrcaRouter