OrcaRouter — Passerelle IA : routage LLM adaptatif

La passerelle IA pour la production

Routage intelligent et bascule automatique à chaque requête.

Un routage mesurablement plus précis.

Chaque prompt est encodé puis routé par un modèle qui apprend en continu du trafic réel. Sur le classement public RouterArena (Jun 2026), il domine en précision — devant GPT-5, Azure, Martian et NotDiamond — à 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena

* D'après les données du classement RouterArena, juin 2026.

Un fournisseur tombe. Personne ne le remarque.

Quand un fournisseur limite le débit ou renvoie une erreur 5xx, OrcaRouter relance la requête vers un modèle sain parmi plus de 200 options avant le début de la réponse — les pannes amont passagères n'atteignent pas vos utilisateurs.

200+ modelsauto-failoverno 429

Le routage selon vos règles.

orcarouter/auto est un réglage par défaut intelligent, pas une boîte noire. Orientez chaque espace de travail vers l'objectif souhaité — le modèle le moins cher qui atteint votre seuil de qualité, la meilleure qualité, ou un équilibre entre les deux — ou laissez-le apprendre le compromis à partir de votre propre trafic. Vous n'êtes jamais enfermé dans un seul comportement.

per-workspaceno markup either way<1ms overhead

Voyez et prouvez chaque appel — coût, modèle, latence et pourquoi.

Voyez tout. Prouvez tout.

Voyez précisément ce qu'a coûté chaque requête, quel modèle l'a traitée, combien de temps elle a pris et pourquoi elle a échoué — des journaux structurés complets que vous pouvez filtrer, rejouer et copier sous forme de cURL exécutable. Une route n'est jamais une boîte noire.

Per-request logsgrade · model · costcopy-as-cURL

Zéro marge. Zéro boîte noire.

Vous payez à chaque fournisseur son prix exact — nous ajoutons $0 par token, à jamais. Chaque requête affiche la note, le modèle choisi, le fournisseur, la latence et le prix, afin que le coût soit transparent (glass-box) et non un taux mixte opaque.

$0 / tokenprovider costglass-box receipt

Prompts versionnés et cache — sans redéploiement.

Changez les prompts. Pas le code.

Versionnez vos prompts derrière des libellés nommés, avec répartition A/B et rollback en un clic. Déplacez un libellé et chaque requête l'adopte instantanément — pas de redéploiement, pas de changement de code, pas de mise à jour client.

VersionedA/BInstant rollbackNo deploy

Payez une fois. Réutilisez gratuitement.

Les tokens de prompt répétés et mis en cache sont facturés au tarif de cache du fournisseur — souvent une fraction du prix d'entrée — sur des fenêtres éphémères de 5 minutes et 1 heure. Mêmes réponses, moins de dépenses, avec cached_tokens sur chaque reçu.

cache_controlcached_tokens5m / 1h windows

Garde-fous, budgets et un pare-feu d'agents qui applique les règles.

Des garde-fous qui bloquent vraiment.

PII Shield et les politiques de contenu s'exécutent avant que l'appel en amont ne soit facturé. Une requête bloquée renvoie un 400 propre et n'est jamais facturée — des garde-fous appliqués en ligne, et non journalisés après coup.

PII Shieldenforced pre-billingclean 400

Sûr pour votre équipe. Et vos agents.

Des budgets et des rôles pour les personnes ; un pare-feu noté par risque pour les agents. Chaque appel d'outil et chaque appel MCP est noté ALLOW, REVIEW ou BLOCK avant son exécution, et la détection d'anomalies signale les pics de débit et de coût par rapport à des références apprises par heure de la semaine.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection

Conçu pour l'ère des agents. Avant que vous en ayez besoin.

Contrôle total

Besoin de plus qu’un mode ? Écrivez la règle.

Quand le réglage par défaut ne suffit pas, exprimez le routage sous forme de code — versionné, relisible et actif en quelques secondes. Sans redéploiement ni modification du client.

routing.yaml

version: 1
rules:
  - id: hard_agent_task
    when: task_class == "agent" && difficulty >= 0.6
    use:
      model: "claude-opus-4-7"
      reasoning_effort: high   # spend where it matters
  - id: short_prompts
    when: request.input_tokens < 500
    use: { delegate: cheapest }
default:
  delegate: balanced   # fall back to the chosen mode

YAML + CELversion-controlledlive in seconds

Explorer la doc de routage

Installation

En ligne en 60 secondes.

Un changement d'URL. Votre SDK, noms de modèles et streaming fonctionnent comme avant.

Étape 1

🔗

Pointez votre SDK vers nous

Définissez base_url sur api.orcarouter.ai/v1 et changez votre clé API. Aucun autre changement de code nécessaire.

→

Étape 2

⚡

On route, protège & observe

Chaque appel est routé vers le meilleur modèle, vérifié selon vos garde-fous et mesuré — évalué en moins de 1ms, avec bascule, cache et logs complets intégrés.

→

Étape 3

✓

Vous livrez, sur un seul endpoint

Le trafic va direct à l'API native de chaque fournisseur à son tarif public — on ajoute $0 par token. Un seul endpoint compatible OpenAI pour le routage, l'observabilité et la gouvernance.

Tous les modèles. Une seule grille tarifaire.

Plus de 200 modèles avec des tarifs en direct, côte à côte — ce que vous paieriez directement au fournisseur. On ajoute 0 $ par-dessus.

Voir les 200+ modèles →

Modèle	Routé vers	Entrée /M	Sortie /M	Contexte	Qualité
obsidian/gemma-4-26B-A4BNOUVEAU	—	$0.250	$2.90	262K	4.0
obsidian/Qwen3.6-35B-A3BNOUVEAU	—	$0.310	$4.21	262K	4.0
anthropic/claude-sonnet-5NOUVEAU	Anthropic Direct	$2.00	$10.00	1M	9.0
kling/kling-3-turboNOUVEAU	—	$0.112 /call	—	—	—
z-ai/glm-5.2NOUVEAU	Zhipu AI	$1.40	$4.40	1M	9.0
kimi/kimi-k2.7-codeNOUVEAU	Moonshot	$0.950	$4.00	262K	8.0
anthropic/claude-fable-5NOUVEAU	Anthropic Direct	$10.00	$50.00	1M	10.0
qwen/qwen3.7-plus	Alibaba Cloud	$0.350	$1.42	1M	8.0
minimax/minimax-m3	—	$0.300	$1.20	1M	9.0
anthropic/claude-opus-4.8	Anthropic Direct	$5.00	$25.00	1M	10.0
google/gemini-3.5-flash	Google Direct	$1.50	$9.00	1M	9.0
qwen/qwen3.7-max	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.7-max-2026-05-20	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.6-flash	Alibaba Cloud	$0.250	$1.50	1M	7.0
qwen/qwen3.6-35b-a3b	Alibaba Cloud	$0.248	$1.48	262K	8.0
+ 194 modèles supplémentaires · Prix mis à jour toutes les 60 s

Tout ce que votre client OpenAI appelle déjà.

Streaming, appels d'outils, sorties structurées, vision, embeddings et audio — routés sans modification sur tous les modèles.

Modèle	Streaming	Outils	Structuré	Vision	Embeddings	Audio
grok/grok-4.3	pris en charge	pris en charge	pris en charge	pris en charge	non pris en charge	non pris en charge
openai/gpt-5.5-pro	pris en charge	pris en charge	pris en charge	pris en charge	non pris en charge	non pris en charge
anthropic/claude-opus-4.7	pris en charge	pris en charge	pris en charge	pris en charge	non pris en charge	non pris en charge
anthropic/claude-opus-4.8	pris en charge	pris en charge	pris en charge	pris en charge	non pris en charge	non pris en charge
google/gemini-3.1-pro-preview	pris en charge	pris en charge	pris en charge	pris en charge	non pris en charge	pris en charge

Tarifs

Le routage est gratuit.
Payez pour les fonctionnalités.

Nous ne prenons jamais une part de vos dépenses de tokens. Nos revenus viennent des fonctionnalités d'équipe optionnelles.

Garantie sans majoration

Vous payez les fournisseurs directement à leurs tarifs publiés. Nous n'ajoutons rien aux coûts des tokens. Le routage est gratuit ; le plan Team optionnel finance la plateforme.

$0.00frais de routage

Hacker

Gratuit

À vie. Aucune majoration sur tous les tokens.

✓ Router — 200+ modèles, bascule auto

✓ Observer — tableau de bord de base

✓ Gérer — versionnage des prompts

✓ 3 clés API · 0% de marge sur les tokens

Commencer gratuitement

Équipe

$499/mo

Toujours aucune majoration. Payez pour les fonctionnalités.

✓ Tout du forfait Hacker

✓ Jusqu'à 10 sièges d'équipe

✓ Application de la conformité & rapports

✓ Clés API illimitées

✓ Support prioritaire

Commencer →

Entreprise

Sur mesure

Engagements SLA + déploiement privé.

✓ Tout du forfait Team

✓ Déploiement privé / sur site

✓ SLA de disponibilité 99.99%

✓ Infrastructure dédiée

✓ Support dédié & tarif sur mesure

Une passerelle. Tous les modèles. Routez plus intelligemment. Livrez en toute sécurité. Dépensez moins.

Compatible avec les outils que vous utilisez déjà

Un routage mesurablement plus précis.

Un fournisseur tombe. Personne ne le remarque.

Le routage selon vos règles.

Voyez tout. Prouvez tout.

Zéro marge. Zéro boîte noire.

Changez les prompts. Pas le code.

Payez une fois. Réutilisez gratuitement.

Des garde-fous qui bloquent vraiment.

Sûr pour votre équipe. Et vos agents.

Besoin de plus qu’un mode ? Écrivez la règle.

En ligne en 60 secondes.

Pointez votre SDK vers nous

On route, protège & observe

Vous livrez, sur un seul endpoint

Tous les modèles. Une seule grille tarifaire.

Tout ce que votre client OpenAI appelle déjà.

Le routage est gratuit.
Payez pour les fonctionnalités.

Hacker

Équipe

Entreprise

Audité de manière indépendante. Conformité continue.

Plus intelligent, plus sûr, économique.

Produit

Ressources

Mentions légales

Suivez-nous

Une passerelle. Tous les modèles. Routez plus intelligemment. Livrez en toute sécurité. Dépensez moins.

Compatible avec les outils que vous utilisez déjà

Un routage mesurablement plus précis.

Un fournisseur tombe. Personne ne le remarque.

Le routage selon vos règles.

Voyez tout. Prouvez tout.

Zéro marge. Zéro boîte noire.

Changez les prompts. Pas le code.

Payez une fois. Réutilisez gratuitement.

Des garde-fous qui bloquent vraiment.

Sûr pour votre équipe. Et vos agents.

Besoin de plus qu’un mode ? Écrivez la règle.

En ligne en 60 secondes.

Pointez votre SDK vers nous

On route, protège & observe

Vous livrez, sur un seul endpoint

Tous les modèles. Une seule grille tarifaire.

Tout ce que votre client OpenAI appelle déjà.

Le routage est gratuit.Payez pour les fonctionnalités.

Hacker

Équipe

Entreprise

Audité de manière indépendante. Conformité continue.

Plus intelligent, plus sûr, économique.

Produit

Ressources

Mentions légales

Suivez-nous

Le routage est gratuit.
Payez pour les fonctionnalités.