Qualité de pointe. Prix open source.

Une API. Tous les modèles. Zéro intermédiaire.

OrcaRouter dirige chaque prompt vers le modèle adéquat : raisonnement complexe vers les modèles de pointe, tâches courantes vers les modèles open source. Vous obtenez la qualité de pointe quand elle compte et payez les prix open source partout ailleurs. Zéro majoration. Zéro migration. Une seule API.

- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="gpt-4o",
messages=[{"role": "user", "content": "..."}]
)
# → routed to cheapest live backend, zero markup ✓
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
0%
majoration de routage. Jamais.
~40%
réduction de coût moyenne vs prix catalogue
200+
modèles de 10+ fournisseurs
<1ms
surcharge de routage ajoutée
Vous construisez avec ? Parlons-en.
Vos retours façonnent la prochaine version.
Comment fonctionne le routage

Pass-through par conception.

Routage direct vers le fournisseur

Votre trafic est dirigé vers le fournisseur en amont sans proxy fantôme intermédiaire. Le fournisseur que vous voyez dans vos journaux est celui qui a réellement servi la requête.

Les conditions du fournisseur s'appliquent de bout en bout

Les conditions de données et d'utilisation de chaque fournisseur en amont s'appliquent directement à votre trafic. Choisissez le fournisseur qui correspond à votre politique.

🧾

Auditabilité par requête

Chaque appel enregistre le fournisseur, le prix public et la route empruntée. Vous pouvez reproduire toute décision de routage plus tard depuis le tableau de bord.


Installation

En ligne en 60 secondes.

Un changement d'URL. Votre SDK, noms de modèles et streaming fonctionnent comme avant.

Étape 1
🔗

Pointez votre SDK vers nous

Définissez base_url sur api.orcarouter.ai/v1 et changez votre clé API. Aucun autre changement de code nécessaire.

Étape 2

Nous routons en temps réel

Chaque requête vérifie la santé et les prix des fournisseurs en direct en moins de 1 ms. Nous choisissons le backend direct le moins cher disponible.

Étape 3

Vous payez le prix fournisseur

Le trafic va directement au fournisseur. Vous leur payez leur tarif publié. Nous ajoutons exactement 0 $ — nos frais sont sur le plan, pas sur vos tokens.


Prix en direct

Tous les modèles.
Meilleur tarif disponible.

Routage en temps réel vers le backend le moins cher en direct. Prix actualisés toutes les 60s.

Voir les 200+ modèles →
ModèleRouté versEntrée /MSortie /MContexteQualité
claude-opus-4-7Anthropic Direct$5.00$25.001M10.0
claude-sonnet-4-6Anthropic Direct$3.00$15.001M7.0
gpt-5.5OpenAI Direct$5.00$30.001M10.0
gemini-3.1-pro-previewGoogle Direct$4.00$18.001M10.0
deepseek-v4-proDeepSeek$0.560$1.121M9.0
qwen3.6-plusAlibaba Cloud$0.500$3.001M8.0
kimi-k2.6Moonshot$0.900$3.75256K9.0
seedance-2.0ByteDancefrom $0.07 /sec10.0
+ 194 modèles supplémentaires · Prix mis à jour toutes les 60 s
Plateforme

Qualité production dès le premier jour.

Tout pour exécuter l'IA en production sans gérer plusieurs intégrations fournisseurs.

Routage de prix en temps réel

Les prix fournisseurs sont actualisés toutes les 60s. Chaque requête frappe le backend le moins cher disponible.

Bascule automatique

Le fournisseur tombe en plein stream ? Nous basculons de façon transparente. Votre app ne voit aucune erreur.

🔑

Gestion des clés API

Émettez des clés par équipe ou service avec plafonds de dépenses, liste blanche de modèles et limites de débit intégrées.

$

Suivi du coût par requête

Voyez exactement ce que chaque requête a coûté, quel fournisseur l'a gérée et combien vous avez économisé.

Compatible OpenAI

Changez une ligne. Même SDK, mêmes noms de modèles, même format de streaming. Effort de migration nul.

🛡

Application de budget

Limites strictes et souples par clé, équipe ou org. Réinitialisation mensuelle auto. Alertes Slack + webhook.


Différenciateur

Routage en boîte transparente.

Chaque requête vous indique le fournisseur qui l'a servie, le tarif public qu'il a appliqué et la route empruntée. Vérifiable à chaque appel et reproductible plus tard.

🔍

Attribution du fournisseur par requête

Chaque réponse est étiquetée avec le fournisseur en amont — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — et l'information apparaît dans votre tableau de bord et vos en-têtes.

📒

Registre au tarif public

Chaque charge de token correspond au tarif public du fournisseur. Auditez n'importe quelle requête face à la page tarifaire du fournisseur en quelques secondes.

Décisions de routage rejouables

Les événements de bascule, les changements de santé et les choix de backend les moins chers sont consignés avec horodatage. Reproduisez le chemin de routage de n'importe quelle requête.


Tarifs

Le routage est gratuit.
Payez pour les fonctionnalités.

Nous ne prenons jamais une part de vos dépenses de tokens. Nos revenus viennent des fonctionnalités d'équipe optionnelles.

Garantie sans majoration
Vous payez les fournisseurs directement à leurs tarifs publiés. Nous n'ajoutons rien aux coûts des tokens. Le routage est gratuit ; le plan Team optionnel finance la plateforme.
$0.00frais de routage

Hacker

Gratuit
À vie. Aucune majoration sur tous les tokens.
✓ 3 clés API
✓ Les 200+ modèles
✓ Basculement auto
✓ Tableau de bord basique
Commencer gratuitement

Entreprise

Sur mesure
Engagements SLA + déploiement privé.
✓ Option de déploiement privé
✓ Règles de routage personnalisées
✓ SLA uptime 99,99%
✓ Support dédié
✓ Journaux d'audit & conformité

Commencez à router plus intelligemment.

Inscrivez-vous avec GitHub — $5 en tokens gratuits. Aucune carte de crédit requise. Changez une ligne de code et vous êtes en direct.

© 2026 OrcaRouter