OrcaRouter dirige chaque prompt vers le modèle adéquat : raisonnement complexe vers les modèles de pointe, tâches courantes vers les modèles open source. Vous obtenez la qualité de pointe quand elle compte et payez les prix open source partout ailleurs. Zéro majoration. Zéro migration. Une seule API.
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="gpt-4o",messages=[{"role": "user", "content": "..."}])# → routed to cheapest live backend, zero markup ✓
Votre trafic est dirigé vers le fournisseur en amont sans proxy fantôme intermédiaire. Le fournisseur que vous voyez dans vos journaux est celui qui a réellement servi la requête.
Les conditions de données et d'utilisation de chaque fournisseur en amont s'appliquent directement à votre trafic. Choisissez le fournisseur qui correspond à votre politique.
Chaque appel enregistre le fournisseur, le prix public et la route empruntée. Vous pouvez reproduire toute décision de routage plus tard depuis le tableau de bord.
Un changement d'URL. Votre SDK, noms de modèles et streaming fonctionnent comme avant.
Définissez base_url sur api.orcarouter.ai/v1 et changez votre clé API. Aucun autre changement de code nécessaire.
Chaque requête vérifie la santé et les prix des fournisseurs en direct en moins de 1 ms. Nous choisissons le backend direct le moins cher disponible.
Le trafic va directement au fournisseur. Vous leur payez leur tarif publié. Nous ajoutons exactement 0 $ — nos frais sont sur le plan, pas sur vos tokens.
Routage en temps réel vers le backend le moins cher en direct. Prix actualisés toutes les 60s.
| Modèle | Routé vers | Entrée /M | Sortie /M | Contexte | Qualité |
|---|---|---|---|---|---|
| claude-opus-4-7 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| claude-sonnet-4-6 | Anthropic Direct | $3.00 | $15.00 | 1M | 7.0 |
| gpt-5.5 | OpenAI Direct | $5.00 | $30.00 | 1M | 10.0 |
| gemini-3.1-pro-preview | Google Direct | $4.00 | $18.00 | 1M | 10.0 |
| deepseek-v4-pro | DeepSeek | $0.560 | $1.12 | 1M | 9.0 |
| qwen3.6-plus | Alibaba Cloud | $0.500 | $3.00 | 1M | 8.0 |
| kimi-k2.6 | Moonshot | $0.900 | $3.75 | 256K | 9.0 |
| seedance-2.0 | ByteDance | from $0.07 /sec | — | — | 10.0 |
| + 194 modèles supplémentaires · Prix mis à jour toutes les 60 s | |||||
Tout pour exécuter l'IA en production sans gérer plusieurs intégrations fournisseurs.
Les prix fournisseurs sont actualisés toutes les 60s. Chaque requête frappe le backend le moins cher disponible.
Le fournisseur tombe en plein stream ? Nous basculons de façon transparente. Votre app ne voit aucune erreur.
Émettez des clés par équipe ou service avec plafonds de dépenses, liste blanche de modèles et limites de débit intégrées.
Voyez exactement ce que chaque requête a coûté, quel fournisseur l'a gérée et combien vous avez économisé.
Changez une ligne. Même SDK, mêmes noms de modèles, même format de streaming. Effort de migration nul.
Limites strictes et souples par clé, équipe ou org. Réinitialisation mensuelle auto. Alertes Slack + webhook.
Chaque requête vous indique le fournisseur qui l'a servie, le tarif public qu'il a appliqué et la route empruntée. Vérifiable à chaque appel et reproductible plus tard.
Chaque réponse est étiquetée avec le fournisseur en amont — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — et l'information apparaît dans votre tableau de bord et vos en-têtes.
Chaque charge de token correspond au tarif public du fournisseur. Auditez n'importe quelle requête face à la page tarifaire du fournisseur en quelques secondes.
Les événements de bascule, les changements de santé et les choix de backend les moins chers sont consignés avec horodatage. Reproduisez le chemin de routage de n'importe quelle requête.
Nous ne prenons jamais une part de vos dépenses de tokens. Nos revenus viennent des fonctionnalités d'équipe optionnelles.
Inscrivez-vous avec GitHub — $5 en tokens gratuits. Aucune carte de crédit requise. Changez une ligne de code et vous êtes en direct.
OrcaRouter