La qualité multi-modèles à petit prix.
N'attendez plus le prochain modèle — le prochain bond de capacité vient d'un panel, pas d'un point de contrôle. Fusion envoie vos requêtes les plus difficiles à plusieurs modèles de pointe à la fois, puis un juge pèse leurs accords, repère leurs contradictions et renvoie la réponse la plus solide — vérifiée par recoupement avec les autres. Utilisez-le pour le travail qui compte vraiment — raisonnement approfondi, code difficile, recherche, critique d'expert — partout où se tromper coûte plus que quelques générations supplémentaires.
Une conversation informelle va directement vers un modèle par défaut moins coûteux. Les requêtes de code, d'agent et utilisant des outils se déploient vers le panel — là où un deuxième avis paie vraiment.
Votre prompt atteint plusieurs modèles de pointe à la fois — des tentatives indépendantes qui rattrapent chacune ce que les autres manquent.
Un juge lit chaque candidat et renvoie le plus solide d'entre eux — vérifié par recoupement avec les autres, pas le premier jet d'un seul modèle.
Vous voulez une autre combinaison ? Créez votre propre panel dans l'éditeur Routing DSL.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="orcarouter/fusion-flash",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)Parce que fusion exécute chaque membre du panel plus un juge, une requête déployée est facturée comme la somme de ces complétions sous-jacentes plutôt que comme un seul modèle — et uniquement sur les requêtes qui se déploient réellement. Zéro majoration.