Calidad multimodelo con un presupuesto ajustado.
Deja de esperar al próximo modelo: el siguiente salto de capacidad viene de un panel, no de un checkpoint. Fusion envía tus prompts más difíciles a varios modelos de vanguardia a la vez, y luego un juez sopesa dónde coinciden, detecta dónde se contradicen y devuelve la respuesta más sólida, contrastada con las demás. Recúrrelo para el trabajo que de verdad importa: razonamiento profundo, código difícil, investigación, crítica experta, allí donde equivocarse cuesta más que unas pocas generaciones extra.
La conversación informal va directamente a un modelo por defecto más económico. Las solicitudes de código, agente y uso de herramientas se distribuyen al panel: ahí es donde una segunda opinión realmente vale la pena.
Tu indicación llega a varios modelos de vanguardia a la vez: intentos independientes que captan, cada uno, lo que los demás pasan por alto.
Un juez lee cada candidato y devuelve el más sólido — contrastado con los demás, no el primer intento de un solo modelo.
¿Quieres otra combinación? Crea tu propio panel en el editor de Routing DSL.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="orcarouter/fusion-flash",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)Como fusion ejecuta cada miembro del panel más un juez, una solicitud distribuida se factura como la suma de esas finalizaciones subyacentes en lugar de como un solo modelo, y solo en las solicitudes que realmente se distribuyen. Sin margen alguno.