OrcaRouter: Fusion Flash

orcarouter/fusion-flash
Económico
Texto de entrada · Texto de salida · 200K ctx

Calidad multimodelo con un presupuesto ajustado.

Resumen

Deja de esperar al próximo modelo: el siguiente salto de capacidad viene de un panel, no de un checkpoint. Fusion envía tus prompts más difíciles a varios modelos de vanguardia a la vez, y luego un juez sopesa dónde coinciden, detecta dónde se contradicen y devuelve la respuesta más sólida, contrastada con las demás. Recúrrelo para el trabajo que de verdad importa: razonamiento profundo, código difícil, investigación, crítica experta, allí donde equivocarse cuesta más que unas pocas generaciones extra.

Cómo funciona

1

Enrutar por tarea

La conversación informal va directamente a un modelo por defecto más económico. Las solicitudes de código, agente y uso de herramientas se distribuyen al panel: ahí es donde una segunda opinión realmente vale la pena.

2

Distribuir a un panel

Tu indicación llega a varios modelos de vanguardia a la vez: intentos independientes que captan, cada uno, lo que los demás pasan por alto.

3

Elegir la mejor respuesta

Un juez lee cada candidato y devuelve el más sólido — contrastado con los demás, no el primer intento de un solo modelo.

Modelos en este enrutador

Gemini 3.5 FlashMiniMax M2.7GLM 5.1Claude Opus 4.8 · juez

¿Quieres otra combinación? Crea tu propio panel en el editor de Routing DSL.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="orcarouter/fusion-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Facturación

Como fusion ejecuta cada miembro del panel más un juez, una solicitud distribuida se factura como la suma de esas finalizaciones subyacentes en lugar de como un solo modelo, y solo en las solicitudes que realmente se distribuyen. Sin margen alguno.

Preguntas frecuentes

¿Qué es OrcaRouter: Fusion Flash?
Un enrutador multimodelo curado. En trabajo real ejecuta un panel de modelos en paralelo y un juez elige la mejor respuesta, contrastada con las demás; las solicitudes fáciles van a un modelo predeterminado más barato.
¿Cómo se factura?
Como la suma de los miembros del panel más el juez que realmente se ejecutó, solo en las solicitudes que se ramifican. Cero margen.