OrcaRouter: Fusion Flash

orcarouter/fusion-flash
Econômico
Texto de entrada · Texto de saída · 200K ctx

Qualidade multimodelo com orçamento enxuto.

Visão geral

Pare de esperar pelo próximo modelo — o próximo salto de capacidade vem de um painel, não de um checkpoint. O Fusion envia seus prompts mais difíceis a vários modelos de ponta de uma vez e, em seguida, um juiz pondera onde concordam, detecta onde se contradizem e devolve a resposta mais forte — verificada de forma cruzada com as demais. Use-o no trabalho que realmente importa — raciocínio profundo, código difícil, pesquisa, crítica especializada — onde errar custa mais do que algumas gerações extras.

Como funciona

1

Rotear por tarefa

Conversas casuais vão direto para um modelo padrão mais barato. Solicitações de código, agente e uso de ferramentas se distribuem para o painel — é aí que uma segunda opinião realmente compensa.

2

Distribuir para um painel

Seu prompt atinge vários modelos de ponta ao mesmo tempo — tentativas independentes que captam, cada uma, o que as outras deixam passar.

3

Escolher a melhor resposta

Um juiz lê cada candidato e devolve o mais forte — verificado de forma cruzada com os outros, não a primeira tentativa de um único modelo.

Modelos neste roteador

Gemini 3.5 FlashMiniMax M2.7GLM 5.1Claude Opus 4.8 · juiz

Quer uma combinação diferente? Crie seu próprio painel no editor de Routing DSL.

Exemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="orcarouter/fusion-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Faturamento

Como o fusion executa cada membro do painel mais um juiz, uma solicitação distribuída é cobrada como a soma dessas conclusões subjacentes em vez de um único modelo — e apenas nas solicitações que realmente se distribuem. Sem margem.

FAQ

O que é OrcaRouter: Fusion Flash?
Um roteador multimodelo curado. Em trabalho real, executa um painel de modelos em paralelo e um juiz escolhe a melhor resposta, verificada de forma cruzada com as demais; pedidos fáceis vão para um modelo padrão mais barato.
Como é cobrado?
Como a soma dos membros do painel mais o juiz que realmente rodou, apenas nas requisições que se ramificam. Zero markup.