Qualità multi-modello a basso costo.
Smetti di aspettare il prossimo modello: il prossimo salto di capacità viene da un panel, non da un checkpoint. Fusion invia i tuoi prompt più difficili a diversi modelli di frontiera contemporaneamente, poi un giudice valuta dove concordano, individua dove si contraddicono e restituisce la risposta più solida — verificata in modo incrociato con le altre. Usalo per il lavoro che conta davvero — ragionamento profondo, coding difficile, ricerca, revisione di esperti — ovunque sbagliare costi più di qualche generazione in più.
Le conversazioni informali vanno direttamente a un modello predefinito più economico. Le richieste di codice, agente e uso di strumenti si distribuiscono al panel: è qui che una seconda opinione conviene davvero.
Il tuo prompt raggiunge più modelli di frontiera contemporaneamente — tentativi indipendenti che colgono ciascuno ciò che gli altri tralasciano.
Un giudice legge ogni candidato e restituisce quello più solido — verificato in modo incrociato con gli altri, non il primo tentativo di un singolo modello.
Vuoi una combinazione diversa? Crea il tuo panel nell'editor Routing DSL.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="orcarouter/fusion-flash",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)Poiché fusion esegue ogni membro del panel più un giudice, una richiesta distribuita viene fatturata come la somma di quei completamenti sottostanti anziché come un singolo modello, e solo sulle richieste che si distribuiscono davvero. Nessun margine.