Wielomodelowa jakość w ramach budżetu.
Przestań czekać na kolejny model — następny skok możliwości pochodzi z panelu, a nie z checkpointu. Fusion wysyła twoje najtrudniejsze zapytania do kilku czołowych modeli naraz, a następnie sędzia waży, w czym się zgadzają, wychwytuje sprzeczności i zwraca najmocniejszą odpowiedź — zweryfikowaną krzyżowo z pozostałymi. Sięgaj po niego przy pracy, która naprawdę się liczy — głębokie rozumowanie, trudny kod, badania, ekspercka recenzja — wszędzie tam, gdzie błąd kosztuje więcej niż kilka dodatkowych generacji.
Zwykła rozmowa trafia prosto do tańszego modelu domyślnego. Żądania związane z kodowaniem, agentami i użyciem narzędzi rozgałęziają się do panelu — tam, gdzie druga opinia naprawdę się opłaca.
Twój prompt trafia do kilku wiodących modeli naraz — niezależne próby, z których każda wychwytuje to, co pozostałe pomijają.
Sędzia czyta każdą propozycję i zwraca najmocniejszą z nich — zweryfikowaną krzyżowo z pozostałymi, a nie pierwszą próbę pojedynczego modelu.
Chcesz inną kombinację? Zbuduj własny panel w edytorze Routing DSL.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="orcarouter/fusion-flash",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)Ponieważ fusion uruchamia każdego członka panelu oraz sędziego, rozgałęzione żądanie jest rozliczane jako suma tych bazowych uzupełnień, a nie pojedynczy model — i tylko przy żądaniach, które faktycznie się rozgałęziają. Bez żadnej marży.