✦

OrcaRouter: Fusion Flash

orcarouter/fusion-flash

Budżetowy

Tekst wejściowy · Tekst wyjściowy · 200K ctx

Wielomodelowa jakość w ramach budżetu.

Uzyskaj klucz API →▶ Wypróbuj w Playground </> Użyj przez API

Przegląd

Przestań czekać na kolejny model — następny skok możliwości pochodzi z panelu, a nie z checkpointu. Fusion wysyła twoje najtrudniejsze zapytania do kilku czołowych modeli naraz, a następnie sędzia waży, w czym się zgadzają, wychwytuje sprzeczności i zwraca najmocniejszą odpowiedź — zweryfikowaną krzyżowo z pozostałymi. Sięgaj po niego przy pracy, która naprawdę się liczy — głębokie rozumowanie, trudny kod, badania, ekspercka recenzja — wszędzie tam, gdzie błąd kosztuje więcej niż kilka dodatkowych generacji.

Jak to działa

Twój prompt

Równolegle

Gemini 3.5 Flash

MiniMax M2.7

GLM 5.1

Claude Opus 4.8sędzia

Najlepsza odpowiedź

Routing według zadania

Zwykła rozmowa trafia prosto do tańszego modelu domyślnego. Żądania związane z kodowaniem, agentami i użyciem narzędzi rozgałęziają się do panelu — tam, gdzie druga opinia naprawdę się opłaca.

Rozgałęzienie do panelu

Twój prompt trafia do kilku wiodących modeli naraz — niezależne próby, z których każda wychwytuje to, co pozostałe pomijają.

Wybierz najlepszą odpowiedź

Sędzia czyta każdą propozycję i zwraca najmocniejszą z nich — zweryfikowaną krzyżowo z pozostałymi, a nie pierwszą próbę pojedynczego modelu.

Tylko tam, gdzie to ma sens. Fusion rozsyła zapytanie do panelu przy kodowaniu, zadaniach agentowych, korzystaniu z narzędzi i trudnych promptach — zwykła rozmowa trafia prosto do tańszego modelu domyślnego, więc płacisz za panel tylko przy zapytaniach, gdzie drugi punkt widzenia naprawdę się opłaca.

Dlaczego panel bije pojedynczy model

Pojedynczy model daje ci jedną próbę odpowiedzi na prompt — i żadnego sposobu na wychwycenie błędu, gdy się myli. Fusion uruchamia kilka czołowych modeli na tym samym prompcie jednocześnie, a niezależny sędzia odczytuje każdą odpowiedź i zwraca najsilniejszą, skonfrontowaną z pozostałymi. Niezgodność między silnymi modelami to sygnał: ujawnia trudne przypadki, w których jeden model po cichu by się mylił.

Pojedynczy model

Jeden model, jedna odpowiedź. Żadnego drugiego zdania — jeśli jest błędna, wysyłasz błąd.

Auto-router

Dobiera jeden model do każdego promptu, by obniżyć koszty. Inteligentniejszy wybór — ale nadal jedna odpowiedź.

Fusion

Panel odpowiada równolegle; sędzia zwraca najsilniejszą odpowiedź, skonfrontowaną z pozostałymi.

Panel + sędzia (Mixture-of-Agents)65.1%

Pojedynczy czołowy model (GPT-4o)57.5%

Wskaźnik wygranych AlpacaEval 2.0 z kontrolą długości — panel modeli z agregatorem przewyższa pojedynczy czołowy model. Mixture-of-Agents, Wang et al. 2024

Modele w tym routerze

Model	Rola	Kontekst
Gemini 3.5 Flash	Panel	1M
MiniMax M2.7	Panel	204K
GLM 5.1	Panel	200K
Claude Opus 4.8	Sędzia	1M

Chcesz inną kombinację? Zbuduj własny panel w edytorze Routing DSL.

Zbudowany na DSL routingu

Fusion nie jest przypadkiem specjalnym — to wbudowana konfiguracja naszego DSL routingu, małego izolowanego języka do precyzyjnego definiowania sposobu trasowania każdego żądania. Sklonuj szablon „Fable 5 Level" i zmień panel, sędziego, regułę bramkowania lub sposób wyboru zwycięzcy.

Najlepszy z NDomyślna konfiguracja Fusion

Model-sędzia ocenia wszystkich kandydatów i zwraca najsilniejszego dosłownie — nigdy rozmytego połączenia.

Głosowanie większościowe

Panel głosuje nad ustrukturyzowaną odpowiedzią — bez dodatkowego wywołania sędziego.

Synteza

Model-agregator łączy kandydatów w jedną ulepszoną odpowiedź (Mixture-of-Agents).

Testy zaliczone

Dla kodu: wygrywa kandydat, którego łatka faktycznie przechodzi twój zestaw testów.

Pierwszy

Wyścig — wygrywa najszybsza gałąź, gdy priorytetem jest szybkość.

Żadnej czarnej skrzynki. Zbuduj własny router w DSL, a każde równoległe wywołanie zostanie zarejestrowane — które modele brały udział w wyścigu, czas odpowiedzi i status każdego etapu oraz która odpowiedź została wybrana przez sędziego — dzięki czemu w konsoli zobaczysz dokładnie, dlaczego dana odpowiedź wygrała.

Otwórz edytor DSL routingu →

Przykłady kodu

import os

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key=os.environ["ORCAROUTER_API_KEY"],
)

response = client.chat.completions.create(
    model="orcarouter/fusion-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Rozliczenia

Ponieważ fusion uruchamia każdego członka panelu oraz sędziego, rozgałęzione żądanie jest rozliczane jako suma tych bazowych uzupełnień, a nie pojedynczy model — i tylko przy żądaniach, które faktycznie się rozgałęziają. Bez żadnej marży.

FAQ

Czym jest OrcaRouter: Fusion Flash?

Wyselekcjonowany router wielomodelowy. Przy realnej pracy uruchamia panel modeli równolegle, a sędzia wybiera najlepszą odpowiedź, zweryfikowaną krzyżowo z pozostałymi; proste żądania trafiają do tańszego modelu domyślnego.

Jak naliczane są opłaty?

Jako suma członków panelu plus sędzia, który faktycznie został uruchomiony, tylko dla żądań, które się rozgałęziają. Zero narzutu.

Czy Fusion scala odpowiedzi ze sobą?

Nie. Sędzia wybiera jednego najsilniejszego kandydata i zwraca go dosłownie — zawsze otrzymujesz prawdziwą odpowiedź modelu, nigdy uśrednioną ani zblendowaną.

Co się dzieje, gdy jeden z modeli zawiedzie?

Pozostałe gałęzie nadal działają, a sędzia wybiera spośród tych, które się powiodły; routing przełącza się też na kolejne najlepsze wdrożenie, więc usterka jednego dostawcy nie powoduje błędu całego żądania.

Czy każde zapytanie uruchamia cały panel?

Nie — tylko zapytania dotyczące kodowania, agentów, użycia narzędzi i trudnych poleceń są rozsyłane do panelu. Zwykły czat trafia do tańszego domyślnego modelu, więc za panel płacisz tylko tam, gdzie druga opinia ma sens.