OrcaRouter: Fusion Flash

orcarouter/fusion-flash
經濟
文字輸入 · 文字輸出 · 200K ctx

以預算價獲得多模型品質。

概覽

別再等下一個模型了——能力的下一躍來自一組模型的協作,而不是一次版本更新。Fusion 把你最難的 prompt 同時發給多個前沿模型,再由裁判權衡它們的共識、捕捉它們的分歧,返回其中最強的那一份答案——並與其餘交叉核對。把它用在真正重要的工作上——深度推理、硬核編碼、研究、專家評審——任何「答錯的代價遠高於多跑幾次」的場景。

運作原理

1

依任務路由

閒聊直接交給成本更低的預設模型。程式設計、智慧代理和呼叫工具的請求才會展開到組——在這些場景裡第二意見才真正划算。

2

並行展開到一組模型

你的提示會同時命中多個前沿模型——彼此獨立的嘗試,各自補上其他模型漏掉的地方。

3

挑出最佳答案

裁判讀完每一個候選答案,返回其中最強的那一份——與其餘答案交叉核對,而不是單個模型的初版。

本路由器中的模型

Gemini 3.5 FlashMiniMax M2.7GLM 5.1Claude Opus 4.8 · 裁判

想換個組合?在路由 DSL 編輯器裡自建你的 panel。

程式碼範例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="orcarouter/fusion-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

計費

由於 fusion 會運行每個組成員加一個裁判,一次並行展開的請求會按這些底層補全的總和計費,而非單個模型——且僅對真正展開的請求收費。零加價。

常見問題

什麼是 OrcaRouter: Fusion Flash?
一個策展的多模型路由。處理真實工作時,它並行運行一組模型,再由裁判挑出最佳的那一份答案,並與其餘交叉核對;簡單請求走更便宜的默認模型。
如何計費?
按它實際跑過的 panel 成員 + 裁判求和計費,且只在扇出的請求上收費。零加價。