✦

OrcaRouter: Fusion Flash

orcarouter/fusion-flash

經濟

文字輸入 · 文字輸出 · 200K ctx

以預算價獲得多模型品質。

取得 API 金鑰 →▶ 在 Playground 中試用 </> 透過 API 使用

概覽

別再等下一個模型了——能力的下一躍來自一組模型的協作,而不是一次版本更新。Fusion 把你最難的 prompt 同時發給多個前沿模型,再由裁判權衡它們的共識、捕捉它們的分歧,返回其中最強的那一份答案——並與其餘交叉核對。把它用在真正重要的工作上——深度推理、硬核編碼、研究、專家評審——任何「答錯的代價遠高於多跑幾次」的場景。

運作原理

您的提示詞

並行處理

Gemini 3.5 Flash

MiniMax M2.7

GLM 5.1

Claude Opus 4.8裁判

最佳回答

依任務路由

閒聊直接交給成本更低的預設模型。程式設計、智慧代理和呼叫工具的請求才會展開到組——在這些場景裡第二意見才真正划算。

並行展開到一組模型

你的提示會同時命中多個前沿模型——彼此獨立的嘗試，各自補上其他模型漏掉的地方。

挑出最佳答案

裁判讀完每一個候選答案,返回其中最強的那一份——與其餘答案交叉核對,而不是單個模型的初版。

只在有幫助的時候才啟用。 Fusion 會在編程、代理、工具調用及複雜提示詞時啟動面板——日常對話則直接路由至較低成本的預設模型，讓您只在第二意見真正有價值的請求上才為面板付費。

為何面板勝過單一模型

單一模型對您的提示詞只有一次作答機會——一旦出錯，您無從察覺。Fusion 同時讓多個前沿模型處理同一提示詞，再由獨立評審讀取每份回答，並在相互比對後返回最優解。強力模型之間的分歧本身就是信號：它能浮現那些單一模型會悄悄答錯的難題。

單一模型

一個模型，一個回答。沒有第二意見——答錯了就原樣輸出。

自動路由器

為每個提示詞挑選一個模型以節省成本。選擇更聰明，但仍只有單一回答。

Fusion

面板並行作答；評審在相互比對後返回最優解。

面板 + 評審（Mixture-of-Agents）65.1%

頂級單一模型（GPT-4o）57.5%

AlpacaEval 2.0 長度控制勝率——搭配聚合器的模型面板，表現優於頂級單一模型。 Mixture-of-Agents，Wang et al. 2024

本路由器中的模型

模型	角色	上下文
Gemini 3.5 Flash	面板	1M
MiniMax M2.7	面板	204K
GLM 5.1	面板	200K
Claude Opus 4.8	評審	1M

想換個組合?在路由 DSL 編輯器裡自建你的 panel。

建構於路由 DSL 之上

Fusion 並非特例——它是我們路由 DSL 的內建配置。路由 DSL 是一門小型沙箱語言，用於精確定義每個請求的路由方式。您可以複製「Fable 5 Level」範本，自由修改面板、評審、閘控規則或勝者選擇方式。

最優 N 選一Fusion 預設配置

評審模型對所有候選逐一排名，原文返回最優解——絕不做稀釋式合併。

多數決

面板對結構化回答進行投票——無需額外調用評審。

合成

由聚合器模型將所有候選融合為一份更優回答（Mixture-of-Agents）。

測試通過

針對程式碼：實際通過您測試套件的候選補丁獲勝。

最快優先

競速模式——延遲最低的分支獲勝，適用於速度最為關鍵的場景。

無黑箱。 在 DSL 上建構您自己的路由器，每一次扇出都會被記錄下來——哪些模型參與了競速、每個分支的延遲與狀態，以及評判選擇了哪個答案——讓您在控制台中清楚看到某個答案勝出的確切原因。

開啟路由 DSL 編輯器 →

程式碼範例

import os

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key=os.environ["ORCAROUTER_API_KEY"],
)

response = client.chat.completions.create(
    model="orcarouter/fusion-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

計費

由於 fusion 會運行每個組成員加一個裁判，一次並行展開的請求會按這些底層補全的總和計費，而非單個模型——且僅對真正展開的請求收費。零加價。

常見問題

什麼是 OrcaRouter: Fusion Flash？

一個策展的多模型路由。處理真實工作時,它並行運行一組模型,再由裁判挑出最佳的那一份答案,並與其餘交叉核對;簡單請求走更便宜的默認模型。

如何計費？

按它實際跑過的 panel 成員 + 裁判求和計費,且只在扇出的請求上收費。零加價。

Fusion 會將回答合併在一起嗎？

不會。評審會挑選唯一最強的候選，並原文返回——您收到的永遠是某個模型的真實回答，而非平均或混合的結果。

如果其中一個模型失敗了，會怎樣？

其餘分支仍會繼續運行，評審將從成功的回答中擇優返回；路由系統也會自動容錯至次佳部署，因此單一供應商的異常不會導致請求失敗。

每個請求都會執行整個模型組合嗎？

不會——只有程式撰寫、智能代理、工具呼叫及複雜提示才會分散至多個模型。一般對話會走較低成本的預設模型，因此只有在第二意見真正有幫助的情況下，您才會被收取模型組合的費用。