以预算价获得多模型品质。
别再等下一个模型了——能力的下一跃来自一组模型的协作,而不是一次版本更新。Fusion 把你最难的 prompt 同时发给多个前沿模型,再由裁判权衡它们的共识、捕捉它们的分歧,返回其中最强的那一份答案——并与其余交叉核对。把它用在真正重要的工作上——深度推理、硬核编码、研究、专家评审——任何“答错的代价远高于多跑几次”的场景。
闲聊直接交给成本更低的默认模型。编程、智能体和调用工具的请求才会展开到组——在这些场景里第二意见才真正划算。
你的提示会同时命中多个前沿模型——彼此独立的尝试,各自补上其他模型漏掉的地方。
裁判读完每一个候选答案,返回其中最强的那一份——与其余答案交叉核对,而不是单个模型的初版。
想换个组合?在路由 DSL 编辑器里自建你的 panel。
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="orcarouter/fusion-flash",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)由于 fusion 会运行每个组成员加一个裁判,一次并行展开的请求会按这些底层补全的总和计费,而非单个模型——且仅对真正展开的请求收费。零加价。