Qualidade de fronteira. Preços open source.

Uma API. Todos os modelos. Zero intermediários.

O OrcaRouter direciona cada prompt para o modelo certo: raciocínio complexo para modelos de fronteira, tarefas rotineiras para modelos open source. Você obtém qualidade de fronteira quando importa e paga preços open source no resto. Zero sobretaxa. Zero migração. Uma única API.

- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="gpt-4o",
messages=[{"role": "user", "content": "..."}]
)
# → routed to cheapest live backend, zero markup ✓
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
0%
margem de roteamento. nunca.
~40%
redução de custo média vs preço de lista
200+
modelos de 10+ provedores
<1ms
sobrecarga de roteamento
Construindo com isto? Vamos conversar.
Seu feedback molda o próximo lançamento.
Como funciona o roteamento

Pass-through por design.

Roteamento direto ao provedor

Seu tráfego vai direto ao provedor upstream, sem nenhum proxy oculto no meio. O provedor que aparece nos seus logs é o que de fato atendeu à requisição.

Os termos do provedor se aplicam de ponta a ponta

Os termos de dados e uso de cada provedor upstream se aplicam diretamente ao seu tráfego. Escolha o provedor que corresponde à sua política.

🧾

Auditabilidade por requisição

Cada chamada registra o provedor, o preço público e a rota seguida. Você pode reproduzir qualquer decisão de roteamento depois pelo painel.


Configuração

No ar em 60 segundos.

Uma mudança de URL. Seu SDK, nomes de modelos e streaming funcionam como antes.

Passo 1
🔗

Aponte seu SDK para nós

Defina base_url para api.orcarouter.ai/v1 e troque sua chave API. Nenhuma outra mudança de código necessária.

Passo 2

Roteamos em tempo real

Cada solicitação verifica saúde e preços dos provedores em tempo real em menos de 1ms. Escolhemos o backend direto mais barato disponível.

Passo 3

Você paga o custo do provedor

O tráfego vai direto para o provedor. Você paga a tarifa publicada deles. Adicionamos exatamente $0 em cima — nossa taxa é pelo plano, não pelos seus tokens.


Preços ao vivo

Todos os modelos.
Melhor tarifa disponível.

Roteamento em tempo real para o backend ao vivo mais barato. Preços atualizados a cada 60s.

Ver todos os 200+ modelos →
ModeloRoteado paraEntrada /MSaída /MContextoQualidade
claude-opus-4-7Anthropic Direct$5.00$25.001M10.0
claude-sonnet-4-6Anthropic Direct$3.00$15.001M7.0
gpt-5.5OpenAI Direct$5.00$30.001M10.0
gemini-3.1-pro-previewGoogle Direct$4.00$18.001M10.0
deepseek-v4-proDeepSeek$0.560$1.121M9.0
qwen3.6-plusAlibaba Cloud$0.500$3.001M8.0
kimi-k2.6Moonshot$0.900$3.75256K9.0
seedance-2.0ByteDancefrom $0.07 /sec10.0
+ Mais 194 modelos · Preços atualizados a cada 60 s
Plataforma

Qualidade de produção desde o primeiro dia.

Tudo que você precisa para rodar IA em produção sem gerenciar múltiplas integrações.

Roteamento de preço em tempo real

Preços de provedores atualizados a cada 60s. Cada solicitação chega ao backend mais barato disponível.

Failover automático

Provedor cai no meio do stream? Trocamos de forma transparente. Seu app não vê erros.

🔑

Gerenciamento de chaves API

Emita chaves por equipe ou serviço com limites de gasto, allowlists de modelos e rate limits integrados.

$

Rastreamento de custo por solicitação

Veja exatamente quanto cada solicitação custou, qual provedor a lidou e quanto você economizou.

Compatível com OpenAI

Mude uma linha. Mesmo SDK, mesmos nomes de modelos, mesmo formato de streaming. Zero esforço de migração.

🛡

Aplicação de orçamento

Limites rígidos e flexíveis por chave, equipe ou org. Reinicialização automática mensal. Alertas Slack + webhook.


Diferencial

Roteamento de caixa de vidro.

Cada requisição mostra o provedor que a atendeu, o preço público cobrado e a rota seguida. Verificável a cada chamada e reproduzível depois.

🔍

Atribuição de provedor por requisição

Cada resposta é marcada com o provedor upstream — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — e aparece no seu painel e nos cabeçalhos.

📒

Registro a tarifa pública

Cada cobrança por token equivale ao preço público de tabela do provedor. Audite qualquer requisição contra a página de preços do provedor em segundos.

Decisões de roteamento reproduzíveis

Eventos de failover, trocas de saúde e escolhas do backend mais barato são registrados com timestamp. Reproduza o caminho de roteamento de qualquer requisição.


Preços

O roteamento é grátis.
Pague pelas funcionalidades.

Nunca tiramos uma parcela do seu gasto com tokens. Nossa receita vem de recursos de equipe opcionais.

Garantia de zero markup
Você paga aos provedores diretamente nas tarifas publicadas. Não adicionamos nada ao custo dos tokens. O roteamento é gratuito; o plano Team opcional financia a plataforma.
$0.00taxa de roteamento

Hacker

Grátis
Para sempre. Zero markup em todos os tokens.
✓ 3 chaves API
✓ Todos os 200+ modelos
✓ Failover automático
✓ Painel básico
Começar grátis

Enterprise

Personalizado
Compromissos de SLA + implantação privada.
✓ Opção de implantação privada
✓ Regras de roteamento personalizadas
✓ SLA de 99,99% uptime
✓ Suporte dedicado
✓ Logs de auditoria e conformidade

Comece a rotear com mais inteligência.

Cadastre-se com o GitHub — $5 em tokens grátis. Sem cartão de crédito. Troque uma linha de código e você está no ar.