O OrcaRouter direciona cada prompt para o modelo certo: raciocínio complexo para modelos de fronteira, tarefas rotineiras para modelos open source. Você obtém qualidade de fronteira quando importa e paga preços open source no resto. Zero sobretaxa. Zero migração. Uma única API.
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="gpt-4o",messages=[{"role": "user", "content": "..."}])# → routed to cheapest live backend, zero markup ✓
Seu tráfego vai direto ao provedor upstream, sem nenhum proxy oculto no meio. O provedor que aparece nos seus logs é o que de fato atendeu à requisição.
Os termos de dados e uso de cada provedor upstream se aplicam diretamente ao seu tráfego. Escolha o provedor que corresponde à sua política.
Cada chamada registra o provedor, o preço público e a rota seguida. Você pode reproduzir qualquer decisão de roteamento depois pelo painel.
Uma mudança de URL. Seu SDK, nomes de modelos e streaming funcionam como antes.
Defina base_url para api.orcarouter.ai/v1 e troque sua chave API. Nenhuma outra mudança de código necessária.
Cada solicitação verifica saúde e preços dos provedores em tempo real em menos de 1ms. Escolhemos o backend direto mais barato disponível.
O tráfego vai direto para o provedor. Você paga a tarifa publicada deles. Adicionamos exatamente $0 em cima — nossa taxa é pelo plano, não pelos seus tokens.
Roteamento em tempo real para o backend ao vivo mais barato. Preços atualizados a cada 60s.
| Modelo | Roteado para | Entrada /M | Saída /M | Contexto | Qualidade |
|---|---|---|---|---|---|
| claude-opus-4-7 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| claude-sonnet-4-6 | Anthropic Direct | $3.00 | $15.00 | 1M | 7.0 |
| gpt-5.5 | OpenAI Direct | $5.00 | $30.00 | 1M | 10.0 |
| gemini-3.1-pro-preview | Google Direct | $4.00 | $18.00 | 1M | 10.0 |
| deepseek-v4-pro | DeepSeek | $0.560 | $1.12 | 1M | 9.0 |
| qwen3.6-plus | Alibaba Cloud | $0.500 | $3.00 | 1M | 8.0 |
| kimi-k2.6 | Moonshot | $0.900 | $3.75 | 256K | 9.0 |
| seedance-2.0 | ByteDance | from $0.07 /sec | — | — | 10.0 |
| + Mais 194 modelos · Preços atualizados a cada 60 s | |||||
Tudo que você precisa para rodar IA em produção sem gerenciar múltiplas integrações.
Preços de provedores atualizados a cada 60s. Cada solicitação chega ao backend mais barato disponível.
Provedor cai no meio do stream? Trocamos de forma transparente. Seu app não vê erros.
Emita chaves por equipe ou serviço com limites de gasto, allowlists de modelos e rate limits integrados.
Veja exatamente quanto cada solicitação custou, qual provedor a lidou e quanto você economizou.
Mude uma linha. Mesmo SDK, mesmos nomes de modelos, mesmo formato de streaming. Zero esforço de migração.
Limites rígidos e flexíveis por chave, equipe ou org. Reinicialização automática mensal. Alertas Slack + webhook.
Cada requisição mostra o provedor que a atendeu, o preço público cobrado e a rota seguida. Verificável a cada chamada e reproduzível depois.
Cada resposta é marcada com o provedor upstream — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — e aparece no seu painel e nos cabeçalhos.
Cada cobrança por token equivale ao preço público de tabela do provedor. Audite qualquer requisição contra a página de preços do provedor em segundos.
Eventos de failover, trocas de saúde e escolhas do backend mais barato são registrados com timestamp. Reproduza o caminho de roteamento de qualquer requisição.
Nunca tiramos uma parcela do seu gasto com tokens. Nossa receita vem de recursos de equipe opcionais.
Cadastre-se com o GitHub — $5 em tokens grátis. Sem cartão de crédito. Troque uma linha de código e você está no ar.
OrcaRouter