Zero markup. Maior disponibilidade. Melhores preços.

Um Gateway. Todos os Modelos. Roteie melhor. Lance com segurança. Gaste menos.

A OrcaRouter avalia cada prompt e o roteia de forma inteligente. IA de qualidade de fronteira com até 40% menos custo. Roteamento adaptativo, balanceamento de carga, guardrails, firewall de agentes, observabilidade e governança — tudo por meio de um único endpoint compatível com OpenAI.

Sem cartão de crédito · no ar em 60 s

Supera GPT-5 e Azure no RouterArenaApoiado por pesquisa publicada
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Uma linha. Avaliamos cada prompt, roteamos para frontier ou OSS e adicionamos $0.

Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
200+
modelos, um endpoint
0%
de markup por token, nunca
75.5%
de precisão no roteamento
<50ms
failover no meio do stream
Construindo com isto? Vamos conversar.
Seu feedback molda o próximo lançamento.
Integrações

Funciona com as ferramentas que você já usa

Compatível com OpenAI de imediato, ou conecte agentes pelo servidor MCP do OrcaRouter — mantenha seu SDK, framework e editor.

Servidor MCP do OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLe mais
O gateway de IA para produção

Roteamento inteligente e failover automático em cada requisição.

Roteamento comprovadamente mais preciso.

Cada prompt é vetorizado e roteado por um modelo que aprende online a partir do tráfego real. No ranking público RouterArena (Jun 2026) ele lidera em precisão — à frente de GPT-5, Azure, Martian e NotDiamond — com 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* Com base nos dados do ranking RouterArena, junho de 2026.

Um provedor cai. Ninguém percebe.

Quando um provedor limita a taxa ou retorna 5xx, a OrcaRouter tenta novamente a solicitação em um modelo saudável entre mais de 200 opções antes de a resposta começar — falhas temporárias do provedor não chegam aos seus usuários.

200+ modelsauto-failoverno 429

Roteamento nos seus termos.

orcarouter/auto é um padrão inteligente, não uma caixa-preta. Direcione cada espaço de trabalho para o objetivo que você quer — o modelo mais barato que atinge seu limiar de qualidade, a qualidade mais alta ou um equilíbrio entre os dois — ou deixe-o aprender o compromisso a partir do seu próprio tráfego. Você nunca fica preso a um único comportamento.

per-workspaceno markup either way<1ms overhead

Veja e comprove cada chamada — custo, modelo, latência e o porquê.

Veja tudo. Comprove qualquer coisa.

Veja exatamente quanto cada requisição custou, qual modelo a atendeu, quanto tempo levou e por que falhou — logs estruturados completos que você pode filtrar, reproduzir e copiar como um cURL executável. Uma rota nunca é uma caixa-preta.

Per-request logsgrade · model · costcopy-as-cURL

Zero markup. Zero caixas-pretas.

Você paga a cada provedor exatamente o preço dele — nós adicionamos $0 por token, sempre. Cada requisição mostra a classificação, o modelo escolhido, o provedor, a latência e o preço, então o custo é transparente, não uma taxa combinada opaca.

$0 / tokenprovider costglass-box receipt

Prompts versionados e cache — sem novo deploy.

Mude prompts. Não código.

Versione prompts por trás de labels nomeados, com divisões A/B e rollback em um clique. Mova um label e cada requisição passa a usá-lo instantaneamente — sem redeploy, sem mudança de código, sem atualização de cliente.

VersionedA/BInstant rollbackNo deploy

Pague uma vez. Reutilize de graça.

Tokens de prompt repetidos e em cache são cobrados à taxa de cache do provedor — muitas vezes uma fração do preço de entrada — em janelas efêmeras de 5 minutos e 1 hora. Mesmas respostas, menos gasto, com cached_tokens em cada recibo.

cache_controlcached_tokens5m / 1h windows

Guardrails, orçamentos e um firewall de agentes que impõe regras.

Guardrails que realmente barram.

PII Shield e políticas de conteúdo são executados antes de a chamada upstream ser cobrada. Uma requisição bloqueada retorna um 400 limpo e nunca é cobrada — guardrails aplicados inline, não registrados depois do fato.

PII Shieldenforced pre-billingclean 400

Seguro para o seu time. E para seus agentes.

Orçamentos e papéis para pessoas; um firewall com pontuação de risco para agentes. Cada chamada de ferramenta e MCP é classificada como ALLOW, REVIEW ou BLOCK antes de ser executada, e a detecção de anomalias sinaliza picos de taxa e custo em relação a baselines de hora-da-semana aprendidos.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Feito para a era dos agentes. Antes de você precisar.

Controle total

Precisa de mais que um modo? Escreva a regra.

Quando o padrão não basta, expresse o roteamento como código — versionado, revisável e no ar em segundos. Sem reimplantar, sem alterar o cliente.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Configuração

No ar em 60 segundos.

Uma mudança de URL. Seu SDK, nomes de modelos e streaming funcionam como antes.

Passo 1
🔗

Aponte seu SDK para nós

Defina base_url para api.orcarouter.ai/v1 e troque sua chave API. Nenhuma outra mudança de código necessária.

Passo 2

Nós roteamos, protegemos e observamos

Cada chamada é roteada para o melhor modelo, verificada contra seus guardrails e medida — avaliada em menos de 1ms, com failover, cache e logs completos embutidos.

Passo 3

Você lança, em um só endpoint

O tráfego vai direto para a API first-party de cada provedor pela tarifa publicada — adicionamos $0 por token. Um endpoint compatível com OpenAI para roteamento, observabilidade e governança.


Todos os modelos. Uma lista de preços.

200+ modelos com preços ao vivo, lado a lado — o que você pagaria direto ao provedor. Adicionamos $0 por cima.

Ver todos os 200+ modelos →
ModeloRoteado paraEntrada /MSaída /MContextoQualidade
obsidian/Qwen3.6-35B-A3BNOVO$0.310$4.21262K4.0
obsidian/gemma-4-26B-A4BNOVO$0.250$2.90262K4.0
anthropic/claude-sonnet-5NOVOAnthropic Direct$2.00$10.001M9.0
kling/kling-3-turboNOVO$0.112 /call
z-ai/glm-5.2NOVOZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeNOVOMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5NOVOAnthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ Mais 194 modelos · Preços atualizados a cada 60 s

Tudo o que seu cliente OpenAI já chama.

Streaming, tool calls, saídas estruturadas, visão, embeddings e áudio — roteados sem alterações por todos os modelos.

ModeloStreamingFerramentasEstruturadoVisãoEmbeddingsÁudio
anthropic/claude-opus-4.8compatívelcompatívelcompatívelcompatívelnão compatívelnão compatível
google/gemini-3.1-pro-previewcompatívelcompatívelcompatívelcompatívelnão compatívelcompatível
openai/gpt-5.5-procompatívelcompatívelcompatívelcompatívelnão compatívelnão compatível
anthropic/claude-opus-4.7compatívelcompatívelcompatívelcompatívelnão compatívelnão compatível
grok/grok-4.3compatívelcompatívelcompatívelcompatívelnão compatívelnão compatível
Preços

O roteamento é grátis.
Pague pelas funcionalidades.

Nunca tiramos uma parcela do seu gasto com tokens. Nossa receita vem de recursos de equipe opcionais.

Garantia de zero markup
Você paga aos provedores diretamente nas tarifas publicadas. Não adicionamos nada ao custo dos tokens. O roteamento é gratuito; o plano Team opcional financia a plataforma.
$0.00taxa de roteamento

Hacker

Grátis
Para sempre. Zero markup em todos os tokens.
✓ Roteie — 200+ modelos, failover automático
✓ Observe — dashboard básico
✓ Gerencie — versionamento de prompts
✓ 3 chaves de API · 0% de markup por token
Começar grátis

Enterprise

Personalizado
Compromissos de SLA + implantação privada.
✓ Tudo do Team
✓ Deploy privado / on-premise
✓ SLA de 99.99% de uptime
✓ Infraestrutura dedicada
✓ Suporte dedicado e preços personalizados
Confiança e conformidade

Auditado de forma independente. Conformidade contínua.

Relatórios de auditoria disponíveis sob NDA — solicite uma cópia abaixo.

Mais inteligente, mais seguro, econômico.

Troque uma linha. É essa a migração.

Cadastre-se com GitHub — $5 em tokens grátis. Sem cartão de crédito. Você está no ar em menos de um minuto.