Cero margen. Mayor disponibilidad. Mejores precios.

Un Gateway. Todos los Modelos. Enruta Mejor. Lanza Seguro. Gasta Menos.

OrcaRouter evalúa cada prompt y lo enruta de forma inteligente. IA de calidad de frontera hasta un 40 % más barata. Enrutamiento adaptativo, balanceo de carga, guardrails, firewall de agentes, observabilidad y gobernanza, todo a través de un único endpoint compatible con OpenAI.

Sin tarjeta de crédito · operativo en 60 s

Supera a GPT-5 y Azure en RouterArenaRespaldado por investigación publicada
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Una línea. Calificamos cada prompt, enrutamos a frontera u OSS y añadimos $0.

Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
grok/grok-4.3$1.25 in·$2.50 out
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
grok/grok-4.3$1.25 in·$2.50 out
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
200+
modelos, un endpoint
0%
recargo por token, nunca
75.5%
precisión de enrutamiento
<50ms
failover en pleno stream
¿Estás construyendo con esto? Hablemos.
Tu feedback da forma a la próxima versión.
Integraciones

Funciona con las herramientas que ya usas

Compatible con OpenAI al instante, o conecta agentes mediante el servidor MCP de OrcaRouter — conserva tu SDK, framework y editor.

Servidor MCP de OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLy más
La pasarela de IA para producción

Enrutamiento inteligente y failover automático en cada petición.

Enrutamiento mediblemente más preciso.

Cada prompt se incrusta y se enruta con un modelo que sigue aprendiendo en línea del tráfico real. En el ranking público de RouterArena (Jun 2026) lidera en precisión — por delante de GPT-5, Azure, Martian y NotDiamond — con un 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* Según los datos de la clasificación de RouterArena, junio de 2026.

Un proveedor se cae. Nadie lo nota.

Cuando un proveedor limita la tasa o devuelve 5xx, OrcaRouter reintenta la solicitud en un modelo sano entre más de 200 opciones antes de que empiece la respuesta, de modo que los fallos transitorios del proveedor no llegan a tus usuarios.

200+ modelsauto-failoverno 429

Enrutamiento según tus reglas.

orcarouter/auto es un valor predeterminado inteligente, no una caja negra. Orienta cada espacio de trabajo hacia el objetivo que quieras — el modelo más barato que supere tu umbral de calidad, la máxima calidad o un equilibrio entre ambos — o deja que aprenda el equilibrio a partir de tu propio tráfico. Nunca quedas atado a un único comportamiento.

per-workspaceno markup either way<1ms overhead

Ve y demuestra cada llamada — coste, modelo, latencia y por qué.

Ve todo. Demuestra cualquier cosa.

Mira exactamente cuánto costó cada solicitud, qué modelo la atendió, cuánto tardó y por qué falló — registros estructurados completos que puedes filtrar, reproducir y copiar como un cURL ejecutable. Una ruta nunca es una caja negra.

Per-request logsgrade · model · costcopy-as-cURL

Cero recargo. Cero cajas negras.

Pagas a cada proveedor su precio exacto — añadimos $0 por token, siempre. Cada solicitud muestra la calificación, el modelo elegido, el proveedor, la latencia y el precio, de modo que el costo es una caja de cristal, no una tarifa combinada opaca.

$0 / tokenprovider costglass-box receipt

Prompts versionados y caché — sin redespliegue.

Cambia los prompts. No el código.

Versiona prompts detrás de etiquetas con nombre, con divisiones A/B y rollback con un solo clic. Mueve una etiqueta y cada solicitud la adopta al instante — sin redespliegue, sin cambios de código, sin actualización del cliente.

VersionedA/BInstant rollbackNo deploy

Paga una vez. Reutiliza gratis.

Los tokens de prompt repetidos y en caché se facturan a la tarifa de caché del proveedor — a menudo una fracción del precio de entrada — a través de ventanas efímeras de 5 minutos y 1 hora. Las mismas respuestas, con menos gasto, con cached_tokens en cada recibo.

cache_controlcached_tokens5m / 1h windows

Guardrails, presupuestos y un firewall de agentes que se aplica.

Guardrails que detienen las cosas.

PII Shield y las políticas de contenido se ejecutan antes de que se facture la llamada upstream. Una solicitud bloqueada devuelve un 400 limpio y nunca se cobra — barreras de protección aplicadas en línea, no registradas después de los hechos.

PII Shieldenforced pre-billingclean 400

Seguro para tu equipo. Y para tus agentes.

Presupuestos y roles para las personas; un firewall con puntuación de riesgo para los agentes. Cada llamada de herramienta y MCP se califica como ALLOW, REVIEW o BLOCK antes de ejecutarse, y la detección de anomalías marca picos de tasa y costo frente a líneas base aprendidas por hora de la semana.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Creado para la era de los agentes. Antes de que lo necesitaras.

Control total

¿Necesitas más que un modo? Escribe la regla.

Cuando el valor predeterminado no basta, expresa el enrutamiento como código — versionado, revisable y activo en segundos. Sin redespliegues ni cambios en el cliente.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Configuración

En vivo en 60 segundos.

Un cambio de URL. Su SDK, nombres de modelos y streaming funcionan igual que antes.

Paso 1
🔗

Apunte su SDK a nosotros

Establezca base_url en api.orcarouter.ai/v1 y cambie su clave API. No se necesitan otros cambios de código.

Paso 2

Nosotros enrutamos, protegemos y observamos

Cada llamada se enruta al mejor modelo, se verifica contra tus guardrails y se mide — evaluada en menos de 1ms, con failover, caché y logs completos incluidos.

Paso 3

Tú lanzas, en un solo endpoint

El tráfico va directo a la API propia de cada proveedor a su tarifa publicada — añadimos $0 por token. Un único endpoint compatible con OpenAI para enrutamiento, observabilidad y gobernanza.


Cada modelo. Una lista de precios.

200+ modelos con precios en vivo y comparados — lo que pagarías al proveedor directamente. Añadimos $0 encima.

Ver los 200+ modelos →
ModeloEnrutado aEntrada /MSalida /MContextoCalidad
obsidian/Qwen3.6-35B-A3BNUEVO$0.310$4.21262K4.0
obsidian/gemma-4-26B-A4BNUEVO$0.250$2.90262K4.0
anthropic/claude-sonnet-5NUEVOAnthropic Direct$2.00$10.001M9.0
kling/kling-3-turboNUEVO$0.112 /call
z-ai/glm-5.2NUEVOZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeNUEVOMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5NUEVOAnthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ 194 modelos más · Precios cada 60 segundos

Todo lo que tu cliente de OpenAI ya invoca.

Streaming, tool calls, salidas estructuradas, visión, embeddings y audio — enrutados sin cambios entre todos los modelos.

ModeloStreamingHerramientasEstructuradoVisiónEmbeddingsAudio
anthropic/claude-fable-5compatiblecompatiblecompatiblecompatibleno compatibleno compatible
anthropic/claude-opus-4.7compatiblecompatiblecompatiblecompatibleno compatibleno compatible
openai/gpt-5.5-procompatiblecompatiblecompatiblecompatibleno compatibleno compatible
grok/grok-4.3compatiblecompatiblecompatiblecompatibleno compatibleno compatible
google/gemini-3.1-pro-previewcompatiblecompatiblecompatiblecompatibleno compatiblecompatible
Precios

El enrutamiento es gratis.
Paga por funciones.

Nunca tomamos un recorte de su gasto de tokens. Nuestros ingresos vienen de funciones de equipo opcionales.

Garantía sin recargos
Pagas a los proveedores directamente sus tarifas publicadas. No añadimos nada sobre el costo de los tokens. El enrutamiento es gratis; el plan Team opcional financia la plataforma.
$0.00tarifa de enrutamiento

Hacker

Gratis
Para siempre. Cero recargo en todos los tokens.
✓ Enrutar — 200+ modelos, failover automático
✓ Observar — dashboard básico
✓ Gestionar — versionado de prompts
✓ 3 claves API · 0% de recargo por token
Empieza gratis

Enterprise

Personalizado
Compromisos de SLA + despliegue privado.
✓ Todo lo de Team
✓ Despliegue privado / on-premise
✓ SLA de disponibilidad del 99.99%
✓ Infraestructura dedicada
✓ Soporte dedicado y precios personalizados
Confianza y cumplimiento

Auditado de forma independiente. Cumplimiento continuo.

Informes de auditoría disponibles bajo NDA: solicita una copia abajo.

Más inteligente, más seguro, rentable.

Cambia una línea. Esa es la migración.

Regístrate con GitHub — $5 en tokens gratis. Sin tarjeta de crédito. Estás en marcha en menos de un minuto.