OrcaRouter — Un gateway de IA: enrutamiento LLM adaptativo y gobernanza

La pasarela de IA para producción

Enrutamiento inteligente y failover automático en cada petición.

Enrutamiento mediblemente más preciso.

Cada prompt se incrusta y se enruta con un modelo que sigue aprendiendo en línea del tráfico real. En el ranking público de RouterArena (Jun 2026) lidera en precisión — por delante de GPT-5, Azure, Martian y NotDiamond — con un 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena

* Según los datos de la clasificación de RouterArena, junio de 2026.

Un proveedor se cae. Nadie lo nota.

Cuando un proveedor limita la tasa o devuelve 5xx, OrcaRouter reintenta la solicitud en un modelo sano entre más de 200 opciones antes de que empiece la respuesta, de modo que los fallos transitorios del proveedor no llegan a tus usuarios.

200+ modelsauto-failoverno 429

Enrutamiento según tus reglas.

orcarouter/auto es un valor predeterminado inteligente, no una caja negra. Orienta cada espacio de trabajo hacia el objetivo que quieras — el modelo más barato que supere tu umbral de calidad, la máxima calidad o un equilibrio entre ambos — o deja que aprenda el equilibrio a partir de tu propio tráfico. Nunca quedas atado a un único comportamiento.

per-workspaceno markup either way<1ms overhead

Ve y demuestra cada llamada — coste, modelo, latencia y por qué.

Ve todo. Demuestra cualquier cosa.

Mira exactamente cuánto costó cada solicitud, qué modelo la atendió, cuánto tardó y por qué falló — registros estructurados completos que puedes filtrar, reproducir y copiar como un cURL ejecutable. Una ruta nunca es una caja negra.

Per-request logsgrade · model · costcopy-as-cURL

Cero recargo. Cero cajas negras.

Pagas a cada proveedor su precio exacto — añadimos $0 por token, siempre. Cada solicitud muestra la calificación, el modelo elegido, el proveedor, la latencia y el precio, de modo que el costo es una caja de cristal, no una tarifa combinada opaca.

$0 / tokenprovider costglass-box receipt

Prompts versionados y caché — sin redespliegue.

Cambia los prompts. No el código.

Versiona prompts detrás de etiquetas con nombre, con divisiones A/B y rollback con un solo clic. Mueve una etiqueta y cada solicitud la adopta al instante — sin redespliegue, sin cambios de código, sin actualización del cliente.

VersionedA/BInstant rollbackNo deploy

Paga una vez. Reutiliza gratis.

Los tokens de prompt repetidos y en caché se facturan a la tarifa de caché del proveedor — a menudo una fracción del precio de entrada — a través de ventanas efímeras de 5 minutos y 1 hora. Las mismas respuestas, con menos gasto, con cached_tokens en cada recibo.

cache_controlcached_tokens5m / 1h windows

Guardrails, presupuestos y un firewall de agentes que se aplica.

Guardrails que detienen las cosas.

PII Shield y las políticas de contenido se ejecutan antes de que se facture la llamada upstream. Una solicitud bloqueada devuelve un 400 limpio y nunca se cobra — barreras de protección aplicadas en línea, no registradas después de los hechos.

PII Shieldenforced pre-billingclean 400

Seguro para tu equipo. Y para tus agentes.

Presupuestos y roles para las personas; un firewall con puntuación de riesgo para los agentes. Cada llamada de herramienta y MCP se califica como ALLOW, REVIEW o BLOCK antes de ejecutarse, y la detección de anomalías marca picos de tasa y costo frente a líneas base aprendidas por hora de la semana.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection

Creado para la era de los agentes. Antes de que lo necesitaras.

Control total

¿Necesitas más que un modo? Escribe la regla.

Cuando el valor predeterminado no basta, expresa el enrutamiento como código — versionado, revisable y activo en segundos. Sin redespliegues ni cambios en el cliente.

routing.yaml

version: 1
rules:
  - id: hard_agent_task
    when: task_class == "agent" && difficulty >= 0.6
    use:
      model: "claude-opus-4-7"
      reasoning_effort: high   # spend where it matters
  - id: short_prompts
    when: request.input_tokens < 500
    use: { delegate: cheapest }
default:
  delegate: balanced   # fall back to the chosen mode

YAML + CELversion-controlledlive in seconds

Explorar la documentación de enrutamiento

Configuración

En vivo en 60 segundos.

Un cambio de URL. Su SDK, nombres de modelos y streaming funcionan igual que antes.

Paso 1

🔗

Apunte su SDK a nosotros

Establezca base_url en api.orcarouter.ai/v1 y cambie su clave API. No se necesitan otros cambios de código.

→

Paso 2

⚡

Nosotros enrutamos, protegemos y observamos

Cada llamada se enruta al mejor modelo, se verifica contra tus guardrails y se mide — evaluada en menos de 1ms, con failover, caché y logs completos incluidos.

→

Paso 3

✓

Tú lanzas, en un solo endpoint

El tráfico va directo a la API propia de cada proveedor a su tarifa publicada — añadimos $0 por token. Un único endpoint compatible con OpenAI para enrutamiento, observabilidad y gobernanza.

Cada modelo. Una lista de precios.

200+ modelos con precios en vivo y comparados — lo que pagarías al proveedor directamente. Añadimos $0 encima.

Ver los 200+ modelos →

Modelo	Enrutado a	Entrada /M	Salida /M	Contexto	Calidad
obsidian/Qwen3.6-35B-A3BNUEVO	—	$0.310	$4.21	262K	4.0
obsidian/gemma-4-26B-A4BNUEVO	—	$0.250	$2.90	262K	4.0
anthropic/claude-sonnet-5NUEVO	Anthropic Direct	$2.00	$10.00	1M	9.0
kling/kling-3-turboNUEVO	—	$0.112 /call	—	—	—
z-ai/glm-5.2NUEVO	Zhipu AI	$1.40	$4.40	1M	9.0
kimi/kimi-k2.7-codeNUEVO	Moonshot	$0.950	$4.00	262K	8.0
anthropic/claude-fable-5NUEVO	Anthropic Direct	$10.00	$50.00	1M	10.0
qwen/qwen3.7-plus	Alibaba Cloud	$0.350	$1.42	1M	8.0
minimax/minimax-m3	—	$0.300	$1.20	1M	9.0
anthropic/claude-opus-4.8	Anthropic Direct	$5.00	$25.00	1M	10.0
google/gemini-3.5-flash	Google Direct	$1.50	$9.00	1M	9.0
qwen/qwen3.7-max	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.7-max-2026-05-20	Alibaba Cloud	$1.25	$3.75	1M	5.0
qwen/qwen3.6-flash	Alibaba Cloud	$0.250	$1.50	1M	7.0
qwen/qwen3.6-35b-a3b	Alibaba Cloud	$0.248	$1.48	262K	8.0
+ 194 modelos más · Precios cada 60 segundos

Todo lo que tu cliente de OpenAI ya invoca.

Streaming, tool calls, salidas estructuradas, visión, embeddings y audio — enrutados sin cambios entre todos los modelos.

Modelo	Streaming	Herramientas	Estructurado	Visión	Embeddings	Audio
anthropic/claude-fable-5	compatible	compatible	compatible	compatible	no compatible	no compatible
anthropic/claude-opus-4.7	compatible	compatible	compatible	compatible	no compatible	no compatible
openai/gpt-5.5-pro	compatible	compatible	compatible	compatible	no compatible	no compatible
grok/grok-4.3	compatible	compatible	compatible	compatible	no compatible	no compatible
google/gemini-3.1-pro-preview	compatible	compatible	compatible	compatible	no compatible	compatible

Precios

El enrutamiento es gratis.
Paga por funciones.

Nunca tomamos un recorte de su gasto de tokens. Nuestros ingresos vienen de funciones de equipo opcionales.

Garantía sin recargos

Pagas a los proveedores directamente sus tarifas publicadas. No añadimos nada sobre el costo de los tokens. El enrutamiento es gratis; el plan Team opcional financia la plataforma.

$0.00tarifa de enrutamiento

Hacker

Gratis

Para siempre. Cero recargo en todos los tokens.

✓ Enrutar — 200+ modelos, failover automático

✓ Observar — dashboard básico

✓ Gestionar — versionado de prompts

✓ 3 claves API · 0% de recargo por token

Empieza gratis

Equipo

$499/mo

Todavía cero recargo. Paga por funciones.

✓ Todo lo de Hacker

✓ Hasta 10 asientos de equipo

✓ Aplicación de cumplimiento e informes

✓ Claves API ilimitadas

✓ Soporte prioritario

Empezar →

Enterprise

Personalizado

Compromisos de SLA + despliegue privado.

✓ Todo lo de Team

✓ Despliegue privado / on-premise

✓ SLA de disponibilidad del 99.99%

✓ Infraestructura dedicada

✓ Soporte dedicado y precios personalizados

Un Gateway. Todos los Modelos. Enruta Mejor. Lanza Seguro. Gasta Menos.

Funciona con las herramientas que ya usas

Enrutamiento mediblemente más preciso.

Un proveedor se cae. Nadie lo nota.

Enrutamiento según tus reglas.

Ve todo. Demuestra cualquier cosa.

Cero recargo. Cero cajas negras.

Cambia los prompts. No el código.

Paga una vez. Reutiliza gratis.

Guardrails que detienen las cosas.

Seguro para tu equipo. Y para tus agentes.

¿Necesitas más que un modo? Escribe la regla.

En vivo en 60 segundos.

Apunte su SDK a nosotros

Nosotros enrutamos, protegemos y observamos

Tú lanzas, en un solo endpoint

Cada modelo. Una lista de precios.

Todo lo que tu cliente de OpenAI ya invoca.

El enrutamiento es gratis.
Paga por funciones.

Hacker

Equipo

Enterprise

Auditado de forma independiente. Cumplimiento continuo.

Más inteligente, más seguro, rentable.

Producto

Recursos

Legal

Síguenos

Un Gateway. Todos los Modelos. Enruta Mejor. Lanza Seguro. Gasta Menos.

Funciona con las herramientas que ya usas

Enrutamiento mediblemente más preciso.

Un proveedor se cae. Nadie lo nota.

Enrutamiento según tus reglas.

Ve todo. Demuestra cualquier cosa.

Cero recargo. Cero cajas negras.

Cambia los prompts. No el código.

Paga una vez. Reutiliza gratis.

Guardrails que detienen las cosas.

Seguro para tu equipo. Y para tus agentes.

¿Necesitas más que un modo? Escribe la regla.

En vivo en 60 segundos.

Apunte su SDK a nosotros

Nosotros enrutamos, protegemos y observamos

Tú lanzas, en un solo endpoint

Cada modelo. Una lista de precios.

Todo lo que tu cliente de OpenAI ya invoca.

El enrutamiento es gratis.Paga por funciones.

Hacker

Equipo

Enterprise

Auditado de forma independiente. Cumplimiento continuo.

Más inteligente, más seguro, rentable.

Producto

Recursos

Legal

Síguenos

El enrutamiento es gratis.
Paga por funciones.