Calidad de vanguardia. Precios open source.

Una API. Cada modelo. Cero intermediario.

OrcaRouter envía cada prompt al modelo adecuado: razonamiento complejo a modelos de vanguardia, tareas rutinarias a modelos open source. Obtienes calidad de vanguardia cuando importa y pagas precios open source el resto del tiempo. Sin recargos. Sin migración. Una sola API.

- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="gpt-4o",
messages=[{"role": "user", "content": "..."}]
)
# → routed to cheapest live backend, zero markup ✓
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
claude-opus-4-7$5.00 in·$25.00 outAnthropic Direct
claude-sonnet-4-6$3.00 in·$15.00 outAnthropic Direct
gpt-5.5$5.00 in·$30.00 outOpenAI Direct
gemini-3.1-pro-preview$4.00 in·$18.00 outGoogle Direct
deepseek-v4-pro$0.560 in·$1.12 outDeepSeek
qwen3.6-plus$0.500 in·$3.00 outAlibaba Cloud
kimi-k2.6$0.900 in·$3.75 outMoonshot
seedance-2.0from $0.07 /sec·ByteDance
0%
recargo de enrutamiento. Nunca.
~40%
reducción de costo promedio vs precio de lista
200+
modelos de 10+ proveedores
<1ms
sobrecarga de enrutamiento añadida
¿Estás construyendo con esto? Hablemos.
Tu feedback da forma a la próxima versión.
Cómo funciona el enrutamiento

Pass-through por diseño.

Enrutamiento directo al proveedor

Tu tráfico fluye al proveedor upstream sin proxies fantasma intermedios. El proveedor que ves en tus registros es el que realmente atendió la solicitud.

Los términos del proveedor se aplican de extremo a extremo

Los términos de datos y uso de cada proveedor upstream se aplican directamente a tu tráfico. Elige el proveedor que coincida con tu política.

🧾

Auditoría por solicitud

Cada llamada registra el proveedor, el precio público y la ruta tomada. Puedes reproducir cualquier decisión de enrutamiento más tarde desde el panel.


Configuración

En vivo en 60 segundos.

Un cambio de URL. Su SDK, nombres de modelos y streaming funcionan igual que antes.

Paso 1
🔗

Apunte su SDK a nosotros

Establezca base_url en api.orcarouter.ai/v1 y cambie su clave API. No se necesitan otros cambios de código.

Paso 2

Enrutamos en tiempo real

Cada solicitud verifica el estado y precios de proveedores en tiempo real en menos de 1ms. Elegimos el backend directo más barato disponible.

Paso 3

Pagas el costo del proveedor

El tráfico va directo al proveedor. Le paga su tarifa publicada. Añadimos exactamente $0 arriba — nuestra tarifa es por el plan, no por sus tokens.


Precios en vivo

Cada modelo.
Mejor tarifa disponible.

Enrutamiento en tiempo real al backend vivo más barato. Precios actualizados cada 60s.

Ver los 200+ modelos →
ModeloEnrutado aEntrada /MSalida /MContextoCalidad
claude-opus-4-7Anthropic Direct$5.00$25.001M10.0
claude-sonnet-4-6Anthropic Direct$3.00$15.001M7.0
gpt-5.5OpenAI Direct$5.00$30.001M10.0
gemini-3.1-pro-previewGoogle Direct$4.00$18.001M10.0
deepseek-v4-proDeepSeek$0.560$1.121M9.0
qwen3.6-plusAlibaba Cloud$0.500$3.001M8.0
kimi-k2.6Moonshot$0.900$3.75256K9.0
seedance-2.0ByteDancefrom $0.07 /sec10.0
+ 194 modelos más · Precios cada 60 segundos
Plataforma

Calidad de producción desde el día uno.

Todo lo que necesitas para ejecutar IA en producción sin gestionar múltiples integraciones.

Enrutamiento de precio en tiempo real

Los precios de proveedores se actualizan cada 60s. Cada solicitud golpea el backend más barato disponible.

Failover automático

¿Proveedor se cae en medio del stream? Cambiamos transparente. Tu app ve cero errores.

🔑

Gestión de claves API

Emite claves por equipo o servicio con límites de gasto, listas blancas de modelos y límites de tasa integrados.

$

Seguimiento de costo por solicitud

Ve exactamente qué costó cada solicitud, qué proveedor la manejó y cuánto ahorraste.

Compatible con OpenAI

Cambia una línea. Mismo SDK, mismos nombres de modelos, mismo formato de streaming. Cero esfuerzo de migración.

🛡

Aplicación de presupuestos

Límites duros y suaves por clave, equipo u organización. Reinicio automático mensual. Alertas Slack + webhook.


Diferenciador

Enrutamiento de caja de cristal.

Cada solicitud muestra el proveedor que la atendió, el precio publicado que cobró y la ruta seguida. Verificable por llamada y reproducible después.

🔍

Atribución de proveedor por solicitud

Cada respuesta se etiqueta con el proveedor upstream — Anthropic Direct, OpenAI Direct, Bedrock, Vertex — y aparece en tu panel y en las cabeceras.

📒

Libro contable a tarifa pública

Cada cargo por token equivale al precio público de lista del proveedor. Audita cualquier solicitud contra la página de precios del proveedor en segundos.

Decisiones de enrutamiento que puedes reproducir

Los eventos de conmutación por error, los cambios de salud y la elección del backend más barato se registran con marcas de tiempo. Reproduce la ruta de cualquier solicitud.


Precios

El enrutamiento es gratis.
Paga por funciones.

Nunca tomamos un recorte de su gasto de tokens. Nuestros ingresos vienen de funciones de equipo opcionales.

Garantía sin recargos
Pagas a los proveedores directamente sus tarifas publicadas. No añadimos nada sobre el costo de los tokens. El enrutamiento es gratis; el plan Team opcional financia la plataforma.
$0.00tarifa de enrutamiento

Hacker

Gratis
Para siempre. Cero recargo en todos los tokens.
✓ 3 claves API
✓ Los 200+ modelos
✓ Failover automático
✓ Panel básico
Empieza gratis

Enterprise

Personalizado
Compromisos de SLA + despliegue privado.
✓ Opción de despliegue privado
✓ Reglas de enrutamiento personalizadas
✓ SLA de 99,99% uptime
✓ Soporte dedicado
✓ Logs de auditoría y cumplimiento

Empieza a enrutar más inteligente.

Regístrate con GitHub — $5 en tokens gratis. Sin tarjeta de crédito. Cambia una línea de código y estás en vivo.