Без наценки. Выше доступность. Лучшие цены.

Один шлюз. Все модели. Маршрутизируйте умнее. Деплойте безопаснее. Платите меньше.

OrcaRouter оценивает каждый запрос и интеллектуально маршрутизирует его. ИИ фронтирного качества дешевле до 40%. Адаптивная маршрутизация, балансировка нагрузки, ограждения, файрвол для агентов, наблюдаемость и управление — всё через единый OpenAI-совместимый эндпоинт.

Без кредитной карты · запуск за 60 сек

- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Одна строка. Мы оцениваем каждый промпт, направляем во frontier или OSS и добавляем $0.

Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
200+
моделей, один эндпоинт
0%
наценки на токены, никогда
75.5%
точность маршрутизации
<50ms
отказоустойчивость в потоке
Строите на этом? Поговорим.
Ваш отзыв формирует следующий релиз.
Интеграции

Работает с инструментами, которые вы уже используете

Совместимо с OpenAI из коробки или подключайте агентов через MCP-сервер OrcaRouter — оставьте свой SDK, фреймворк и редактор.

MCP-сервер OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLи другие
AI-шлюз для продакшена

Умная маршрутизация и автоматический отказоустойчивый перевод на каждом запросе.

Маршрутизация, точность которой измерима.

Каждый промпт превращается в эмбеддинг и направляется моделью, которая продолжает учиться онлайн на реальном трафике. В публичном рейтинге RouterArena (Jun 2026) она лидирует по точности — опережая GPT-5, Azure, Martian и NotDiamond — с результатом 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* По данным рейтинга RouterArena, июнь 2026 г.

Провайдер падает. Никто не замечает.

Если провайдер ограничивает запросы или возвращает 5xx, OrcaRouter повторяет запрос к работоспособной модели из 200+ вариантов до начала ответа — временные сбои вышестоящих сервисов не доходят до ваших пользователей.

200+ modelsauto-failoverno 429

Маршрутизация на ваших условиях.

orcarouter/auto — это умное значение по умолчанию, а не чёрный ящик. Задайте для каждого рабочего пространства нужную цель — самую дешёвую модель, проходящую ваш порог качества, наивысшее качество или баланс между ними — либо позвольте системе самой подобрать компромисс на основе вашего трафика. Вы никогда не привязаны к одному поведению.

per-workspaceno markup either way<1ms overhead

Видьте и подтверждайте каждый вызов — стоимость, модель, задержка и причина.

Видеть всё. Доказать что угодно.

Видно в точности, сколько стоил каждый запрос, какая модель его обслужила, сколько времени это заняло и почему он завершился ошибкой — полные структурированные логи, которые можно фильтровать, воспроизводить и копировать как готовый к запуску cURL. Маршрут никогда не остаётся чёрным ящиком.

Per-request logsgrade · model · costcopy-as-cURL

Нулевая наценка. Никаких чёрных ящиков.

Вы платите каждому провайдеру его точную цену — мы добавляем $0 за токен, всегда. Каждый запрос показывает оценку, выбранную модель, провайдера, задержку и цену, поэтому стоимость прозрачна, а не скрыта за непрозрачным усреднённым тарифом.

$0 / tokenprovider costglass-box receipt

Версионирование промптов и кэширование — без редеплоя.

Меняйте промпты. Не код.

Версионируйте промпты за именованными метками с A/B-разбиением и откатом в один клик. Переместите метку — и каждый запрос мгновенно её подхватывает: без передеплоя, без изменения кода, без обновления клиента.

VersionedA/BInstant rollbackNo deploy

Платите один раз. Переиспользуйте бесплатно.

Повторяющиеся и кэшированные токены промпта тарифицируются по кэш-ставке провайдера — часто это доля от цены ввода — в эфемерных окнах 5 минут и 1 час. Те же ответы, меньше расходов, с cached_tokens в каждом чеке.

cache_controlcached_tokens5m / 1h windows

Защитные правила, бюджеты и файрвол для агентов, который реально работает.

Гардрейлы, которые реально останавливают.

PII Shield и контентные политики срабатывают до того, как вышестоящий вызов будет тарифицирован. Заблокированный запрос возвращает чистый 400 и никогда не тарифицируется — ограждающие правила применяются встроенно, а не логируются постфактум.

PII Shieldenforced pre-billingclean 400

Безопасно для вашей команды. И ваших агентов.

Бюджеты и роли для людей; файрвол с оценкой риска для агентов. Каждый вызов инструмента и MCP получает оценку ALLOW, REVIEW или BLOCK до выполнения, а детектор аномалий отмечает всплески частоты и стоимости относительно выученных базовых уровней по часу недели.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Создано для эпохи агентов. До того, как это вам понадобилось.

Полный контроль

Нужно больше, чем режим? Напишите правило.

Когда настроек по умолчанию недостаточно, опишите маршрутизацию как код — с версионированием, возможностью ревью и применением за секунды. Без переразвёртывания и изменений на стороне клиента.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Настройка

Запуск за 60 секунд.

Одна смена URL. Ваш SDK, имена моделей и стриминг работают как прежде.

Шаг 1
🔗

Направьте SDK на нас

Установите base_url в api.orcarouter.ai/v1 и замените API-ключ. Других изменений кода не требуется.

Шаг 2

Мы маршрутизируем, защищаем и наблюдаем

Каждый вызов направляется к лучшей модели, проверяется по вашим защитным правилам и учитывается — оценка менее чем за 1 мс, со встроенными отказоустойчивостью, кэшированием и полными логами.

Шаг 3

Вы деплоите, на одном эндпоинте

Трафик идёт напрямую к первичному API каждого провайдера по их официальному тарифу — мы добавляем $0 за токен. Один совместимый с OpenAI эндпоинт для маршрутизации, наблюдаемости и контроля.


Все модели. Один прайс-лист.

200+ моделей с живыми, сравнимыми ценами — столько же, сколько вы заплатили бы провайдеру напрямую. Мы добавляем $0 сверху.

Посмотреть все 200+ моделей →
МодельМаршрут кВход /MВыход /MКонтекстКачество
obsidian/Qwen3.6-35B-A3BНОВОЕ$0.310$4.21262K4.0
obsidian/gemma-4-26B-A4BНОВОЕ$0.250$2.90262K4.0
anthropic/claude-sonnet-5НОВОЕAnthropic Direct$2.00$10.001M9.0
kling/kling-3-turboНОВОЕ$0.112 /call
z-ai/glm-5.2НОВОЕZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeНОВОЕMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5НОВОЕAnthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ Ещё 194 модели · Цены обновляются каждые 60 секунд

Всё, что ваш OpenAI-клиент уже вызывает.

Стриминг, вызовы инструментов, структурированные ответы, vision, эмбеддинги и аудио — направляются без изменений через любую модель.

МодельСтримингИнструментыСтруктураVisionЭмбеддингиАудио
anthropic/claude-opus-4.8поддерживаетсяподдерживаетсяподдерживаетсяподдерживаетсяне поддерживаетсяне поддерживается
google/gemini-3.1-pro-previewподдерживаетсяподдерживаетсяподдерживаетсяподдерживаетсяне поддерживаетсяподдерживается
openai/gpt-5.5-proподдерживаетсяподдерживаетсяподдерживаетсяподдерживаетсяне поддерживаетсяне поддерживается
anthropic/claude-opus-4.7поддерживаетсяподдерживаетсяподдерживаетсяподдерживаетсяне поддерживаетсяне поддерживается
grok/grok-4.3поддерживаетсяподдерживаетсяподдерживаетсяподдерживаетсяне поддерживаетсяне поддерживается
Тарифы

Маршрутизация бесплатно.
Платите за функции.

Мы никогда не берём долю от ваших расходов на токены. Наш доход поступает от опциональных командных функций.

Гарантия без наценок
Вы платите провайдерам напрямую по их опубликованным тарифам. Мы ничего не добавляем сверх стоимости токенов. Маршрутизация бесплатна; необязательный план Team обеспечивает работу платформы.
$0.00плата за маршрутизацию

Hacker

Бесплатно
Навсегда. Ноль наценки на все токены.
✓ Маршрутизация — 200+ моделей, авто-отказоустойчивость
✓ Наблюдаемость — базовая панель
✓ Управление — версионирование промптов
✓ 3 ключа API · 0% наценки на токены
Начать бесплатно

Корпоративный

Индивидуально
Обязательства SLA + приватное развёртывание.
✓ Всё из тарифа Team
✓ Приватный / on-prem деплой
✓ SLA 99.99% аптайма
✓ Выделенная инфраструктура
✓ Выделенная поддержка и индивидуальные цены
Доверие и соответствие

Независимый аудит. Непрерывное соответствие.

Отчёты об аудите доступны по NDA — запросите копию ниже.

Умнее, безопаснее, выгоднее.

Замените одну строку. Вот и вся миграция.

Зарегистрируйтесь через GitHub — $5 в токенах бесплатно. Без карты. Вы в деле меньше чем за минуту.