마크업 제로 · 더 높은 가용성 · 더 나은 가격

하나의 게이트웨이. 모든 모델. 더 똑똑하게 라우팅. 더 안전하게 출시. 더 적게 지출.

OrcaRouter는 모든 프롬프트를 평가해 지능적으로 라우팅합니다. 프런티어 품질의 AI를 최대 40% 더 저렴하게. 적응형 라우팅, 로드 밸런싱, 가드레일, 에이전트 방화벽, 관측 가능성, 거버넌스 — 모두 단일 OpenAI 호환 엔드포인트로.

신용카드 불필요 · 60초 만에 시작

RouterArena에서 GPT-5와 Azure를 앞섬공개된 연구로 뒷받침됨
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

단 한 줄. 각 프롬프트를 평가해 프런티어 또는 OSS로 라우팅하고, $0를 더합니다.

Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
OpenAI: GPT-5.5 Pro$30.00 in·$180.00 outOpenAI Direct
200+
모델, 하나의 엔드포인트
0%
토큰 마크업, 영원히 없음
75.5%
라우팅 정확도
<50ms
스트림 중 페일오버
OrcaRouter 쓰시나요? 이야기해요.
여러분의 피드백이 다음 릴리스를 만듭니다.
통합

이미 쓰는 도구와 함께 작동합니다

OpenAI 호환 그대로, 또는 에이전트를 OrcaRouter MCP 서버로 연결 — 쓰던 SDK, 프레임워크, 에디터를 그대로.

OrcaRouter MCP 서버OpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURL외 다수
프로덕션을 위한 AI 게이트웨이

모든 요청에 스마트 라우팅과 자동 페일오버.

측정 가능하게 더 정확한 라우팅.

모든 프롬프트는 임베딩되어, 실제 트래픽으로 온라인 학습을 이어가는 모델이 라우팅합니다. 공개 RouterArena 리더보드(Jun 2026)에서 정확도 75.5%로 GPT-5, Azure, Martian, NotDiamond를 앞서며 1위.

contextual embeddingsonline learning<1ms overheadRouterArena
* RouterArena 리더보드 데이터 기준, 2026년 6월.

공급자가 다운돼도. 아무도 모릅니다.

공급자가 속도를 제한하거나 5xx를 반환하면, OrcaRouter는 응답이 시작되기 전에 200개 이상의 옵션 중 정상 모델로 요청을 재시도합니다 — 일시적인 업스트림 장애가 사용자에게 노출되지 않습니다.

200+ modelsauto-failoverno 429

라우팅을 당신 방식대로.

orcarouter/auto는 블랙박스가 아니라 똑똑한 기본값입니다. 워크스페이스마다 원하는 목표를 지정하세요 — 품질 기준을 충족하는 가장 저렴한 모델, 최고 품질, 또는 둘 사이의 균형 — 아니면 실제 트래픽으로부터 트레이드오프를 학습하게 할 수도 있습니다. 결코 하나의 동작에 묶이지 않습니다.

per-workspaceno markup either way<1ms overhead

모든 호출을 확인하고 증명 — 비용, 모델, 지연시간, 그 이유까지.

모든 걸 확인. 무엇이든 증명.

모든 요청의 비용, 어떤 모델이 처리했는지, 얼마나 걸렸는지, 왜 실패했는지를 정확히 확인하세요 — 필터링하고, 재실행하고, 실행 가능한 cURL로 복사할 수 있는 완전한 구조화 로그입니다. 라우팅은 결코 블랙박스가 아닙니다.

Per-request logsgrade · model · costcopy-as-cURL

마크업 제로. 블랙박스 제로.

각 공급자에게 정확히 그들의 가격을 지불합니다 — 우리는 토큰당 $0를 추가하며, 언제나 그렇습니다. 모든 요청은 등급, 선택된 모델, 공급자, 지연 시간, 가격을 표시하므로, 비용은 불투명한 혼합 요율이 아니라 유리 상자처럼 투명합니다.

$0 / tokenprovider costglass-box receipt

재배포 없이 버전 관리되는 프롬프트와 캐싱.

프롬프트를 바꾸세요. 코드 말고.

명명된 레이블 뒤에서 프롬프트를 버전 관리하며, A/B 분할과 원클릭 롤백을 지원합니다. 레이블을 옮기면 모든 요청이 즉시 이를 반영합니다 — 재배포도, 코드 변경도, 클라이언트 업데이트도 필요 없습니다.

VersionedA/BInstant rollbackNo deploy

한 번 지불. 재사용은 무료.

반복되고 캐시된 프롬프트 토큰은 공급자의 캐시 요율로 과금되며 — 종종 입력 가격의 일부에 불과합니다 — 5분 및 1시간 임시 윈도우에 걸쳐 적용됩니다. 동일한 답변, 더 적은 지출, 그리고 모든 영수증에 cached_tokens가 표시됩니다.

cache_controlcached_tokens5m / 1h windows

가드레일, 예산, 그리고 실제로 강제하는 에이전트 방화벽.

실제로 막아주는 가드레일.

PII Shield와 콘텐츠 정책은 업스트림 호출이 과금되기 전에 실행됩니다. 차단된 요청은 깔끔한 400을 반환하며 결코 과금되지 않습니다 — 가드레일은 사후에 로깅되는 것이 아니라 인라인으로 적용됩니다.

PII Shieldenforced pre-billingclean 400

팀에게 안전하게. 에이전트에게도.

사람을 위한 예산과 역할, 에이전트를 위한 위험 점수 기반 방화벽. 모든 도구 및 MCP 호출은 실행 전에 ALLOW, REVIEW, BLOCK로 등급이 매겨지며, 이상 탐지는 학습된 주간 시간대 기준선 대비 비율 및 비용 급증을 플래그합니다.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
에이전트 시대를 위해 설계. 필요해지기 전에.

완전한 제어

모드만으로 부족한가요? 규칙을 작성하세요.

기본값으로 부족할 때는 라우팅을 코드로 표현하세요 — 버전 관리되고 리뷰 가능하며 몇 초 만에 적용됩니다. 재배포도, 클라이언트 변경도 필요 없습니다.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

설정

60초 만에 시작.

URL 하나만 변경. 기존 SDK, 모델 이름, 스트리밍이 그대로 작동합니다.

1단계
🔗

SDK를 우리에게 연결

base_urlapi.orcarouter.ai/v1로 설정하고 API 키를 교체하세요. 다른 코드 변경은 필요 없습니다.

2단계

우리가 라우팅, 보호, 관측

모든 호출은 최적 모델로 라우팅되고, 가드레일로 검사되며, 미터링됩니다 — <1ms 안에 채점하고, 페일오버·캐싱·전체 로그를 기본 내장.

3단계

당신은 하나의 엔드포인트로 출시

트래픽은 각 제공자의 퍼스트파티 API에 공개 요율 그대로 직행 — 토큰당 $0 추가. 라우팅, 관측성, 거버넌스를 위한 하나의 OpenAI 호환 엔드포인트.


모든 모델. 하나의 가격표.

200+ 모델의 실시간 나란히 가격 비교 — 공급자에게 직접 낼 금액 그대로. 우리는 $0를 더합니다.

200+ 모델 모두 보기 →
모델라우팅입력 /M출력 /M컨텍스트품질
obsidian/Qwen3.6-35B-A3B신규$0.310$4.21262K4.0
obsidian/gemma-4-26B-A4B신규$0.250$2.90262K4.0
anthropic/claude-sonnet-5신규Anthropic Direct$2.00$10.001M9.0
kling/kling-3-turbo신규$0.112 /call
z-ai/glm-5.2신규Zhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-code신규Moonshot$0.950$4.00262K8.0
anthropic/claude-fable-5신규Anthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ 추가 194개 모델 · 가격은 60초마다 업데이트

OpenAI 클라이언트가 이미 호출하는 모든 것.

스트리밍, 도구 호출, 구조화된 출력, 비전, 임베딩, 오디오 — 모든 모델에 걸쳐 변경 없이 라우팅됩니다.

모델스트리밍도구구조화비전임베딩오디오
google/gemini-3.1-pro-preview지원지원지원지원미지원지원
anthropic/claude-opus-4.8지원지원지원지원미지원미지원
anthropic/claude-opus-4.7지원지원지원지원미지원미지원
grok/grok-4.3지원지원지원지원미지원미지원
openai/gpt-5.5-pro지원지원지원지원미지원미지원
요금

라우팅은 무료.
기능에 대해 지불하세요.

토큰 지출에서 결코 수수료를 받지 않습니다. 수익은 선택적 팀 기능에서 나옵니다.

제로 마크업 보장
공급자에게 공개 요금으로 직접 지불합니다. 토큰 비용에 어떤 가산도 추가하지 않습니다. 라우팅은 무료이며, 선택적인 Team 요금제가 플랫폼을 지원합니다.
$0.00라우팅 요금

Hacker

무료
영원히. 모든 토큰에 제로 마크업.
✓ 라우팅 — 200+ 모델, 자동 페일오버
✓ 관측 — 기본 대시보드
✓ 관리 — 프롬프트 버전 관리
✓ API 키 3개 · 0% 토큰 마크업
무료로 시작

엔터프라이즈

맞춤
SLA 약속 + 프라이빗 배포.
✓ Team의 모든 기능
✓ 프라이빗 / 온프레미스 배포
✓ 99.99% 가동 시간 SLA
✓ 전용 인프라
✓ 전담 지원 및 맞춤 가격
신뢰 및 규정 준수

독립적인 감사 완료. 지속적으로 규정을 준수합니다.

감사 보고서는 NDA 하에 제공됩니다 — 아래에서 사본을 요청하세요.

더 똑똑하게, 더 안전하게, 비용 효율적으로.

한 줄만 교체. 그게 마이그레이션입니다.

GitHub로 가입 — $5 토큰 무료. 신용카드 불필요. 1분 안에 시작합니다.

© 2026 OrcaRouter