측정 가능하게 더 정확한 라우팅.
모든 프롬프트는 임베딩되어, 실제 트래픽으로 온라인 학습을 이어가는 모델이 라우팅합니다. 공개 RouterArena 리더보드(Jun 2026)에서 정확도 75.5%로 GPT-5, Azure, Martian, NotDiamond를 앞서며 1위.
OrcaRouter는 모든 프롬프트를 평가해 지능적으로 라우팅합니다. 프런티어 품질의 AI를 최대 40% 더 저렴하게. 적응형 라우팅, 로드 밸런싱, 가드레일, 에이전트 방화벽, 관측 가능성, 거버넌스 — 모두 단일 OpenAI 호환 엔드포인트로.
신용카드 불필요 · 60초 만에 시작
- client = OpenAI(api_key="sk-...")+ client = OpenAI(+ base_url="https://api.orcarouter.ai/v1",+ api_key="sk-orca-..."+ )# Everything else stays the same.response = client.chat.completions.create(model="orcarouter/auto", # router picks the best model per requestmessages=[{"role": "user", "content": "..."}])# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓
단 한 줄. 각 프롬프트를 평가해 프런티어 또는 OSS로 라우팅하고, $0를 더합니다.
OpenAI 호환 그대로, 또는 에이전트를 OrcaRouter MCP 서버로 연결 — 쓰던 SDK, 프레임워크, 에디터를 그대로.
모든 요청에 스마트 라우팅과 자동 페일오버.
모든 프롬프트는 임베딩되어, 실제 트래픽으로 온라인 학습을 이어가는 모델이 라우팅합니다. 공개 RouterArena 리더보드(Jun 2026)에서 정확도 75.5%로 GPT-5, Azure, Martian, NotDiamond를 앞서며 1위.
공급자가 속도를 제한하거나 5xx를 반환하면, OrcaRouter는 응답이 시작되기 전에 200개 이상의 옵션 중 정상 모델로 요청을 재시도합니다 — 일시적인 업스트림 장애가 사용자에게 노출되지 않습니다.
orcarouter/auto는 블랙박스가 아니라 똑똑한 기본값입니다. 워크스페이스마다 원하는 목표를 지정하세요 — 품질 기준을 충족하는 가장 저렴한 모델, 최고 품질, 또는 둘 사이의 균형 — 아니면 실제 트래픽으로부터 트레이드오프를 학습하게 할 수도 있습니다. 결코 하나의 동작에 묶이지 않습니다.
모든 호출을 확인하고 증명 — 비용, 모델, 지연시간, 그 이유까지.
모든 요청의 비용, 어떤 모델이 처리했는지, 얼마나 걸렸는지, 왜 실패했는지를 정확히 확인하세요 — 필터링하고, 재실행하고, 실행 가능한 cURL로 복사할 수 있는 완전한 구조화 로그입니다. 라우팅은 결코 블랙박스가 아닙니다.
각 공급자에게 정확히 그들의 가격을 지불합니다 — 우리는 토큰당 $0를 추가하며, 언제나 그렇습니다. 모든 요청은 등급, 선택된 모델, 공급자, 지연 시간, 가격을 표시하므로, 비용은 불투명한 혼합 요율이 아니라 유리 상자처럼 투명합니다.
재배포 없이 버전 관리되는 프롬프트와 캐싱.
명명된 레이블 뒤에서 프롬프트를 버전 관리하며, A/B 분할과 원클릭 롤백을 지원합니다. 레이블을 옮기면 모든 요청이 즉시 이를 반영합니다 — 재배포도, 코드 변경도, 클라이언트 업데이트도 필요 없습니다.
반복되고 캐시된 프롬프트 토큰은 공급자의 캐시 요율로 과금되며 — 종종 입력 가격의 일부에 불과합니다 — 5분 및 1시간 임시 윈도우에 걸쳐 적용됩니다. 동일한 답변, 더 적은 지출, 그리고 모든 영수증에 cached_tokens가 표시됩니다.
가드레일, 예산, 그리고 실제로 강제하는 에이전트 방화벽.
PII Shield와 콘텐츠 정책은 업스트림 호출이 과금되기 전에 실행됩니다. 차단된 요청은 깔끔한 400을 반환하며 결코 과금되지 않습니다 — 가드레일은 사후에 로깅되는 것이 아니라 인라인으로 적용됩니다.
사람을 위한 예산과 역할, 에이전트를 위한 위험 점수 기반 방화벽. 모든 도구 및 MCP 호출은 실행 전에 ALLOW, REVIEW, BLOCK로 등급이 매겨지며, 이상 탐지는 학습된 주간 시간대 기준선 대비 비율 및 비용 급증을 플래그합니다.
기본값으로 부족할 때는 라우팅을 코드로 표현하세요 — 버전 관리되고 리뷰 가능하며 몇 초 만에 적용됩니다. 재배포도, 클라이언트 변경도 필요 없습니다.
URL 하나만 변경. 기존 SDK, 모델 이름, 스트리밍이 그대로 작동합니다.
base_url을 api.orcarouter.ai/v1로 설정하고 API 키를 교체하세요. 다른 코드 변경은 필요 없습니다.
모든 호출은 최적 모델로 라우팅되고, 가드레일로 검사되며, 미터링됩니다 — <1ms 안에 채점하고, 페일오버·캐싱·전체 로그를 기본 내장.
트래픽은 각 제공자의 퍼스트파티 API에 공개 요율 그대로 직행 — 토큰당 $0 추가. 라우팅, 관측성, 거버넌스를 위한 하나의 OpenAI 호환 엔드포인트.
200+ 모델의 실시간 나란히 가격 비교 — 공급자에게 직접 낼 금액 그대로. 우리는 $0를 더합니다.
| 모델 | 라우팅 | 입력 /M | 출력 /M | 컨텍스트 | 품질 |
|---|---|---|---|---|---|
| obsidian/Qwen3.6-35B-A3B신규 | — | $0.310 | $4.21 | 262K | 4.0 |
| obsidian/gemma-4-26B-A4B신규 | — | $0.250 | $2.90 | 262K | 4.0 |
| anthropic/claude-sonnet-5신규 | Anthropic Direct | $2.00 | $10.00 | 1M | 9.0 |
| kling/kling-3-turbo신규 | — | $0.112 /call | — | — | — |
| z-ai/glm-5.2신규 | Zhipu AI | $1.40 | $4.40 | 1M | 9.0 |
| kimi/kimi-k2.7-code신규 | Moonshot | $0.950 | $4.00 | 262K | 8.0 |
| anthropic/claude-fable-5신규 | Anthropic Direct | $10.00 | $50.00 | 1M | 10.0 |
| qwen/qwen3.7-plus | Alibaba Cloud | $0.350 | $1.42 | 1M | 8.0 |
| minimax/minimax-m3 | — | $0.300 | $1.20 | 1M | 9.0 |
| anthropic/claude-opus-4.8 | Anthropic Direct | $5.00 | $25.00 | 1M | 10.0 |
| google/gemini-3.5-flash | Google Direct | $1.50 | $9.00 | 1M | 9.0 |
| qwen/qwen3.7-max | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.7-max-2026-05-20 | Alibaba Cloud | $1.25 | $3.75 | 1M | 5.0 |
| qwen/qwen3.6-flash | Alibaba Cloud | $0.250 | $1.50 | 1M | 7.0 |
| qwen/qwen3.6-35b-a3b | Alibaba Cloud | $0.248 | $1.48 | 262K | 8.0 |
| + 추가 194개 모델 · 가격은 60초마다 업데이트 | |||||
스트리밍, 도구 호출, 구조화된 출력, 비전, 임베딩, 오디오 — 모든 모델에 걸쳐 변경 없이 라우팅됩니다.
| 모델 | 스트리밍 | 도구 | 구조화 | 비전 | 임베딩 | 오디오 |
|---|---|---|---|---|---|---|
| google/gemini-3.1-pro-preview | 지원 | 지원 | 지원 | 지원 | 미지원 | 지원 |
| anthropic/claude-opus-4.8 | 지원 | 지원 | 지원 | 지원 | 미지원 | 미지원 |
| anthropic/claude-opus-4.7 | 지원 | 지원 | 지원 | 지원 | 미지원 | 미지원 |
| grok/grok-4.3 | 지원 | 지원 | 지원 | 지원 | 미지원 | 미지원 |
| openai/gpt-5.5-pro | 지원 | 지원 | 지원 | 지원 | 미지원 | 미지원 |
토큰 지출에서 결코 수수료를 받지 않습니다. 수익은 선택적 팀 기능에서 나옵니다.
감사 보고서는 NDA 하에 제공됩니다 — 아래에서 사본을 요청하세요.
한 줄만 교체. 그게 마이그레이션입니다.
GitHub로 가입 — $5 토큰 무료. 신용카드 불필요. 1분 안에 시작합니다.