Không phụ phí. Khả dụng cao hơn. Giá tốt hơn.

Một Gateway. Mọi Mô Hình. Định tuyến khôn hơn. Ship an toàn hơn. Tốn ít hơn.

OrcaRouter chấm điểm mọi prompt và định tuyến thông minh. AI chất lượng tiên tiến với chi phí thấp hơn tới 40%. Định tuyến thích ứng, cân bằng tải, guardrail, agent firewall, khả năng quan sát và quản trị — tất cả qua một endpoint tương thích OpenAI duy nhất.

Không cần thẻ tín dụng · chạy trong 60 giây

Vượt GPT-5 và Azure trên RouterArenaĐược hỗ trợ bởi nghiên cứu đã công bố
- client = OpenAI(api_key="sk-...")
+ client = OpenAI(
+ base_url="https://api.orcarouter.ai/v1",
+ api_key="sk-orca-..."
+ )
 
# Everything else stays the same.
response = client.chat.completions.create(
model="orcarouter/auto", # router picks the best model per request
messages=[{"role": "user", "content": "..."}]
)
# → orcarouter/auto grades the prompt → frontier or open-source, zero token markup ✓

Một dòng. Chúng tôi chấm điểm từng prompt, định tuyến tới frontier hoặc OSS, và cộng thêm $0.

grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
grok/grok-4.3$1.25 in·$2.50 out
Anthropic: Claude Opus 4.7$5.00 in·$25.00 outAnthropic Direct
Google: Gemini 3.1 Pro Preview$2.00 in·$12.00 outGoogle Direct
Anthropic: Claude Fable 5$10.00 in·$50.00 outAnthropic Direct
Anthropic: Claude Opus 4.8$5.00 in·$25.00 outAnthropic Direct
200+
mô hình, một endpoint
0%
phụ phí token, mãi mãi
75.5%
độ chính xác định tuyến
<50ms
chuyển dự phòng giữa luồng
Đang xây dựng cùng chúng tôi? Hãy trò chuyện.
Phản hồi của bạn định hình bản phát hành tới.
Tích hợp

Hoạt động với các công cụ bạn đang dùng

Tương thích OpenAI ngay lập tức, hoặc kết nối agent qua máy chủ MCP OrcaRouter — giữ nguyên SDK, framework và trình soạn thảo của bạn.

Máy chủ MCP OrcaRouterOpenAI SDKGoogle GenAI SDKAnthropic SDKLangChainLlamaIndexVercel AI SDKCamelAIDifyCursorOpenCodePromptfooOpenClawOpenHumanGitHubcURLvà nhiều hơn
Cổng AI cho production

Định tuyến thông minh và tự động chuyển dự phòng trên mỗi request.

Định tuyến chính xác hơn một cách đo lường được.

Mọi prompt được embedding và định tuyến bởi mô hình liên tục học online từ lưu lượng thực. Trên bảng xếp hạng công khai RouterArena (Jun 2026), nó dẫn đầu về độ chính xác — vượt GPT-5, Azure, Martian và NotDiamond — ở mức 75.5%.

contextual embeddingsonline learning<1ms overheadRouterArena
* Dựa trên dữ liệu bảng xếp hạng RouterArena, tháng 6 năm 2026.

Một nhà cung cấp sập. Không ai nhận ra.

Khi một nhà cung cấp giới hạn tốc độ hoặc trả về 5xx, OrcaRouter thử lại yêu cầu trên một mô hình khỏe mạnh trong hơn 200 lựa chọn trước khi phản hồi bắt đầu — sự cố tạm thời ở thượng nguồn không ảnh hưởng tới người dùng của bạn.

200+ modelsauto-failoverno 429

Định tuyến theo cách của bạn.

orcarouter/auto là một mặc định thông minh, không phải hộp đen. Hãy hướng mỗi không gian làm việc đến mục tiêu bạn muốn — mô hình rẻ nhất vẫn đạt ngưỡng chất lượng, chất lượng cao nhất, hay cân bằng cả hai — hoặc để nó tự học cách đánh đổi từ chính lưu lượng của bạn. Bạn không bao giờ bị khóa vào một hành vi duy nhất.

per-workspaceno markup either way<1ms overhead

Nhìn rõ và chứng minh mọi lệnh gọi — chi phí, mô hình, độ trễ và lý do.

Thấy mọi thứ. Chứng minh mọi điều.

Xem chính xác mỗi request tốn bao nhiêu, model nào đã xử lý nó, mất bao lâu, và vì sao nó thất bại — log có cấu trúc đầy đủ mà bạn có thể lọc, phát lại, và sao chép thành một lệnh cURL chạy được. Một route không bao giờ là hộp đen.

Per-request logsgrade · model · costcopy-as-cURL

Cộng thêm bằng không. Không hộp đen.

Bạn trả cho mỗi provider đúng giá của họ — chúng tôi cộng thêm $0 cho mỗi token, mãi mãi. Mỗi request hiển thị mức xếp loại, model được chọn, provider, độ trễ, và giá, nên chi phí hoàn toàn minh bạch, chứ không phải một mức giá trộn mờ ám.

$0 / tokenprovider costglass-box receipt

Prompt phiên bản hóa và cache — không cần redeploy.

Đổi prompt. Không đổi code.

Quản lý phiên bản prompt sau các nhãn đặt tên với chia tách A/B và rollback chỉ với một cú nhấp. Di chuyển một nhãn và mọi request lập tức nhận nó — không cần redeploy, không thay đổi code, không cập nhật client.

VersionedA/BInstant rollbackNo deploy

Trả một lần. Tái sử dụng miễn phí.

Các token prompt lặp lại và được cache được tính theo mức giá cache của provider — thường chỉ bằng một phần nhỏ giá input — trên các cửa sổ ephemeral 5 phút và 1 giờ. Cùng câu trả lời, chi phí ít hơn, với cached_tokens trên mọi biên lai.

cache_controlcached_tokens5m / 1h windows

Guardrail, ngân sách và tường lửa agent thực sự thực thi.

Guardrail thực sự chặn được.

PII Shield và các chính sách nội dung chạy trước khi lệnh gọi upstream bị tính phí. Một request bị chặn trả về 400 sạch sẽ và không bao giờ bị tính tiền — guardrail được thực thi inline, chứ không phải ghi log sau khi sự việc đã xảy ra.

PII Shieldenforced pre-billingclean 400

An toàn cho đội ngũ. Và cho cả agent của bạn.

Ngân sách và vai trò cho con người; một firewall chấm điểm rủi ro cho agent. Mỗi lệnh gọi tool và MCP được xếp loại ALLOW, REVIEW, hoặc BLOCK trước khi nó chạy, và phát hiện bất thường gắn cờ các đột biến về tốc độ và chi phí so với các baseline giờ-trong-tuần đã học được.

ALLOW · REVIEW · BLOCKMCP gatinganomaly detection
Xây cho kỷ nguyên agent. Trước cả khi bạn cần đến.

Toàn quyền kiểm soát

Cần nhiều hơn một chế độ? Hãy viết quy tắc.

Khi mặc định chưa đủ, hãy biểu đạt định tuyến bằng mã — quản lý phiên bản, có thể review và hiệu lực trong vài giây. Không cần triển khai lại, không cần đổi client.

routing.yaml
version: 1
rules:
- id: hard_agent_task
when: task_class == "agent" && difficulty >= 0.6
use:
model: "claude-opus-4-7"
reasoning_effort: high # spend where it matters
- id: short_prompts
when: request.input_tokens < 500
use: { delegate: cheapest }
default:
delegate: balanced # fall back to the chosen mode
YAML + CELversion-controlledlive in seconds

Cài đặt

Hoạt động trong 60 giây.

Đổi một URL. SDK, tên mô hình và streaming của bạn hoạt động như trước.

Bước 1
🔗

Hướng SDK về chúng tôi

Đặt base_url thành api.orcarouter.ai/v1 và đổi khóa API của bạn. Không cần thay đổi mã khác.

Bước 2

Chúng tôi định tuyến, bảo vệ & quan sát

Mọi lệnh gọi được định tuyến tới mô hình tốt nhất, kiểm tra theo guardrail của bạn và đo lường — chấm điểm trong dưới 1ms, với chuyển dự phòng, cache và log đầy đủ tích hợp sẵn.

Bước 3

Bạn ship, trên một endpoint

Lưu lượng đi thẳng tới API first-party của từng nhà cung cấp ở mức giá niêm yết — chúng tôi cộng $0 mỗi token. Một endpoint tương thích OpenAI cho định tuyến, khả năng quan sát và quản trị.


Mọi model. Một bảng giá.

200+ model với giá trực tiếp, xếp cạnh nhau — đúng mức bạn trả thẳng cho nhà cung cấp. Chúng tôi cộng thêm $0.

Xem tất cả 200+ mô hình →
Mô hìnhĐịnh tuyến đếnĐầu vào /MĐầu ra /MNgữ cảnhChất lượng
obsidian/gemma-4-26B-A4BMỚI$0.250$2.90262K4.0
obsidian/Qwen3.6-35B-A3BMỚI$0.310$4.21262K4.0
anthropic/claude-sonnet-5MỚIAnthropic Direct$2.00$10.001M9.0
kling/kling-3-turboMỚI$0.112 /call
z-ai/glm-5.2MỚIZhipu AI$1.40$4.401M9.0
kimi/kimi-k2.7-codeMỚIMoonshot$0.950$4.00262K8.0
anthropic/claude-fable-5MỚIAnthropic Direct$10.00$50.001M10.0
qwen/qwen3.7-plusAlibaba Cloud$0.350$1.421M8.0
minimax/minimax-m3$0.300$1.201M9.0
anthropic/claude-opus-4.8Anthropic Direct$5.00$25.001M10.0
google/gemini-3.5-flashGoogle Direct$1.50$9.001M9.0
qwen/qwen3.7-maxAlibaba Cloud$1.25$3.751M5.0
qwen/qwen3.7-max-2026-05-20Alibaba Cloud$1.25$3.751M5.0
qwen/qwen3.6-flashAlibaba Cloud$0.250$1.501M7.0
qwen/qwen3.6-35b-a3bAlibaba Cloud$0.248$1.48262K8.0
+ Thêm 194 mô hình · Giá cập nhật mỗi 60 giây

Mọi thứ client OpenAI của bạn vốn đã gọi.

Streaming, tool call, structured output, vision, embedding và audio — định tuyến nguyên vẹn trên mọi model.

ModelStreamingToolsStructuredVisionEmbeddingsAudio
grok/grok-4.3được hỗ trợđược hỗ trợđược hỗ trợđược hỗ trợkhông hỗ trợkhông hỗ trợ
anthropic/claude-opus-4.7được hỗ trợđược hỗ trợđược hỗ trợđược hỗ trợkhông hỗ trợkhông hỗ trợ
google/gemini-3.1-pro-previewđược hỗ trợđược hỗ trợđược hỗ trợđược hỗ trợkhông hỗ trợđược hỗ trợ
anthropic/claude-fable-5được hỗ trợđược hỗ trợđược hỗ trợđược hỗ trợkhông hỗ trợkhông hỗ trợ
anthropic/claude-opus-4.8được hỗ trợđược hỗ trợđược hỗ trợđược hỗ trợkhông hỗ trợkhông hỗ trợ
Giá

Định tuyến miễn phí.
Trả tiền cho tính năng.

Chúng tôi không bao giờ lấy phần từ chi tiêu token của bạn. Doanh thu đến từ các tính năng nhóm tuỳ chọn.

Đảm bảo không phụ phí
Bạn trả trực tiếp cho nhà cung cấp theo giá niêm yết của họ. Chúng tôi không thêm gì vào chi phí token. Định tuyến miễn phí; gói Team tùy chọn tài trợ cho nền tảng.
$0.00phí định tuyến

Hacker

Miễn phí
Mãi mãi. Không phụ phí trên tất cả token.
✓ Định Tuyến — 200+ mô hình, tự động chuyển dự phòng
✓ Quan Sát — dashboard cơ bản
✓ Quản Lý — phiên bản hóa prompt
✓ 3 API key · 0% phụ phí token
Bắt đầu miễn phí

Doanh nghiệp

Tuỳ chỉnh
Cam kết SLA + triển khai riêng.
✓ Mọi thứ trong Team
✓ Triển khai riêng / on-prem
✓ SLA uptime 99.99%
✓ Hạ tầng riêng
✓ Hỗ trợ chuyên trách & giá tùy chỉnh
Tin cậy và tuân thủ

Được kiểm toán độc lập. Tuân thủ liên tục.

Báo cáo kiểm toán được cung cấp theo NDA — hãy yêu cầu bản sao bên dưới.

Thông minh hơn, an toàn hơn, tối ưu chi phí.

Đổi một dòng. Đó là toàn bộ việc migration.

Đăng ký bằng GitHub — tặng $5 token. Không cần thẻ tín dụng. Bạn chạy thật trong chưa đầy một phút.