GLM 5.2

z-ai/glm-5.2
MớiNổi bật
bởi Z.ai · text in · text out · 1M ctx · 2026-06-16

Cửa sổ ngữ cảnh 1M token cho xử lý văn bản dài, được truy cập qua API của OrcaRouter.

Điểm cuối:/v1/chat/completions
ĐẦU VÀO$1.40/ 1M token
ĐẦU RA$4.40/ 1M token
TTFT p505.60 s7 ngày
p95 TTFT7.54 s7 ngày
LƯU LƯỢNG8.0Mtokens / 7 ngày

Z.ai: GLM 5.2 là gì?

Z.ai: GLM 5.2 là một mô hình ngôn ngữ lớn chỉ xử lý văn bản với cửa sổ ngữ cảnh 1,000,000 token và đầu ra tối đa 128,000 token. Nó được phát triển bởi Z.ai và được cung cấp thông qua API của OrcaRouter. Mô hình chỉ xử lý đầu vào văn bản, khiến nó trở nên lý tưởng cho các tác vụ yêu cầu đọc và tạo ra các đoạn văn rất dài, chẳng hạn như phân tích toàn bộ sách hoặc tóm tắt toàn diện các cơ sở mã nhiều tệp. Giá tuân theo tỷ lệ của nhà cung cấp: $1.40 cho mỗi triệu token đầu vào và $4.40 cho mỗi triệu token đầu ra, không có phụ phí từ OrcaRouter.

Mô hình này được thiết kế cho ai?

Z.ai: GLM 5.2 nhắm đến người dùng và tổ chức cần xử lý các chuỗi văn bản cực kỳ dài trong một lệnh gọi API duy nhất. Các vai trò phổ biến bao gồm chuyên gia pháp lý phân tích toàn bộ hợp đồng hoặc tài liệu khám phá, nhà nghiên cứu xem xét tài liệu phong phú, kỹ sư phần mềm hiểu các kho mã nguồn lớn, và nhà khoa học dữ liệu làm việc với các tệp nhật ký dài. Cửa sổ ngữ cảnh rộng rãi giảm nhu cầu phân đoạn thủ công, trong khi giới hạn đầu ra cao hỗ trợ tạo báo cáo chi tiết hoặc bản vá mã.

Các thông số kỹ thuật chính là gì?

Các thông số kỹ thuật chính bao gồm tổng cửa sổ ngữ cảnh 1,000,000 token (cả đầu vào và đầu ra), với đầu ra tối đa 128,000 token. Mô hình chỉ hỗ trợ đầu vào văn bản; không có khả năng đa phương thức nào được quảng cáo. Mô hình được truy cập thông qua API tương thích OpenAI của OrcaRouter bằng model ID “z-ai/glm-5.2” tại base URL https://api.orcarouter.ai/v1. Giá được tính theo token: $1.40 cho mỗi triệu token đầu vào và $4.40 cho mỗi triệu token đầu ra, được tính theo tỷ lệ nhà cung cấp của Z.ai với markup bằng 0.

Mã ví dụ

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Giá

Đầu vào / 1M tokens$1.40
Đầu ra / 1M tokens$4.40
Đọc cache / 1M$0.260
Tiền tệUSD

Hiệu suất

TTFT p50
5.60 s
Tốc độ đầu ra
96.0 tok/s
p95 TTFT
7.54 s
Tỷ lệ lỗi
0%

Benchmark công khai

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
Nguồn: artificialanalysis.ai

Câu hỏi thường gặp

Chi phí cho mỗi token của GLM 5.2 là bao nhiêu?
Phí token đầu vào là $1.40 cho mỗi triệu token, và token đầu ra là $4.40 cho mỗi triệu token. Không có phụ phí từ OrcaRouter; bạn thanh toán theo giá nhà cung cấp của Z.ai.
Kích thước cửa sổ ngữ cảnh của mô hình là bao nhiêu?
Cửa sổ ngữ cảnh là 1,000,000 token (kết hợp đầu vào và đầu ra). Đầu ra tối đa là 128,000 token mỗi yêu cầu.
Điểm mạnh của mô hình là gì?
Điểm mạnh chính của nó là cửa sổ ngữ cảnh lớn (1M tokens) và giới hạn đầu ra cao (128k tokens), cho phép xử lý các tài liệu hoặc hội thoại rất dài trong một lần gọi. Nó chỉ hỗ trợ văn bản.
GLM 5.2 so sánh thế nào với các mô hình khác có cửa sổ ngữ cảnh nhỏ hơn?
Nó có cửa sổ ngữ cảnh lớn hơn nhiều, phù hợp cho các tác vụ yêu cầu đọc toàn bộ sách hoặc mã nguồn lớn. Các mô hình nhỏ hơn thì rẻ hơn và nhanh hơn cho các tác vụ nằm trong giới hạn ngữ cảnh của chúng.
OrcaRouter có lưu trữ token hay cung cấp giảm giá không?
Không, OrcaRouter không quảng cáo về bộ nhớ đệm token hoặc giảm giá theo khối lượng cho mô hình này. Giá được tính theo từng token với mức giá của nhà cung cấp, không có phụ phí.
Làm thế nào để gọi GLM 5.2 thông qua OrcaRouter?
Sử dụng API tương thích với OpenAI tại URL cơ sở https://api.orcarouter.ai/v1, ID mô hình “z-ai/glm-5.2”. Gửi một yêu cầu hoàn thành hội thoại tiêu chuẩn với khóa API của bạn.
Mô hình hỗ trợ những phương thức nhập liệu nào?
Z.ai: GLM 5.2 chỉ hỗ trợ đầu vào văn bản. Nó không thể xử lý hình ảnh, âm thanh hoặc các đa phương thức khác.
Có điểm benchmark nào được biết đến không?
Không có điểm chuẩn nào cho GLM 5.2 được cung cấp trong các dữ liệu có sẵn. Người dùng nên đánh giá mô hình trên tập dữ liệu của riêng họ.
Tôi có thể truyền luồng đầu ra không?
Vâng, hãy đặt `stream: true` trong lệnh gọi API của bạn. Phản hồi sẽ được gửi dưới dạng sự kiện do máy chủ gửi (server‑sent events), giống hệt định dạng streaming của OpenAI.
Điều gì xảy ra nếu tôi vượt quá giới hạn 1M token?
Bạn sẽ nhận được một lỗi. Đảm bảo tổng số token trong tin nhắn của bạn cộng với max_tokens không vượt quá 1,000,000.

Nhúng huy hiệu này

Z.ai: GLM 5.2$1.40/M in5596ms p50qua OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 trên OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)