GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

MớiNổi bật

bởi Z.ai · text in · text out · 1M ctx · 2026-06-16

Cửa sổ ngữ cảnh 1M token cho xử lý văn bản dài, được truy cập qua API của OrcaRouter.

Điểm cuối:/v1/chat/completions

ĐẦU VÀO$1.40/ 1M token

ĐẦU RA$4.40/ 1M token

TTFT p505.60 s7 ngày

p95 TTFT7.54 s7 ngày

LƯU LƯỢNG8.0Mtokens / 7 ngày

Lấy API GLM 5.2 →▶ Thử trong Playground </> Dùng qua API

Z.ai: GLM 5.2 là gì?

Z.ai: GLM 5.2 là một mô hình ngôn ngữ lớn chỉ xử lý văn bản với cửa sổ ngữ cảnh 1,000,000 token và đầu ra tối đa 128,000 token. Nó được phát triển bởi Z.ai và được cung cấp thông qua API của OrcaRouter. Mô hình chỉ xử lý đầu vào văn bản, khiến nó trở nên lý tưởng cho các tác vụ yêu cầu đọc và tạo ra các đoạn văn rất dài, chẳng hạn như phân tích toàn bộ sách hoặc tóm tắt toàn diện các cơ sở mã nhiều tệp. Giá tuân theo tỷ lệ của nhà cung cấp: $1.40 cho mỗi triệu token đầu vào và $4.40 cho mỗi triệu token đầu ra, không có phụ phí từ OrcaRouter.

Mô hình này được thiết kế cho ai?

Z.ai: GLM 5.2 nhắm đến người dùng và tổ chức cần xử lý các chuỗi văn bản cực kỳ dài trong một lệnh gọi API duy nhất. Các vai trò phổ biến bao gồm chuyên gia pháp lý phân tích toàn bộ hợp đồng hoặc tài liệu khám phá, nhà nghiên cứu xem xét tài liệu phong phú, kỹ sư phần mềm hiểu các kho mã nguồn lớn, và nhà khoa học dữ liệu làm việc với các tệp nhật ký dài. Cửa sổ ngữ cảnh rộng rãi giảm nhu cầu phân đoạn thủ công, trong khi giới hạn đầu ra cao hỗ trợ tạo báo cáo chi tiết hoặc bản vá mã.

Các thông số kỹ thuật chính là gì?

Các thông số kỹ thuật chính bao gồm tổng cửa sổ ngữ cảnh 1,000,000 token (cả đầu vào và đầu ra), với đầu ra tối đa 128,000 token. Mô hình chỉ hỗ trợ đầu vào văn bản; không có khả năng đa phương thức nào được quảng cáo. Mô hình được truy cập thông qua API tương thích OpenAI của OrcaRouter bằng model ID “z-ai/glm-5.2” tại base URL https://api.orcarouter.ai/v1. Giá được tính theo token: $1.40 cho mỗi triệu token đầu vào và $4.40 cho mỗi triệu token đầu ra, được tính theo tỷ lệ nhà cung cấp của Z.ai với markup bằng 0.

Mã ví dụ

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Giá

Đầu vào / 1M tokens	$1.40
Đầu ra / 1M tokens	$4.40
Đọc cache / 1M	$0.260
Tiền tệ	USD

Hiệu suất

7 ngày gần đây

TTFT p50

5.60 s

Tốc độ đầu ra

96.0 tok/s

p95 TTFT

7.54 s

Tỷ lệ lỗi

Benchmark công khai

Đánh giá gần nhất 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

Nguồn: artificialanalysis.ai

Thêm từ Z.ai

Xem tất cả mô hình z-ai →

GLM 5.1Hàng đầu

z-ai/glm-5.1

$1.40 đầu vào · $4.40 đầu ra / 1M

200K ngữ cảnh· chất lượng 9/10

GLM 5

z-ai/glm-5

$1.00 đầu vào · $3.20 đầu ra / 1M

200K ngữ cảnh· chất lượng 8/10

GLM 4.5Rẻ nhất

z-ai/glm-4.5

$0.60 đầu vào · $2.20 đầu ra / 1M

128K ngữ cảnh· chất lượng 7/10

Câu hỏi thường gặp

Chi phí cho mỗi token của GLM 5.2 là bao nhiêu?

Phí token đầu vào là $1.40 cho mỗi triệu token, và token đầu ra là $4.40 cho mỗi triệu token. Không có phụ phí từ OrcaRouter; bạn thanh toán theo giá nhà cung cấp của Z.ai.

Kích thước cửa sổ ngữ cảnh của mô hình là bao nhiêu?

Cửa sổ ngữ cảnh là 1,000,000 token (kết hợp đầu vào và đầu ra). Đầu ra tối đa là 128,000 token mỗi yêu cầu.

Điểm mạnh của mô hình là gì?

Điểm mạnh chính của nó là cửa sổ ngữ cảnh lớn (1M tokens) và giới hạn đầu ra cao (128k tokens), cho phép xử lý các tài liệu hoặc hội thoại rất dài trong một lần gọi. Nó chỉ hỗ trợ văn bản.

GLM 5.2 so sánh thế nào với các mô hình khác có cửa sổ ngữ cảnh nhỏ hơn?

Nó có cửa sổ ngữ cảnh lớn hơn nhiều, phù hợp cho các tác vụ yêu cầu đọc toàn bộ sách hoặc mã nguồn lớn. Các mô hình nhỏ hơn thì rẻ hơn và nhanh hơn cho các tác vụ nằm trong giới hạn ngữ cảnh của chúng.

OrcaRouter có lưu trữ token hay cung cấp giảm giá không?

Không, OrcaRouter không quảng cáo về bộ nhớ đệm token hoặc giảm giá theo khối lượng cho mô hình này. Giá được tính theo từng token với mức giá của nhà cung cấp, không có phụ phí.

Làm thế nào để gọi GLM 5.2 thông qua OrcaRouter?

Sử dụng API tương thích với OpenAI tại URL cơ sở https://api.orcarouter.ai/v1, ID mô hình “z-ai/glm-5.2”. Gửi một yêu cầu hoàn thành hội thoại tiêu chuẩn với khóa API của bạn.

Mô hình hỗ trợ những phương thức nhập liệu nào?

Z.ai: GLM 5.2 chỉ hỗ trợ đầu vào văn bản. Nó không thể xử lý hình ảnh, âm thanh hoặc các đa phương thức khác.

Có điểm benchmark nào được biết đến không?

Không có điểm chuẩn nào cho GLM 5.2 được cung cấp trong các dữ liệu có sẵn. Người dùng nên đánh giá mô hình trên tập dữ liệu của riêng họ.

Tôi có thể truyền luồng đầu ra không?

Vâng, hãy đặt `stream: true` trong lệnh gọi API của bạn. Phản hồi sẽ được gửi dưới dạng sự kiện do máy chủ gửi (server‑sent events), giống hệt định dạng streaming của OpenAI.

Điều gì xảy ra nếu tôi vượt quá giới hạn 1M token?

Bạn sẽ nhận được một lỗi. Đảm bảo tổng số token trong tin nhắn của bạn cộng với max_tokens không vượt quá 1,000,000.

Nhúng huy hiệu này

Dán vào bài blog

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•qua OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 trên OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Z.ai: GLM 5.2 là gì?

Mô hình này được thiết kế cho ai?

Các thông số kỹ thuật chính là gì?

GLM 5.2 có thể thực hiện các tác vụ cốt lõi nào?

Khi nào bạn nên sử dụng mô hình này thay vì một mô hình nhỏ hơn?

Các hạn chế của mô hình là gì?

Cửa sổ ngữ cảnh lớn ảnh hưởng đến hiệu suất như thế nào?

Điểm chuẩn được báo cáo của mô hình là gì?

Độ trễ so sánh thế nào với các mô hình nhỏ hơn?

Các điểm mạnh nổi bật của mô hình là gì?

GLM 5.2 được định giá như thế nào?

Có giảm giá hoặc giá theo số lượng không?

Chi phí so với các mẫu nhỏ hơn như thế nào?

Làm thế nào để gọi GLM 5.2 qua OrcaRouter?

Các tham số nào được hỗ trợ?

Tôi có thể nhận phản hồi dạng luồng không?

Làm cách nào để di chuyển từ một nhà cung cấp khác?

GLM 5.2 so sánh thế nào với các mô hình ngữ cảnh lớn khác?

Khi nào tôi nên chọn GLM 5.2 thay vì một mô hình rẻ hơn?

Còn về các mô hình có ngữ cảnh nhỏ hơn nhưng chất lượng tương tự thì sao?