GLM 5.2

z-ai/glm-5.2
精选
来自 Z.ai · text in · text out · 1M ctx · 2026-06-16

1M令牌上下文窗口,用于长文本处理,通过OrcaRouter的API访问。

输入$1.40/ 百万 tokens
输出$4.40/ 百万 tokens
p50 首字节5.60 s7 天
p95 首字节7.54 s7 天
流量8.0Mtokens / 7 天

Z.ai: GLM 5.2 是什么?

Z.ai: GLM 5.2 是一款纯文本大型语言模型,具有100万token的上下文窗口,最大输出可达12.8万token。该模型由Z.ai开发,并通过OrcaRouter的API提供。模型仅处理文本输入,非常适合需要阅读和生成长篇内容的任务,如整本书分析或多文件代码库的综合摘要。定价遵循提供商的费率:每百万输入token 1.40美元,每百万输出token 4.40美元,OrcaRouter不额外加价。

这个模型是为谁设计的?

Z.ai: GLM 5.2 面向需要在单次 API 调用中处理超长文本序列的用户和组织。常见角色包括分析完整合同或证据文件的法律专业人士、审阅大量文献的研究人员、理解大型代码库的软件工程师,以及处理长日志文件的数据科学家。充足的上下文窗口减少了手动分块的需求,而高输出限制则支持生成详细报告或代码补丁。

关键规格是什么?

关键规格包括总上下文窗口为1,000,000个令牌(输入和输出合计),最大输出为128,000个令牌。该模型仅支持文本输入,未宣传多模态功能。通过OrcaRouter兼容OpenAI的API进行访问,使用模型ID "z-ai/glm-5.2",基础URL为 https://api.orcarouter.ai/v1。定价按令牌计算:每百万输入令牌1.40美元,每百万输出令牌4.40美元,按Z.ai的供应商费率计费,无加价。

代码示例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

价格

输入 / 1M tokens$1.40
输出 / 1M tokens$4.40
缓存读取 / 1M$0.260
货币USD

性能

p50 首字节
5.60 s
输出速度
96.0 tok/s
p95 首字节
7.54 s
错误率
0%

公共基准测试

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
来源: artificialanalysis.ai

常见问题

GLM 5.2 每个 token 的成本是多少?
输入token费用为每百万token $1.40,输出token费用为每百万token $4.40。OrcaRouter不收取额外费用;您支付Z.ai的提供商费率。
模型的上下文窗口大小是多少?
上下文窗口为1,000,000个token(输入和输出合计)。每次请求的最大输出为128,000个token。
这个模型的优势是什么?
其主要优势在于大上下文窗口(1M tokens)和高输出限制(128k tokens),使其能够单次处理超长文档或对话。它仅支持文本。
GLM 5.2 与其他具有更小上下文窗口的模型相比如何?
它拥有更大的上下文窗口,适用于需要阅读整本书或大型代码库的任务。较小的模型在其上下文限制范围内执行任务时更便宜且更快。
OrcaRouter 是否缓存令牌或提供折扣?
不,OrcaRouter并未为此模型宣传令牌缓存或批量折扣。定价按提供商的费率以每令牌计费,零加价。
如何通过OrcaRouter调用GLM 5.2?
使用位于 https://api.orcarouter.ai/v1 的 OpenAI 兼容 API,模型 ID 为 “z-ai/glm-5.2”。使用您的 API 密钥发送一个标准的聊天补全请求。
该模型支持哪些输入模态?
Z.ai:GLM 5.2 仅支持文本输入。它无法处理图像、音频或其他多模态内容。
是否有已知的基准测试分数?
在现有资料中未提供GLM 5.2的基准测试分数。用户应使用自己的数据集评估该模型。
我可以流式输出吗?
是的,在你的 API 调用中设置 `stream: true`。响应将以服务器推送事件的形式发送,与 OpenAI 的流式格式相同。
如果我超过100万token的限制,会发生什么?
您将收到一个错误。请确保您的消息中的令牌总数加上max_tokens不超过1,000,000。

嵌入此徽章

Z.ai: GLM 5.2$1.40/M in5596ms p50通过 OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 在 OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)