GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

新精选

来自 Z.ai · text in · text out · 1M ctx · 2026-06-16

1M令牌上下文窗口，用于长文本处理，通过OrcaRouter的API访问。

端点:/v1/chat/completions

输入$1.40/ 百万 tokens

输出$4.40/ 百万 tokens

p50 首字节5.60 s7 天

p95 首字节7.54 s7 天

流量8.0Mtokens / 7 天

获取 GLM 5.2 API →▶ 在 Playground 中试用 </> 通过 API 使用

Z.ai: GLM 5.2 是什么？

Z.ai: GLM 5.2 是一款纯文本大型语言模型，具有100万token的上下文窗口，最大输出可达12.8万token。该模型由Z.ai开发，并通过OrcaRouter的API提供。模型仅处理文本输入，非常适合需要阅读和生成长篇内容的任务，如整本书分析或多文件代码库的综合摘要。定价遵循提供商的费率：每百万输入token 1.40美元，每百万输出token 4.40美元，OrcaRouter不额外加价。

这个模型是为谁设计的？

Z.ai: GLM 5.2 面向需要在单次 API 调用中处理超长文本序列的用户和组织。常见角色包括分析完整合同或证据文件的法律专业人士、审阅大量文献的研究人员、理解大型代码库的软件工程师，以及处理长日志文件的数据科学家。充足的上下文窗口减少了手动分块的需求，而高输出限制则支持生成详细报告或代码补丁。

关键规格是什么？

关键规格包括总上下文窗口为1,000,000个令牌（输入和输出合计），最大输出为128,000个令牌。该模型仅支持文本输入，未宣传多模态功能。通过OrcaRouter兼容OpenAI的API进行访问，使用模型ID "z-ai/glm-5.2"，基础URL为 https://api.orcarouter.ai/v1。定价按令牌计算：每百万输入令牌1.40美元，每百万输出令牌4.40美元，按Z.ai的供应商费率计费，无加价。

代码示例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

价格

输入 / 1M tokens	$1.40
输出 / 1M tokens	$4.40
缓存读取 / 1M	$0.260
货币	USD

性能

公共基准测试

最近评估 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

来源: artificialanalysis.ai

常见问题

GLM 5.2 每个 token 的成本是多少？

输入token费用为每百万token $1.40，输出token费用为每百万token $4.40。OrcaRouter不收取额外费用；您支付Z.ai的提供商费率。

模型的上下文窗口大小是多少？

上下文窗口为1,000,000个token（输入和输出合计）。每次请求的最大输出为128,000个token。

这个模型的优势是什么？

其主要优势在于大上下文窗口（1M tokens）和高输出限制（128k tokens），使其能够单次处理超长文档或对话。它仅支持文本。

GLM 5.2 与其他具有更小上下文窗口的模型相比如何？

它拥有更大的上下文窗口，适用于需要阅读整本书或大型代码库的任务。较小的模型在其上下文限制范围内执行任务时更便宜且更快。

OrcaRouter 是否缓存令牌或提供折扣？

不，OrcaRouter并未为此模型宣传令牌缓存或批量折扣。定价按提供商的费率以每令牌计费，零加价。

如何通过OrcaRouter调用GLM 5.2？

使用位于 https://api.orcarouter.ai/v1 的 OpenAI 兼容 API，模型 ID 为 “z-ai/glm-5.2”。使用您的 API 密钥发送一个标准的聊天补全请求。

该模型支持哪些输入模态？

Z.ai：GLM 5.2 仅支持文本输入。它无法处理图像、音频或其他多模态内容。

是否有已知的基准测试分数？

在现有资料中未提供GLM 5.2的基准测试分数。用户应使用自己的数据集评估该模型。

我可以流式输出吗？

是的，在你的 API 调用中设置 `stream: true`。响应将以服务器推送事件的形式发送，与 OpenAI 的流式格式相同。

如果我超过100万token的限制，会发生什么？

您将收到一个错误。请确保您的消息中的令牌总数加上max_tokens不超过1,000,000。

嵌入此徽章

粘贴到您的博客文章

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•通过 OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 在 OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Z.ai: GLM 5.2 是什么？

这个模型是为谁设计的？

关键规格是什么？

GLM 5.2 可以执行哪些核心任务？

什么时候应该使用这个模型而不是较小的模型？

模型的局限性是什么？

大上下文窗口如何影响性能？

模型的报告基准评分是什么？

延迟与较小模型相比如何？

该模型的已知优势是什么？

GLM 5.2是如何定价的？

是否有折扣或批量定价？

成本与较小模型相比如何？

如何通过OrcaRouter调用GLM 5.2？

支持哪些参数？

我可以流式传输响应吗？

如何从其他提供商迁移？

GLM 5.2与其他大型上下文模型相比如何？

我应该什么时候选择GLM 5.2而不是更便宜的模型？

那上下文更小但质量相似的模型呢？

代码示例

价格

性能

公共基准测试

更多 Z.ai 模型

常见问题

嵌入此徽章