GLM 5.2

z-ai/glm-5.2
精選
來自 Z.ai · text in · text out · 1M ctx · 2026-06-16

1M token 上下文視窗,用於長篇文本處理,通過 OrcaRouter 的 API 存取。

輸入$1.40/ 百萬 tokens
輸出$4.40/ 百萬 tokens
p50 首字節5.60 s7 天
p95 首字節7.54 s7 天
流量8.0Mtokens / 7 天

什麼是Z.ai: GLM 5.2?

Z.ai: GLM 5.2 是一個純文字大型語言模型,擁有 1,000,000 個 token 的上下文視窗,最大輸出可達 128,000 個 token。該模型由 Z.ai 開發,並透過 OrcaRouter 的 API 提供。此模型僅處理文字輸入,非常適合需要閱讀和生成極長篇幅的任務,例如整本書籍分析或多檔案程式碼庫的全面摘要。定價遵循供應商費率:每百萬輸入 token 1.40 美元,每百萬輸出 token 4.40 美元,OrcaRouter 不收取任何加成費用。

這個模型是為誰設計的?

Z.ai: GLM 5.2 針對需要在單次 API 調用中處理極長文本序列的用戶與組織。常見角色包括:分析完整合約或發現文件的法律專業人士、審閱大量文獻的研究人員、理解大型程式碼庫的軟體工程師,以及處理長日誌檔案的資料科學家。寬廣的上下文窗口降低了手動分塊的需求,而高輸出限制則支援生成詳細報告或程式碼修補。

主要規格是什麼?

關鍵規格包括總上下文窗口為 1,000,000 個 token(輸入與輸出合計),最大輸出為 128,000 個 token。該模型僅支援文字輸入,未宣稱具備多模態功能。透過 OrcaRouter 的 OpenAI 相容 API 存取,使用模型 ID “z-ai/glm-5.2”,基礎 URL 為 https://api.orcarouter.ai/v1。定價以每個 token 計:每百萬個輸入 token 1.40 美元,每百萬個輸出 token 4.40 美元,以 Z.ai 的供應商費率計費,無加價。

程式碼範例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

價格

輸入 / 1M tokens$1.40
輸出 / 1M tokens$4.40
快取讀取 / 1M$0.260
貨幣USD

效能

p50 首字節
5.60 s
輸出速度
96.0 tok/s
p95 首字節
7.54 s
錯誤率
0%

公開基準測試

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
來源: artificialanalysis.ai

常見問題

GLM 5.2 的每 token 成本是多少?
輸入token每百萬個費用為$1.40,輸出token每百萬個費用為$4.40。OrcaRouter不收取任何加成,您支付的是Z.ai的提供商價格。
模型的上下文窗口大小是多少?
上下文視窗為1,000,000個tokens(合計輸入和輸出)。每次請求的最大輸出為128,000個tokens。
該模型的優勢是什麼?
其主要優勢在於擁有龐大的上下文視窗(1M token)與高輸出限制(128k token),使其能夠在單次調用中處理極長的文件或對話。此模型僅限文字。
GLM 5.2 與其他具有較小上下文窗口的模型相比如何?
它擁有更大的上下文窗口,適用於需要閱讀整本書或大型程式碼庫的任務。較小的模型在符合其上下文限制的任務中更便宜且更快。
OrcaRouter 是否會快取 token 或提供折扣?
不,OrcaRouter 不為此模型宣傳代幣快取或大量折扣。定價按供應商費率按代幣計費,無任何加成。
我如何透過 OrcaRouter 呼叫 GLM 5.2?
使用位於 https://api.orcarouter.ai/v1 的 OpenAI 相容 API,模型 ID「z-ai/glm-5.2」。使用你的 API 金鑰發送標準的聊天完成請求。
模型支援哪些輸入模態?
Z.ai: GLM 5.2 僅支援文字輸入。無法處理圖片、音訊或其他多模態內容。
是否有已知的基準分數?
現有資料中未提供 GLM 5.2 的基準測試分數。使用者應使用自己的資料集來評估模型。
我可以流式輸出嗎?
是的,在您的 API 呼叫中設定 `stream: true`。回應將以伺服器發送事件的形式發送,與 OpenAI 的串流格式相同。
如果我超過了 1M token 限制會發生什麼?
您將會收到錯誤訊息。請確保您訊息中的 token 總數加上 max_tokens 不超過 1,000,000。

嵌入此徽章

Z.ai: GLM 5.2$1.40/M in5596ms p50透過 OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 於 OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)