GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

新精選

來自 Z.ai · text in · text out · 1M ctx · 2026-06-16

1M token 上下文視窗，用於長篇文本處理，通過 OrcaRouter 的 API 存取。

端點:/v1/chat/completions

輸入$1.40/ 百萬 tokens

輸出$4.40/ 百萬 tokens

p50 首字節5.60 s7 天

p95 首字節7.54 s7 天

流量8.0Mtokens / 7 天

取得 GLM 5.2 API →▶ 在 Playground 中試用 </> 透過 API 使用

什麼是Z.ai: GLM 5.2？

Z.ai: GLM 5.2 是一個純文字大型語言模型，擁有 1,000,000 個 token 的上下文視窗，最大輸出可達 128,000 個 token。該模型由 Z.ai 開發，並透過 OrcaRouter 的 API 提供。此模型僅處理文字輸入，非常適合需要閱讀和生成極長篇幅的任務，例如整本書籍分析或多檔案程式碼庫的全面摘要。定價遵循供應商費率：每百萬輸入 token 1.40 美元，每百萬輸出 token 4.40 美元，OrcaRouter 不收取任何加成費用。

這個模型是為誰設計的？

Z.ai: GLM 5.2 針對需要在單次 API 調用中處理極長文本序列的用戶與組織。常見角色包括：分析完整合約或發現文件的法律專業人士、審閱大量文獻的研究人員、理解大型程式碼庫的軟體工程師，以及處理長日誌檔案的資料科學家。寬廣的上下文窗口降低了手動分塊的需求，而高輸出限制則支援生成詳細報告或程式碼修補。

主要規格是什麼？

關鍵規格包括總上下文窗口為 1,000,000 個 token（輸入與輸出合計），最大輸出為 128,000 個 token。該模型僅支援文字輸入，未宣稱具備多模態功能。透過 OrcaRouter 的 OpenAI 相容 API 存取，使用模型 ID “z-ai/glm-5.2”，基礎 URL 為 https://api.orcarouter.ai/v1。定價以每個 token 計：每百萬個輸入 token 1.40 美元，每百萬個輸出 token 4.40 美元，以 Z.ai 的供應商費率計費，無加價。

程式碼範例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

價格

輸入 / 1M tokens	$1.40
輸出 / 1M tokens	$4.40
快取讀取 / 1M	$0.260
貨幣	USD

效能

公開基準測試

最近評估 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

來源: artificialanalysis.ai

常見問題

GLM 5.2 的每 token 成本是多少？

輸入token每百萬個費用為$1.40，輸出token每百萬個費用為$4.40。OrcaRouter不收取任何加成，您支付的是Z.ai的提供商價格。

模型的上下文窗口大小是多少？

上下文視窗為1,000,000個tokens（合計輸入和輸出）。每次請求的最大輸出為128,000個tokens。

該模型的優勢是什麼？

其主要優勢在於擁有龐大的上下文視窗（1M token）與高輸出限制（128k token），使其能夠在單次調用中處理極長的文件或對話。此模型僅限文字。

GLM 5.2 與其他具有較小上下文窗口的模型相比如何？

它擁有更大的上下文窗口，適用於需要閱讀整本書或大型程式碼庫的任務。較小的模型在符合其上下文限制的任務中更便宜且更快。

OrcaRouter 是否會快取 token 或提供折扣？

不，OrcaRouter 不為此模型宣傳代幣快取或大量折扣。定價按供應商費率按代幣計費，無任何加成。

我如何透過 OrcaRouter 呼叫 GLM 5.2？

使用位於 https://api.orcarouter.ai/v1 的 OpenAI 相容 API，模型 ID「z-ai/glm-5.2」。使用你的 API 金鑰發送標準的聊天完成請求。

模型支援哪些輸入模態？

Z.ai: GLM 5.2 僅支援文字輸入。無法處理圖片、音訊或其他多模態內容。

是否有已知的基準分數？

現有資料中未提供 GLM 5.2 的基準測試分數。使用者應使用自己的資料集來評估模型。

我可以流式輸出嗎？

是的，在您的 API 呼叫中設定 `stream: true`。回應將以伺服器發送事件的形式發送，與 OpenAI 的串流格式相同。

如果我超過了 1M token 限制會發生什麼？

您將會收到錯誤訊息。請確保您訊息中的 token 總數加上 max_tokens 不超過 1,000,000。

嵌入此徽章

貼到您的部落格文章

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•透過 OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 於 OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

什麼是Z.ai: GLM 5.2？

這個模型是為誰設計的？

主要規格是什麼？

GLM 5.2 可以執行哪些核心任務？

何時應該使用這個模型而不是較小的模型？

模型的限制是什麼？

大型上下文窗口如何影響效能？

模型報告的基準測試分數是多少？

延遲與較小模型相比如何？

這個模型已知的優勢是什麼？

GLM 5.2 的定價如何？

是否有任何折扣或批量優惠？

成本與較小模型相比如何？

如何通过 OrcaRouter 呼叫 GLM 5.2？

支援哪些參數？

我可以串流回應嗎？

如何從其他供應商遷移？

GLM 5.2 與其他大型上下文模型相比如何？

何時應該選擇GLM 5.2而非更便宜的模型？

那具有較小上下文但品質相似的模型呢？

程式碼範例

價格

效能

公開基準測試

更多 Z.ai 模型

常見問題

嵌入此徽章