GLM 5.2

z-ai/glm-5.2
新着注目
提供 Z.ai · text in · text out · 1M ctx · 2026-06-16

OrcaRouterのAPIを介してアクセスされる、長文テキスト処理向けの1Mトークンコンテキストウィンドウ。

エンドポイント:/v1/chat/completions
入力$1.40/ 100万 tokens
出力$4.40/ 100万 tokens
p50 TTFT5.60 s7日
p95 TTFT7.54 s7日
トラフィック8.0Mtokens / 7日

Z.ai: GLM 5.2とは何ですか?

Z.ai: GLM 5.2 は、100万トークンのコンテキストウィンドウと最大128,000トークンの出力を持つテキスト専用大規模言語モデルです。Z.ai によって開発され、OrcaRouter のAPIを通じて提供されています。このモデルはテキスト入力のみを処理するため、全書籍分析やマルチファイルコードベースの包括的な要約など、非常に長い文章の読み取りや生成を必要とするタスクに最適です。料金はプロバイダーのレートに従い、入力100万トークンあたり$1.40、出力100万トークンあたり$4.40で、OrcaRouterによるマークアップはありません。

このモデルは誰に向けて設計されていますか?

Z.ai: GLM 5.2は、1回のAPI呼び出しで非常に長いテキストシーケンスを処理する必要があるユーザーや組織を対象としています。主な利用者としては、契約書全体や証拠開示文書を分析する法律専門家、広範な文献を調査する研究者、大規模なコードリポジトリを理解するソフトウェアエンジニア、長いログファイルを扱うデータサイエンティストなどが挙げられます。豊富なコンテキストウィンドウにより、手動でのチャンキングの必要性が減り、高い出力制限によって詳細なレポートやコードパッチの生成がサポートされます。

主要な仕様は何ですか?

主要な仕様として、合計コンテキストウィンドウは1,000,000トークン(入力と出力を合わせたもの)で、最大出力は128,000トークンです。このモデルはテキスト入力のみをサポートし、マルチモーダル機能は謳われていません。OrcaRouterのOpenAI互換APIを介して、モデルID「z-ai/glm-5.2」、ベースURL https://api.orcarouter.ai/v1 でアクセスします。料金はトークンあたり、入力100万トークンにつき$1.40、出力100万トークンにつき$4.40で、Z.aiのプロバイダーレートで課金され、マークアップはゼロです。

コードサンプル

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

料金

入力 / 1M tokens$1.40
出力 / 1M tokens$4.40
キャッシュ読み取り / 1M$0.260
通貨USD

パフォーマンス

p50 TTFT
5.60 s
出力速度
96.0 tok/s
p95 TTFT
7.54 s
エラー率
0%

公開ベンチマーク

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
ソース: artificialanalysis.ai

よくある質問

GLM 5.2のトークンあたりのコストはいくらですか?
入力トークンは100万トークンあたり$1.40、出力トークンは100万トークンあたり$4.40です。OrcaRouterによるマークアップはなく、Z.aiのプロバイダー料金をお支払いいただきます。
モデルのコンテキストウィンドウサイズは何ですか?
コンテキストウィンドウは1,000,000トークン(入力と出力を合わせて)です。最大出力はリクエストあたり128,000トークンです。
モデルの強みは何ですか?
その主な強みは、大きなコンテキストウィンドウ(1Mトークン)と高い出力制限(128kトークン)であり、1回の呼び出しで非常に長いドキュメントや会話を処理できます。テキストのみ対応です。
GLM 5.2は、より小さいコンテキストウィンドウを持つ他のモデルとどのように比較されますか?
はるかに大きなコンテキストウィンドウを持つため、書籍全体や大規模なコードベースを読む必要があるタスクに適しています。小さなモデルは、そのコンテキスト制限内に収まるタスクに対しては、より安価で高速です。
OrcaRouterはトークンをキャッシュしたり、割引を提供したりしますか?
いいえ、OrcaRouterはこのモデルに対してトークンキャッシュやボリュームディスカウントを宣伝していません。料金はプロバイダーのレートに基づくトークン毎であり、マークアップはゼロです。
OrcaRouterを通じてGLM 5.2を呼び出すにはどうすればいいですか?
ベースURL https://api.orcarouter.ai/v1、モデルID “z-ai/glm-5.2” のOpenAI互換APIを使用してください。あなたのAPIキーを使って標準のチャット完了リクエストを送信してください。
モデルはどのような入力モダリティをサポートしていますか?
Z.ai: GLM 5.2はテキスト入力のみをサポートしています。画像、音声、その他のマルチモーダル処理はできません。
既知のベンチマークスコアはありますか?
入手可能な事実にはGLM 5.2のベンチマークスコアは記載されていません。ユーザーは自身のデータセットでモデルを評価してください。
出力をストリーミングできますか?
はい、API呼び出しで`stream: true`を設定してください。レスポンスはサーバー送信イベントとして送信され、OpenAIのストリーミング形式と同一です。
1Mトークンの制限を超えた場合はどうなりますか?
エラーが表示されます。メッセージ内のトークン数とmax_tokensの合計が1,000,000を超えないようにしてください。

このバッジを埋め込む

Z.ai: GLM 5.2$1.40/M in5596ms p50OrcaRouter 経由
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="OrcaRouter の Z.ai: GLM 5.2" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)