GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

新着注目

提供 Z.ai · text in · text out · 1M ctx · 2026-06-16

OrcaRouterのAPIを介してアクセスされる、長文テキスト処理向けの1Mトークンコンテキストウィンドウ。

エンドポイント:/v1/chat/completions

入力$1.40/ 100万 tokens

出力$4.40/ 100万 tokens

p50 TTFT5.60 s7日

p95 TTFT7.54 s7日

トラフィック8.0Mtokens / 7日

GLM 5.2 API を取得 →▶ Playground で試す </> API で使用

Z.ai: GLM 5.2とは何ですか？

Z.ai: GLM 5.2 は、100万トークンのコンテキストウィンドウと最大128,000トークンの出力を持つテキスト専用大規模言語モデルです。Z.ai によって開発され、OrcaRouter のAPIを通じて提供されています。このモデルはテキスト入力のみを処理するため、全書籍分析やマルチファイルコードベースの包括的な要約など、非常に長い文章の読み取りや生成を必要とするタスクに最適です。料金はプロバイダーのレートに従い、入力100万トークンあたり$1.40、出力100万トークンあたり$4.40で、OrcaRouterによるマークアップはありません。

このモデルは誰に向けて設計されていますか？

Z.ai: GLM 5.2は、1回のAPI呼び出しで非常に長いテキストシーケンスを処理する必要があるユーザーや組織を対象としています。主な利用者としては、契約書全体や証拠開示文書を分析する法律専門家、広範な文献を調査する研究者、大規模なコードリポジトリを理解するソフトウェアエンジニア、長いログファイルを扱うデータサイエンティストなどが挙げられます。豊富なコンテキストウィンドウにより、手動でのチャンキングの必要性が減り、高い出力制限によって詳細なレポートやコードパッチの生成がサポートされます。

主要な仕様は何ですか？

主要な仕様として、合計コンテキストウィンドウは1,000,000トークン（入力と出力を合わせたもの）で、最大出力は128,000トークンです。このモデルはテキスト入力のみをサポートし、マルチモーダル機能は謳われていません。OrcaRouterのOpenAI互換APIを介して、モデルID「z-ai/glm-5.2」、ベースURL https://api.orcarouter.ai/v1 でアクセスします。料金はトークンあたり、入力100万トークンにつき$1.40、出力100万トークンにつき$4.40で、Z.aiのプロバイダーレートで課金され、マークアップはゼロです。

コードサンプル

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

料金

入力 / 1M tokens	$1.40
出力 / 1M tokens	$4.40
キャッシュ読み取り / 1M	$0.260
通貨	USD

パフォーマンス

過去 7 日間

p50 TTFT

5.60 s

出力速度

96.0 tok/s

p95 TTFT

7.54 s

エラー率

公開ベンチマーク

最終評価 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

ソース: artificialanalysis.ai

Z.ai の他のモデル

z-ai のすべてのモデルを見る →

GLM 5.1フラッグシップ

z-ai/glm-5.1

入力 $1.40 · 出力 $4.40 / 100万

200K コンテキスト· 品質 9/10

GLM 5

z-ai/glm-5

入力 $1.00 · 出力 $3.20 / 100万

200K コンテキスト· 品質 8/10

GLM 4.5最安

z-ai/glm-4.5

入力 $0.60 · 出力 $2.20 / 100万

128K コンテキスト· 品質 7/10

よくある質問

GLM 5.2のトークンあたりのコストはいくらですか？

入力トークンは100万トークンあたり$1.40、出力トークンは100万トークンあたり$4.40です。OrcaRouterによるマークアップはなく、Z.aiのプロバイダー料金をお支払いいただきます。

モデルのコンテキストウィンドウサイズは何ですか？

コンテキストウィンドウは1,000,000トークン（入力と出力を合わせて）です。最大出力はリクエストあたり128,000トークンです。

モデルの強みは何ですか？

その主な強みは、大きなコンテキストウィンドウ（1Mトークン）と高い出力制限（128kトークン）であり、1回の呼び出しで非常に長いドキュメントや会話を処理できます。テキストのみ対応です。

GLM 5.2は、より小さいコンテキストウィンドウを持つ他のモデルとどのように比較されますか？

はるかに大きなコンテキストウィンドウを持つため、書籍全体や大規模なコードベースを読む必要があるタスクに適しています。小さなモデルは、そのコンテキスト制限内に収まるタスクに対しては、より安価で高速です。

OrcaRouterはトークンをキャッシュしたり、割引を提供したりしますか？

いいえ、OrcaRouterはこのモデルに対してトークンキャッシュやボリュームディスカウントを宣伝していません。料金はプロバイダーのレートに基づくトークン毎であり、マークアップはゼロです。

OrcaRouterを通じてGLM 5.2を呼び出すにはどうすればいいですか？

ベースURL https://api.orcarouter.ai/v1、モデルID “z-ai/glm-5.2” のOpenAI互換APIを使用してください。あなたのAPIキーを使って標準のチャット完了リクエストを送信してください。

モデルはどのような入力モダリティをサポートしていますか？

Z.ai: GLM 5.2はテキスト入力のみをサポートしています。画像、音声、その他のマルチモーダル処理はできません。

既知のベンチマークスコアはありますか？

入手可能な事実にはGLM 5.2のベンチマークスコアは記載されていません。ユーザーは自身のデータセットでモデルを評価してください。

出力をストリーミングできますか？

はい、API呼び出しで`stream: true`を設定してください。レスポンスはサーバー送信イベントとして送信され、OpenAIのストリーミング形式と同一です。

1Mトークンの制限を超えた場合はどうなりますか？

エラーが表示されます。メッセージ内のトークン数とmax_tokensの合計が1,000,000を超えないようにしてください。

このバッジを埋め込む

ブログ記事に貼り付け

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•OrcaRouter 経由

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="OrcaRouter の Z.ai: GLM 5.2" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Z.ai: GLM 5.2とは何ですか？

このモデルは誰に向けて設計されていますか？

主要な仕様は何ですか？

GLM 5.2はどのような主要なタスクを実行できますか？

このモデルをより小さいモデルよりも使用すべきなのはどのような場合ですか？

モデルの限界は何ですか？

大きなコンテキストウィンドウはパフォーマンスにどのような影響を与えるのか？

モデルの報告されたベンチマークスコアは何ですか？

小規模モデルと比較した場合、レイテンシはどうですか？

モデルの既知の強みは何ですか？

GLM 5.2の価格はいくらですか？

割引や数量割引はありますか？

より小さなモデルと比較して、コストはどうですか？

OrcaRouterを介してGLM 5.2を呼び出すにはどうすればよいですか？

どのパラメータがサポートされていますか？

レスポンスをストリーミングできますか？

別のプロバイダーから移行するにはどうすればよいですか？

GLM 5.2 は他の大規模コンテキストモデルと比較してどうですか？

GLM 5.2をより安いモデルよりも選ぶべきなのはどのような場合ですか？

コンテキストが小さいが、品質が似ているモデルはどうですか？