GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

NeuEmpfohlen

von Z.ai · text in · text out · 1M ctx · 2026-06-16

Ein 1M Token-Kontextfenster für die Verarbeitung langer Texte, zugänglich über die API von OrcaRoute…

Endpunkte:/v1/chat/completions

EINGABE$1.40/ 1M Tokens

AUSGABE$4.40/ 1M Tokens

p50 TTFT5.60 s7 T

p95 TTFT7.54 s7 T

DATENVERKEHR8.0MTokens / 7 T

GLM 5.2 API holen →▶ Im Playground testen </> Über API nutzen

Was ist Z.ai: GLM 5.2?

Z.ai: GLM 5.2 ist ein reines Text-Großsprachmodell mit einem Kontextfenster von 1.000.000 Tokens und einer maximalen Ausgabe von 128.000 Tokens. Es wurde von Z.ai entwickelt und wird über die API von OrcaRouter angeboten. Das Modell verarbeitet nur Texteingaben, was es ideal für Aufgaben macht, die das Lesen und Generieren sehr langer Passagen erfordern, wie z. B. die Analyse kompletter Bücher oder die umfassende Zusammenfassung von Codebasen mit mehreren Dateien. Die Preisgestaltung folgt dem Tarif des Anbieters: 1,40 $ pro Million Eingabe-Tokens und 4,40 $ pro Million Ausgabe-Tokens, ohne Aufschlag von OrcaRouter.

Für wen ist dieses Modell gedacht?

Z.ai: GLM 5.2 richtet sich an Benutzer und Organisationen, die extrem lange Textsequenzen in einem einzigen API-Aufruf verarbeiten müssen. Zu den typischen Rollen gehören Juristen, die ganze Verträge oder Entdeckungsdokumente analysieren, Forscher, die umfangreiche Literatur sichten, Softwareentwickler, die große Code-Repositories verstehen, und Datenwissenschaftler, die mit langen Protokolldateien arbeiten. Das großzügige Kontextfenster reduziert die Notwendigkeit manuellen Aufteilens, während das hohe Ausgabelimit die Erstellung detaillierter Berichte oder Code-Patches unterstützt.

Was sind die wichtigsten Spezifikationen?

Zu den wichtigsten technischen Daten gehört ein gesamter Kontextfenster von 1.000.000 Tokens (Eingabe und Ausgabe zusammen), mit einer maximalen Ausgabe von 128.000 Tokens. Das Modell unterstützt nur Texteingabe; es werden keine multimodalen Fähigkeiten angegeben. Es wird über die OpenAI-kompatible API von OrcaRouter mit der Modell-ID „z-ai/glm-5.2“ unter der Basis-URL https://api.orcarouter.ai/v1 abgerufen. Die Preisgestaltung erfolgt pro Token: 1,40 $ pro Million Eingabe-Tokens und 4,40 $ pro Million Ausgabe-Tokens, abgerechnet zum Anbieterpreis von Z.ai ohne Aufschlag.

Code-Beispiele

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preise

Eingabe / 1M Tokens	$1.40
Ausgabe / 1M Tokens	$4.40
Cache-Lesen / 1M	$0.260
Währung	USD

Leistung

letzte 7 Tage

p50 TTFT

5.60 s

Ausgabegeschwindigkeit

96.0 tok/s

p95 TTFT

7.54 s

Fehlerquote

Öffentliche Benchmarks

Zuletzt bewertet 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

Quelle: artificialanalysis.ai

Weitere von Z.ai

Alle Modelle von z-ai ansehen →

GLM 5.1Flaggschiff

z-ai/glm-5.1

$1.40 Eingabe · $4.40 Ausgabe / 1M

200K Ktx· Qualität 9/10

GLM 5

z-ai/glm-5

$1.00 Eingabe · $3.20 Ausgabe / 1M

200K Ktx· Qualität 8/10

GLM 4.5Günstigste

z-ai/glm-4.5

$0.60 Eingabe · $2.20 Ausgabe / 1M

128K Ktx· Qualität 7/10

FAQ

Was sind die Kosten pro Token für GLM 5.2?

Eingabetoken kosten 1,40 $ pro Million Token, und Ausgabetoken kosten 4,40 $ pro Million Token. Es gibt keinen Aufschlag durch OrcaRouter; Sie zahlen den Tarif des Anbieters von Z.ai.

Wie groß ist das Kontextfenster des Modells?

Das Kontextfenster beträgt 1,000,000 Token (kombiniert aus Eingabe und Ausgabe). Die maximale Ausgabe beträgt 128,000 Token pro Anfrage.

Was sind die Stärken des Modells?

Seine Hauptstärke ist das große Kontextfenster (1M Tokens) und das hohe Ausgabelimit (128k Tokens), was die Verarbeitung sehr langer Dokumente oder Gespräche in einem einzigen Aufruf ermöglicht. Es ist textbasiert.

Wie schneidet GLM 5.2 im Vergleich zu anderen Modellen mit kleineren Kontextfenstern ab?

Es hat ein viel größeres Kontextfenster, was es geeignet macht für Aufgaben, die das Lesen ganzer Bücher oder großer Codebasen erfordern. Kleinere Modelle sind günstiger und schneller für Aufgaben, die in ihre Kontextgrenzen passen.

Speichert OrcaRouter Tokens zwischen oder bietet Rabatte an?

Nein, OrcaRouter bewirbt für dieses Modell weder Token-Caching noch Mengenrabatte. Die Preisgestaltung erfolgt pro Token zum Tarif des Anbieters ohne Aufschlag.

Wie rufe ich GLM 5.2 über OrcaRouter auf?

Verwenden Sie die OpenAI-kompatible API unter der Basis-URL https://api.orcarouter.ai/v1, Modell-ID „z-ai/glm-5.2“. Senden Sie eine Standard-Chat-Completion-Anfrage mit Ihrem API-Schlüssel.

Welche Eingabemodalitäten unterstützt das Modell?

Z.ai: GLM 5.2 unterstützt nur Texteingabe. Es kann keine Bilder, Audio oder andere Multimodalitäten verarbeiten.

Gibt es bekannte Benchmark-Ergebnisse?

In den verfügbaren Fakten werden keine Benchmark-Ergebnisse für GLM 5.2 bereitgestellt. Benutzer sollten das Modell anhand ihrer eigenen Datensätze bewerten.

Kann ich die Ausgabe streamen?

Ja, setzen Sie `stream: true` in Ihrem API-Aufruf. Die Antwort wird als Server‑sent Events gesendet, identisch zum Streaming-Format von OpenAI.

Was passiert, wenn ich das 1M-Token-Limit überschreite?

Sie erhalten einen Fehler. Stellen Sie sicher, dass die Gesamtzahl der Token in Ihren Nachrichten plus max_tokens 1.000.000 nicht überschreitet.

Dieses Abzeichen einbetten

In Blogartikel einfügen

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•via OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 auf OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Was ist Z.ai: GLM 5.2?

Für wen ist dieses Modell gedacht?

Was sind die wichtigsten Spezifikationen?

Welche Kernaufgaben kann GLM 5.2 ausführen?

Wann sollten Sie dieses Modell einem kleineren vorziehen?

Was sind die Einschränkungen des Modells?

Wie beeinflusst das große Kontextfenster die Leistung?

Was sind die gemeldeten Benchmark-Ergebnisse des Modells?

Wie verhält sich die Latenz im Vergleich zu kleineren Modellen?

Was sind die bekannten Stärken des Modells?

Wie wird GLM 5.2 bepreist?

Gibt es Rabatte oder Staffelpreise?

Wie verhalten sich die Kosten im Vergleich zu kleineren Modellen?

Wie rufe ich GLM 5.2 über OrcaRouter auf?

Welche Parameter werden unterstützt?

Kann ich Antworten streamen?

Wie migriere ich von einem anderen Anbieter?

Wie schneidet GLM 5.2 im Vergleich zu anderen Large-Context-Modellen ab?

Wann sollte ich GLM 5.2 einem günstigeren Modell vorziehen?

Was ist mit Modellen mit kleinerem Kontext, aber ähnlicher Qualität?