GLM 5.2

z-ai/glm-5.2
NeuEmpfohlen
von Z.ai · text in · text out · 1M ctx · 2026-06-16

Ein 1M Token-Kontextfenster für die Verarbeitung langer Texte, zugänglich über die API von OrcaRoute…

EINGABE$1.40/ 1M Tokens
AUSGABE$4.40/ 1M Tokens
p50 TTFT5.60 s7 T
p95 TTFT7.54 s7 T
DATENVERKEHR8.0MTokens / 7 T

Was ist Z.ai: GLM 5.2?

Z.ai: GLM 5.2 ist ein reines Text-Großsprachmodell mit einem Kontextfenster von 1.000.000 Tokens und einer maximalen Ausgabe von 128.000 Tokens. Es wurde von Z.ai entwickelt und wird über die API von OrcaRouter angeboten. Das Modell verarbeitet nur Texteingaben, was es ideal für Aufgaben macht, die das Lesen und Generieren sehr langer Passagen erfordern, wie z. B. die Analyse kompletter Bücher oder die umfassende Zusammenfassung von Codebasen mit mehreren Dateien. Die Preisgestaltung folgt dem Tarif des Anbieters: 1,40 $ pro Million Eingabe-Tokens und 4,40 $ pro Million Ausgabe-Tokens, ohne Aufschlag von OrcaRouter.

Für wen ist dieses Modell gedacht?

Z.ai: GLM 5.2 richtet sich an Benutzer und Organisationen, die extrem lange Textsequenzen in einem einzigen API-Aufruf verarbeiten müssen. Zu den typischen Rollen gehören Juristen, die ganze Verträge oder Entdeckungsdokumente analysieren, Forscher, die umfangreiche Literatur sichten, Softwareentwickler, die große Code-Repositories verstehen, und Datenwissenschaftler, die mit langen Protokolldateien arbeiten. Das großzügige Kontextfenster reduziert die Notwendigkeit manuellen Aufteilens, während das hohe Ausgabelimit die Erstellung detaillierter Berichte oder Code-Patches unterstützt.

Was sind die wichtigsten Spezifikationen?

Zu den wichtigsten technischen Daten gehört ein gesamter Kontextfenster von 1.000.000 Tokens (Eingabe und Ausgabe zusammen), mit einer maximalen Ausgabe von 128.000 Tokens. Das Modell unterstützt nur Texteingabe; es werden keine multimodalen Fähigkeiten angegeben. Es wird über die OpenAI-kompatible API von OrcaRouter mit der Modell-ID „z-ai/glm-5.2“ unter der Basis-URL https://api.orcarouter.ai/v1 abgerufen. Die Preisgestaltung erfolgt pro Token: 1,40 $ pro Million Eingabe-Tokens und 4,40 $ pro Million Ausgabe-Tokens, abgerechnet zum Anbieterpreis von Z.ai ohne Aufschlag.

Code-Beispiele

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preise

Eingabe / 1M Tokens$1.40
Ausgabe / 1M Tokens$4.40
Cache-Lesen / 1M$0.260
WährungUSD

Leistung

p50 TTFT
5.60 s
Ausgabegeschwindigkeit
96.0 tok/s
p95 TTFT
7.54 s
Fehlerquote
0%

Öffentliche Benchmarks

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
Quelle: artificialanalysis.ai

FAQ

Was sind die Kosten pro Token für GLM 5.2?
Eingabetoken kosten 1,40 $ pro Million Token, und Ausgabetoken kosten 4,40 $ pro Million Token. Es gibt keinen Aufschlag durch OrcaRouter; Sie zahlen den Tarif des Anbieters von Z.ai.
Wie groß ist das Kontextfenster des Modells?
Das Kontextfenster beträgt 1,000,000 Token (kombiniert aus Eingabe und Ausgabe). Die maximale Ausgabe beträgt 128,000 Token pro Anfrage.
Was sind die Stärken des Modells?
Seine Hauptstärke ist das große Kontextfenster (1M Tokens) und das hohe Ausgabelimit (128k Tokens), was die Verarbeitung sehr langer Dokumente oder Gespräche in einem einzigen Aufruf ermöglicht. Es ist textbasiert.
Wie schneidet GLM 5.2 im Vergleich zu anderen Modellen mit kleineren Kontextfenstern ab?
Es hat ein viel größeres Kontextfenster, was es geeignet macht für Aufgaben, die das Lesen ganzer Bücher oder großer Codebasen erfordern. Kleinere Modelle sind günstiger und schneller für Aufgaben, die in ihre Kontextgrenzen passen.
Speichert OrcaRouter Tokens zwischen oder bietet Rabatte an?
Nein, OrcaRouter bewirbt für dieses Modell weder Token-Caching noch Mengenrabatte. Die Preisgestaltung erfolgt pro Token zum Tarif des Anbieters ohne Aufschlag.
Wie rufe ich GLM 5.2 über OrcaRouter auf?
Verwenden Sie die OpenAI-kompatible API unter der Basis-URL https://api.orcarouter.ai/v1, Modell-ID „z-ai/glm-5.2“. Senden Sie eine Standard-Chat-Completion-Anfrage mit Ihrem API-Schlüssel.
Welche Eingabemodalitäten unterstützt das Modell?
Z.ai: GLM 5.2 unterstützt nur Texteingabe. Es kann keine Bilder, Audio oder andere Multimodalitäten verarbeiten.
Gibt es bekannte Benchmark-Ergebnisse?
In den verfügbaren Fakten werden keine Benchmark-Ergebnisse für GLM 5.2 bereitgestellt. Benutzer sollten das Modell anhand ihrer eigenen Datensätze bewerten.
Kann ich die Ausgabe streamen?
Ja, setzen Sie `stream: true` in Ihrem API-Aufruf. Die Antwort wird als Server‑sent Events gesendet, identisch zum Streaming-Format von OpenAI.
Was passiert, wenn ich das 1M-Token-Limit überschreite?
Sie erhalten einen Fehler. Stellen Sie sicher, dass die Gesamtzahl der Token in Ihren Nachrichten plus max_tokens 1.000.000 nicht überschreitet.

Dieses Abzeichen einbetten

Z.ai: GLM 5.2$1.40/M in5596ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 auf OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)