GLM 5.2

z-ai/glm-5.2
NuovoIn evidenza
di Z.ai · text in · text out · 1M ctx · 2026-06-16

1M token context window for long-form text processing, accessed via OrcaRouter's API.

INGRESSO$1.40/ 1M token
USCITA$4.40/ 1M token
p50 TTFT5.60 s7 g
p95 TTFT7.54 s7 g
TRAFFICO8.0Mtoken / 7 g

Cos'è Z.ai: GLM 5.2?

Z.ai: GLM 5.2 è un modello linguistico di grandi dimensioni solo testo con una finestra di contesto di 1.000.000 di token e un output massimo di 128.000 token. È sviluppato da Z.ai e offerto tramite l'API di OrcaRouter. Il modello elabora solo input testuali, rendendolo ideale per attività che richiedono la lettura e la generazione di passaggi molto lunghi, come l'analisi di libri interi o la sintesi completa di codebase multifile. Il prezzo segue la tariffa del fornitore: $1,40 per milione di token in input e $4,40 per milione di token in output, senza markup da parte di OrcaRouter.

A chi è pensato questo modello?

Z.ai: GLM 5.2 si rivolge a utenti e organizzazioni che devono gestire sequenze di testo estremamente lunghe in una singola chiamata API. I ruoli comuni includono professionisti legali che analizzano interi contratti o documenti di scoperta, ricercatori che esaminano una vasta letteratura, ingegneri del software che comprendono ampi repository di codice e data scientist che lavorano con lunghi file di log. L'ampia finestra di contesto riduce la necessità di suddividere manualmente il testo, mentre l'elevato limite di output supporta la generazione di report dettagliati o patch di codice.

Quali sono le specifiche chiave?

Le specifiche principali includono una finestra di contesto totale di 1,000,000 di token (input e output combinati), con un output massimo di 128,000 token. Il modello supporta solo input di testo; non vengono pubblicizzate funzionalità multimodali. È accessibile tramite l'API compatibile con OpenAI di OrcaRouter utilizzando l'ID modello “z-ai/glm-5.2” all'URL di base https://api.orcarouter.ai/v1. Il prezzo è per token: $1,40 per milione di token in input e $4,40 per milione di token in output, fatturato alla tariffa del provider Z.ai con zero margine.

Esempi di codice

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prezzi

Input / 1M token$1.40
Output / 1M token$4.40
Lettura cache / 1M$0.260
ValutaUSD

Prestazioni

p50 TTFT
5.60 s
Velocità di output
96.0 tok/s
p95 TTFT
7.54 s
Tasso di errore
0%

Benchmark pubblici

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
Fonte: artificialanalysis.ai

FAQ

Qual è il costo per token di GLM 5.2?
I token di input costano $1,40 per milione di token, e i token di output costano $4,40 per milione di token. Non c'è ricarico da parte di OrcaRouter; paghi la tariffa del fornitore di Z.ai.
Qual è la dimensione della finestra di contesto del modello?
La finestra di contesto è di 1,000,000 token (input e output combinati). L'output massimo è di 128,000 token per richiesta.
Quali sono i punti di forza del modello?
Il suo punto di forza principale è l'ampia finestra di contesto (1M token) e l'elevato limite di output (128k token), consentendo l'elaborazione di documenti o conversazioni molto lunghi in una singola chiamata. È solo testo.
Come si confronta GLM 5.2 con altri modelli con finestre di contesto più piccole?
Ha una finestra di contesto molto più ampia, rendendolo adatto per compiti che richiedono la lettura di interi libri o grandi codebase. I modelli più piccoli sono più economici e veloci per compiti che rientrano nei loro limiti di contesto.
OrcaRouter mette in cache i token o offre sconti?
No, OrcaRouter non pubblicizza token caching o sconti quantità per questo modello. Il prezzo è per token al tasso del fornitore con margine zero.
Come faccio a chiamare GLM 5.2 tramite OrcaRouter?
Utilizza l'API compatibile con OpenAI all'URL di base https://api.orcarouter.ai/v1, ID modello “z-ai/glm-5.2”. Invia una richiesta di chat completion standard con la tua chiave API.
Quali modalità di input supporta il modello?
Z.ai: GLM 5.2 supporta solo input di testo. Non può elaborare immagini, audio o altre multimodalità.
Ci sono punteggi di benchmark noti?
Non vengono forniti punteggi di benchmark per GLM 5.2 nei fatti disponibili. Gli utenti dovrebbero valutare il modello sui propri dataset.
Posso trasmettere l'output in streaming?
Sì, imposta `stream: true` nella tua chiamata API. La risposta verrà inviata come eventi inviati dal server, identica al formato di streaming di OpenAI.
Cosa succede se supero il limite di 1M token?
Riceverai un errore. Assicurati che il numero totale di token nei tuoi messaggi più max_tokens non superi 1.000.000.

Incorpora questo badge

Z.ai: GLM 5.2$1.40/M in5596ms p50tramite OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 su OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)