GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

NuovoIn evidenza

di Z.ai · text in · text out · 1M ctx · 2026-06-16

1M token context window for long-form text processing, accessed via OrcaRouter's API.

Endpoint:/v1/chat/completions

INGRESSO$1.40/ 1M token

USCITA$4.40/ 1M token

p50 TTFT5.60 s7 g

p95 TTFT7.54 s7 g

TRAFFICO8.0Mtoken / 7 g

Ottieni l'API GLM 5.2 →▶ Prova nel Playground </> Usa tramite API

Cos'è Z.ai: GLM 5.2?

Z.ai: GLM 5.2 è un modello linguistico di grandi dimensioni solo testo con una finestra di contesto di 1.000.000 di token e un output massimo di 128.000 token. È sviluppato da Z.ai e offerto tramite l'API di OrcaRouter. Il modello elabora solo input testuali, rendendolo ideale per attività che richiedono la lettura e la generazione di passaggi molto lunghi, come l'analisi di libri interi o la sintesi completa di codebase multifile. Il prezzo segue la tariffa del fornitore: $1,40 per milione di token in input e $4,40 per milione di token in output, senza markup da parte di OrcaRouter.

A chi è pensato questo modello?

Z.ai: GLM 5.2 si rivolge a utenti e organizzazioni che devono gestire sequenze di testo estremamente lunghe in una singola chiamata API. I ruoli comuni includono professionisti legali che analizzano interi contratti o documenti di scoperta, ricercatori che esaminano una vasta letteratura, ingegneri del software che comprendono ampi repository di codice e data scientist che lavorano con lunghi file di log. L'ampia finestra di contesto riduce la necessità di suddividere manualmente il testo, mentre l'elevato limite di output supporta la generazione di report dettagliati o patch di codice.

Quali sono le specifiche chiave?

Le specifiche principali includono una finestra di contesto totale di 1,000,000 di token (input e output combinati), con un output massimo di 128,000 token. Il modello supporta solo input di testo; non vengono pubblicizzate funzionalità multimodali. È accessibile tramite l'API compatibile con OpenAI di OrcaRouter utilizzando l'ID modello “z-ai/glm-5.2” all'URL di base https://api.orcarouter.ai/v1. Il prezzo è per token: $1,40 per milione di token in input e $4,40 per milione di token in output, fatturato alla tariffa del provider Z.ai con zero margine.

Esempi di codice

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prezzi

Input / 1M token	$1.40
Output / 1M token	$4.40
Lettura cache / 1M	$0.260
Valuta	USD

Prestazioni

ultimi 7 giorni

p50 TTFT

5.60 s

Velocità di output

96.0 tok/s

p95 TTFT

7.54 s

Tasso di errore

Benchmark pubblici

Ultima valutazione 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

Fonte: artificialanalysis.ai

Altri da Z.ai

Vedi tutti i modelli di z-ai →

GLM 5.1Ammiraglia

z-ai/glm-5.1

$1.40 ingresso · $4.40 uscita / 1M

200K ctx· qualità 9/10

GLM 5

z-ai/glm-5

$1.00 ingresso · $3.20 uscita / 1M

200K ctx· qualità 8/10

GLM 4.5Il più economico

z-ai/glm-4.5

$0.60 ingresso · $2.20 uscita / 1M

128K ctx· qualità 7/10

FAQ

Qual è il costo per token di GLM 5.2?

I token di input costano $1,40 per milione di token, e i token di output costano $4,40 per milione di token. Non c'è ricarico da parte di OrcaRouter; paghi la tariffa del fornitore di Z.ai.

Qual è la dimensione della finestra di contesto del modello?

La finestra di contesto è di 1,000,000 token (input e output combinati). L'output massimo è di 128,000 token per richiesta.

Quali sono i punti di forza del modello?

Il suo punto di forza principale è l'ampia finestra di contesto (1M token) e l'elevato limite di output (128k token), consentendo l'elaborazione di documenti o conversazioni molto lunghi in una singola chiamata. È solo testo.

Come si confronta GLM 5.2 con altri modelli con finestre di contesto più piccole?

Ha una finestra di contesto molto più ampia, rendendolo adatto per compiti che richiedono la lettura di interi libri o grandi codebase. I modelli più piccoli sono più economici e veloci per compiti che rientrano nei loro limiti di contesto.

OrcaRouter mette in cache i token o offre sconti?

No, OrcaRouter non pubblicizza token caching o sconti quantità per questo modello. Il prezzo è per token al tasso del fornitore con margine zero.

Come faccio a chiamare GLM 5.2 tramite OrcaRouter?

Utilizza l'API compatibile con OpenAI all'URL di base https://api.orcarouter.ai/v1, ID modello “z-ai/glm-5.2”. Invia una richiesta di chat completion standard con la tua chiave API.

Quali modalità di input supporta il modello?

Z.ai: GLM 5.2 supporta solo input di testo. Non può elaborare immagini, audio o altre multimodalità.

Ci sono punteggi di benchmark noti?

Non vengono forniti punteggi di benchmark per GLM 5.2 nei fatti disponibili. Gli utenti dovrebbero valutare il modello sui propri dataset.

Posso trasmettere l'output in streaming?

Sì, imposta `stream: true` nella tua chiamata API. La risposta verrà inviata come eventi inviati dal server, identica al formato di streaming di OpenAI.

Cosa succede se supero il limite di 1M token?

Riceverai un errore. Assicurati che il numero totale di token nei tuoi messaggi più max_tokens non superi 1.000.000.

Incorpora questo badge

Incolla nel tuo post del blog

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•tramite OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 su OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Cos'è Z.ai: GLM 5.2?

A chi è pensato questo modello?

Quali sono le specifiche chiave?

Quali compiti principali può svolgere GLM 5.2?

Quando dovresti usare questo modello rispetto a uno più piccolo?

Quali sono i limiti del modello?

Come la grande finestra di contesto influisce sulle prestazioni?

Quali sono i punteggi di benchmark riportati del modello?

Come si confronta la latenza con i modelli più piccoli?

Quali sono i punti di forza noti del modello?

Come viene prezzato GLM 5.2?

Ci sono sconti o prezzi per quantità?

Come si confronta il costo con i modelli più piccoli?

Come faccio a chiamare GLM 5.2 tramite OrcaRouter?

Quali parametri sono supportati?

Posso ricevere le risposte in streaming?

Come posso migrare da un altro provider?

Come si confronta GLM 5.2 con altri modelli a contesto ampio?

Quando dovrei scegliere GLM 5.2 rispetto a un modello più economico?

Che dire dei modelli con un contesto più piccolo ma di qualità simile?