GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

NovoDestaque

por Z.ai · text in · text out · 1M ctx · 2026-06-16

Janela de contexto de 1M tokens para processamento de texto longo, acessada via API do OrcaRouter.

Endpoints:/v1/chat/completions

ENTRADA$1.40/ 1M tokens

SAÍDA$4.40/ 1M tokens

p50 TTFT5.60 s7 d

p95 TTFT7.54 s7 d

TRÁFEGO8.0Mtokens / 7 d

Obter a API GLM 5.2 →▶ Testar no Playground </> Usar via API

O que é Z.ai: GLM 5.2?

Z.ai: GLM 5.2 é um modelo de linguagem grande apenas para texto, com uma janela de contexto de 1.000.000 de tokens e uma saída máxima de 128.000 tokens. Ele é desenvolvido pela Z.ai e oferecido através da API da OrcaRouter. O modelo processa apenas entradas de texto, tornando‑o ideal para tarefas que exigem leitura e geração de passagens muito longas, como análise de livros completos ou sumarização abrangente de bases de código com vários arquivos. O preço segue a taxa do provedor: $1,40 por milhão de tokens de entrada e $4,40 por milhão de tokens de saída, sem margem de lucro da OrcaRouter.

Para quem este modelo foi projetado?

Z.ai: GLM 5.2 tem como alvo usuários e organizações que precisam lidar com sequências de texto extremamente longas em uma única chamada de API. Os papéis comuns incluem profissionais jurídicos analisando contratos inteiros ou documentos de descoberta, pesquisadores revisando literatura extensa, engenheiros de software compreendendo grandes repositórios de código e cientistas de dados trabalhando com longos arquivos de log. A generosa janela de contexto reduz a necessidade de fragmentação manual, enquanto o alto limite de saída suporta a geração de relatórios detalhados ou patches de código.

Quais são as principais especificações?

As principais especificações incluem uma janela de contexto total de 1.000.000 tokens (combinação de entrada e saída), com uma saída máxima de 128.000 tokens. O modelo suporta apenas entrada de texto; nenhuma capacidade multimodal é divulgada. Ele é acessado através da API compatível com OpenAI da OrcaRouter, usando o ID do modelo “z-ai/glm-5.2” na URL base https://api.orcarouter.ai/v1. O preço é por token: $1,40 por milhão de tokens de entrada e $4,40 por milhão de tokens de saída, faturados à taxa do provedor da Z.ai com markup zero.

Exemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preços

Entrada / 1M tokens	$1.40
Saída / 1M tokens	$4.40
Leitura de cache / 1M	$0.260
Moeda	USD

Desempenho

últimos 7 dias

p50 TTFT

5.60 s

Velocidade de saída

96.0 tok/s

p95 TTFT

7.54 s

Taxa de erro

Benchmarks públicos

Última avaliação 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

Fonte: artificialanalysis.ai

Mais de Z.ai

Ver todos os modelos de z-ai →

GLM 5.1Carro-chefe

z-ai/glm-5.1

$1.40 entrada · $4.40 saída / 1M

200K ctx· qualidade 9/10

GLM 5

z-ai/glm-5

$1.00 entrada · $3.20 saída / 1M

200K ctx· qualidade 8/10

GLM 4.5Mais barato

z-ai/glm-4.5

$0.60 entrada · $2.20 saída / 1M

128K ctx· qualidade 7/10

FAQ

Qual é o custo por token para o GLM 5.2?

Os tokens de entrada custam $1,40 por milhão de tokens, e os tokens de saída custam $4,40 por milhão de tokens. Não há margem da OrcaRouter; você paga a taxa do provedor da Z.ai.

Qual é o tamanho da janela de contexto do modelo?

A janela de contexto é de 1.000.000 tokens (entrada e saída combinadas). A saída máxima é de 128.000 tokens por solicitação.

Quais são os pontos fortes do modelo?

Sua principal força é a grande janela de contexto (1M tokens) e o alto limite de saída (128k tokens), permitindo processar documentos ou conversas muito longos em uma única chamada. É apenas texto.

Como o GLM 5.2 se compara a outros modelos com janelas de contexto menores?

Ele possui uma janela de contexto muito maior, tornando-o adequado para tarefas que exigem a leitura de livros inteiros ou grandes bases de código. Modelos menores são mais baratos e rápidos para tarefas que se encaixam dentro dos limites de seu contexto.

O OrcaRouter armazena tokens em cache ou oferece descontos?

Não, o OrcaRouter não anuncia cache de tokens ou descontos por volume para este modelo. O preço é por token, à taxa do provedor, com margem zero.

Como faço para chamar o GLM 5.2 através do OrcaRouter?

Use a API compatível com OpenAI no URL base https://api.orcarouter.ai/v1, ID do modelo “z-ai/glm-5.2”. Envie uma solicitação de conclusão de chat padrão com sua chave de API.

Quais modalidades de entrada o modelo suporta?

Z.ai: GLM 5.2 suporta apenas entrada de texto. Não pode processar imagens, áudio ou outras multimodalidades.

Há pontuações de benchmark conhecidas?

Não são fornecidas pontuações de benchmark para o GLM 5.2 nos fatos disponíveis. Os usuários devem avaliar o modelo em seus próprios conjuntos de dados.

Posso transmitir a saída?

Sim, defina `stream: true` em sua chamada de API. A resposta será enviada como eventos enviados pelo servidor, idênticos ao formato de streaming da OpenAI.

O que acontece se eu exceder o limite de 1M tokens?

Você receberá um erro. Garanta que o número total de tokens em suas mensagens mais max_tokens não exceda 1,000,000.

Incorporar este selo

Cole no seu post do blog

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•via OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 no OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

O que é Z.ai: GLM 5.2?

Para quem este modelo foi projetado?

Quais são as principais especificações?

Quais tarefas principais o GLM 5.2 pode realizar?

Quando você deve usar este modelo em vez de um menor?

Quais são as limitações do modelo?

Como a grande janela de contexto afeta o desempenho?

Quais são as pontuações de benchmark relatadas pelo modelo?

Como a latência se compara com modelos menores?

Quais são os pontos fortes conhecidos do modelo?

Qual é o preço do GLM 5.2?

Existem descontos ou preços especiais para grandes volumes?

Como o custo se compara com modelos menores?

Como faço para chamar o GLM 5.2 via OrcaRouter?

Quais parâmetros são suportados?

Posso transmitir respostas em streaming?

Como faço para migrar de um provedor diferente?

Como o GLM 5.2 se compara a outros modelos com grande contexto?

Quando devo escolher o GLM 5.2 em vez de um modelo mais barato?

E quanto a modelos com contexto menor, mas qualidade semelhante?