GLM 5.2

z-ai/glm-5.2
NovoDestaque
por Z.ai · text in · text out · 1M ctx · 2026-06-16

Janela de contexto de 1M tokens para processamento de texto longo, acessada via API do OrcaRouter.

ENTRADA$1.40/ 1M tokens
SAÍDA$4.40/ 1M tokens
p50 TTFT5.60 s7 d
p95 TTFT7.54 s7 d
TRÁFEGO8.0Mtokens / 7 d

O que é Z.ai: GLM 5.2?

Z.ai: GLM 5.2 é um modelo de linguagem grande apenas para texto, com uma janela de contexto de 1.000.000 de tokens e uma saída máxima de 128.000 tokens. Ele é desenvolvido pela Z.ai e oferecido através da API da OrcaRouter. O modelo processa apenas entradas de texto, tornando‑o ideal para tarefas que exigem leitura e geração de passagens muito longas, como análise de livros completos ou sumarização abrangente de bases de código com vários arquivos. O preço segue a taxa do provedor: $1,40 por milhão de tokens de entrada e $4,40 por milhão de tokens de saída, sem margem de lucro da OrcaRouter.

Para quem este modelo foi projetado?

Z.ai: GLM 5.2 tem como alvo usuários e organizações que precisam lidar com sequências de texto extremamente longas em uma única chamada de API. Os papéis comuns incluem profissionais jurídicos analisando contratos inteiros ou documentos de descoberta, pesquisadores revisando literatura extensa, engenheiros de software compreendendo grandes repositórios de código e cientistas de dados trabalhando com longos arquivos de log. A generosa janela de contexto reduz a necessidade de fragmentação manual, enquanto o alto limite de saída suporta a geração de relatórios detalhados ou patches de código.

Quais são as principais especificações?

As principais especificações incluem uma janela de contexto total de 1.000.000 tokens (combinação de entrada e saída), com uma saída máxima de 128.000 tokens. O modelo suporta apenas entrada de texto; nenhuma capacidade multimodal é divulgada. Ele é acessado através da API compatível com OpenAI da OrcaRouter, usando o ID do modelo “z-ai/glm-5.2” na URL base https://api.orcarouter.ai/v1. O preço é por token: $1,40 por milhão de tokens de entrada e $4,40 por milhão de tokens de saída, faturados à taxa do provedor da Z.ai com markup zero.

Exemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preços

Entrada / 1M tokens$1.40
Saída / 1M tokens$4.40
Leitura de cache / 1M$0.260
MoedaUSD

Desempenho

p50 TTFT
5.60 s
Velocidade de saída
96.0 tok/s
p95 TTFT
7.54 s
Taxa de erro
0%

Benchmarks públicos

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
Fonte: artificialanalysis.ai

FAQ

Qual é o custo por token para o GLM 5.2?
Os tokens de entrada custam $1,40 por milhão de tokens, e os tokens de saída custam $4,40 por milhão de tokens. Não há margem da OrcaRouter; você paga a taxa do provedor da Z.ai.
Qual é o tamanho da janela de contexto do modelo?
A janela de contexto é de 1.000.000 tokens (entrada e saída combinadas). A saída máxima é de 128.000 tokens por solicitação.
Quais são os pontos fortes do modelo?
Sua principal força é a grande janela de contexto (1M tokens) e o alto limite de saída (128k tokens), permitindo processar documentos ou conversas muito longos em uma única chamada. É apenas texto.
Como o GLM 5.2 se compara a outros modelos com janelas de contexto menores?
Ele possui uma janela de contexto muito maior, tornando-o adequado para tarefas que exigem a leitura de livros inteiros ou grandes bases de código. Modelos menores são mais baratos e rápidos para tarefas que se encaixam dentro dos limites de seu contexto.
O OrcaRouter armazena tokens em cache ou oferece descontos?
Não, o OrcaRouter não anuncia cache de tokens ou descontos por volume para este modelo. O preço é por token, à taxa do provedor, com margem zero.
Como faço para chamar o GLM 5.2 através do OrcaRouter?
Use a API compatível com OpenAI no URL base https://api.orcarouter.ai/v1, ID do modelo “z-ai/glm-5.2”. Envie uma solicitação de conclusão de chat padrão com sua chave de API.
Quais modalidades de entrada o modelo suporta?
Z.ai: GLM 5.2 suporta apenas entrada de texto. Não pode processar imagens, áudio ou outras multimodalidades.
Há pontuações de benchmark conhecidas?
Não são fornecidas pontuações de benchmark para o GLM 5.2 nos fatos disponíveis. Os usuários devem avaliar o modelo em seus próprios conjuntos de dados.
Posso transmitir a saída?
Sim, defina `stream: true` em sua chamada de API. A resposta será enviada como eventos enviados pelo servidor, idênticos ao formato de streaming da OpenAI.
O que acontece se eu exceder o limite de 1M tokens?
Você receberá um erro. Garanta que o número total de tokens em suas mensagens mais max_tokens não exceda 1,000,000.

Incorporar este selo

Z.ai: GLM 5.2$1.40/M in5596ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 no OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)