GLM 5.2

z-ai/glm-5.2
NuevoDestacado
por Z.ai · text in · text out · 1M ctx · 2026-06-16

Ventana de contexto de 1M tokens para procesamiento de texto de formato largo, accedida a través de…

ENTRADA$1.40/ 1M tokens
SALIDA$4.40/ 1M tokens
p50 TTFT5.60 s7 d
p95 TTFT7.54 s7 d
TRÁFICO8.0Mtokens / 7 d

¿Qué es Z.ai: GLM 5.2?

Z.ai: GLM 5.2 es un modelo de lenguaje grande exclusivamente de texto con una ventana de contexto de 1,000,000 de tokens y una salida máxima de 128,000 tokens. Es desarrollado por Z.ai y ofrecido a través de la API de OrcaRouter. El modelo procesa solo entradas de texto, lo que lo hace ideal para tareas que requieren leer y generar pasajes muy largos, como el análisis de libros completos o la síntesis exhaustiva de bases de código con múltiples archivos. El precio sigue la tarifa del proveedor: $1.40 por millón de tokens de entrada y $4.40 por millón de tokens de salida, sin margen adicional por parte de OrcaRouter.

¿Para quién está diseñado este modelo?

Z.ai: GLM 5.2 está dirigido a usuarios y organizaciones que necesitan manejar secuencias de texto extremadamente largas en una sola llamada API. Los roles comunes incluyen profesionales legales analizando contratos completos o documentos de descubrimiento, investigadores revisando literatura extensa, ingenieros de software comprendiendo grandes repositorios de código y científicos de datos trabajando con archivos de registro largos. La generosa ventana de contexto reduce la necesidad de fragmentación manual, mientras que el alto límite de salida permite generar informes detallados o parches de código.

¿Cuáles son las especificaciones clave?

Las especificaciones clave incluyen una ventana de contexto total de 1,000,000 de tokens (combinando entrada y salida), con una salida máxima de 128,000 tokens. El modelo solo admite entrada de texto; no se anuncian capacidades multimodales. Se accede a través de la API compatible con OpenAI de OrcaRouter usando el ID del modelo “z-ai/glm-5.2” en la URL base https://api.orcarouter.ai/v1. El precio es por token: $1.40 por millón de tokens de entrada y $4.40 por millón de tokens de salida, facturado a la tarifa del proveedor de Z.ai con margen cero.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Precios

Entrada / 1M tokens$1.40
Salida / 1M tokens$4.40
Lectura caché / 1M$0.260
MonedaUSD

Rendimiento

p50 TTFT
5.60 s
Velocidad de salida
96.0 tok/s
p95 TTFT
7.54 s
Tasa de error
0%

Pruebas de referencia públicas

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
Fuente: artificialanalysis.ai

Preguntas frecuentes

¿Cuál es el costo por token para GLM 5.2?
El costo de los tokens de entrada es de $1.40 por millón de tokens, y el costo de los tokens de salida es de $4.40 por millón de tokens. No hay recargo por parte de OrcaRouter; usted paga la tarifa del proveedor de Z.ai.
¿Cuál es el tamaño de la ventana de contexto del modelo?
La ventana de contexto es de 1,000,000 tokens (entrada y salida combinadas). La salida máxima es de 128,000 tokens por solicitud.
¿Cuáles son las fortalezas del modelo?
Su principal fortaleza es la gran ventana de contexto (1M tokens) y el alto límite de salida (128k tokens), lo que permite procesar documentos o conversaciones muy largos en una sola llamada. Es solo texto.
¿Cómo se compara GLM 5.2 con otros modelos que tienen ventanas de contexto más pequeñas?
Tiene una ventana de contexto mucho más grande, lo que lo hace adecuado para tareas que requieren leer libros completos o grandes bases de código. Los modelos más pequeños son más baratos y rápidos para tareas que se ajustan a sus límites de contexto.
¿OrcaRouter almacena en caché tokens u ofrece descuentos?
No, OrcaRouter no anuncia almacenamiento en caché de tokens ni descuentos por volumen para este modelo. El precio es por token según la tarifa del proveedor, sin margen de beneficio.
¿Cómo llamo a GLM 5.2 a través de OrcaRouter?
Usa la API compatible con OpenAI en la URL base https://api.orcarouter.ai/v1, con el ID del modelo “z-ai/glm-5.2”. Envía una solicitud de finalización de chat estándar con tu clave de API.
¿Qué modalidades de entrada admite el modelo?
Z.ai: GLM 5.2 soporta solo entrada de texto. No puede procesar imágenes, audio u otras multimodalidades.
¿Hay algún puntaje de referencia conocido?
No se proporcionan puntuaciones de referencia para GLM 5.2 en los datos disponibles. Los usuarios deben evaluar el modelo en sus propios conjuntos de datos.
¿Puedo transmitir el resultado?
Sí, establece `stream: true` en tu llamada a la API. La respuesta se enviará como eventos enviados por el servidor, idéntico al formato de streaming de OpenAI.
¿Qué sucede si excedo el límite de 1M tokens?
Recibirás un error. Asegúrate de que el número total de tokens en tus mensajes más max_tokens no supere 1,000,000.

Insertar esta insignia

Z.ai: GLM 5.2$1.40/M in5596ms p50vía OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 en OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)