GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

NuevoDestacado

por Z.ai · text in · text out · 1M ctx · 2026-06-16

Ventana de contexto de 1M tokens para procesamiento de texto de formato largo, accedida a través de…

Endpoints:/v1/chat/completions

ENTRADA$1.40/ 1M tokens

SALIDA$4.40/ 1M tokens

p50 TTFT5.60 s7 d

p95 TTFT7.54 s7 d

TRÁFICO8.0Mtokens / 7 d

Obtener la API de GLM 5.2 →▶ Probar en Playground </> Usar vía API

¿Qué es Z.ai: GLM 5.2?

Z.ai: GLM 5.2 es un modelo de lenguaje grande exclusivamente de texto con una ventana de contexto de 1,000,000 de tokens y una salida máxima de 128,000 tokens. Es desarrollado por Z.ai y ofrecido a través de la API de OrcaRouter. El modelo procesa solo entradas de texto, lo que lo hace ideal para tareas que requieren leer y generar pasajes muy largos, como el análisis de libros completos o la síntesis exhaustiva de bases de código con múltiples archivos. El precio sigue la tarifa del proveedor: $1.40 por millón de tokens de entrada y $4.40 por millón de tokens de salida, sin margen adicional por parte de OrcaRouter.

¿Para quién está diseñado este modelo?

Z.ai: GLM 5.2 está dirigido a usuarios y organizaciones que necesitan manejar secuencias de texto extremadamente largas en una sola llamada API. Los roles comunes incluyen profesionales legales analizando contratos completos o documentos de descubrimiento, investigadores revisando literatura extensa, ingenieros de software comprendiendo grandes repositorios de código y científicos de datos trabajando con archivos de registro largos. La generosa ventana de contexto reduce la necesidad de fragmentación manual, mientras que el alto límite de salida permite generar informes detallados o parches de código.

¿Cuáles son las especificaciones clave?

Las especificaciones clave incluyen una ventana de contexto total de 1,000,000 de tokens (combinando entrada y salida), con una salida máxima de 128,000 tokens. El modelo solo admite entrada de texto; no se anuncian capacidades multimodales. Se accede a través de la API compatible con OpenAI de OrcaRouter usando el ID del modelo “z-ai/glm-5.2” en la URL base https://api.orcarouter.ai/v1. El precio es por token: $1.40 por millón de tokens de entrada y $4.40 por millón de tokens de salida, facturado a la tarifa del proveedor de Z.ai con margen cero.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Precios

Entrada / 1M tokens	$1.40
Salida / 1M tokens	$4.40
Lectura caché / 1M	$0.260
Moneda	USD

Rendimiento

últimos 7 días

p50 TTFT

5.60 s

Velocidad de salida

96.0 tok/s

p95 TTFT

7.54 s

Tasa de error

Pruebas de referencia públicas

Última evaluación 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

Fuente: artificialanalysis.ai

Más de Z.ai

Ver todos los modelos de z-ai →

GLM 5.1Insignia

z-ai/glm-5.1

$1.40 entrada · $4.40 salida / 1M

200K ctx· calidad 9/10

GLM 5

z-ai/glm-5

$1.00 entrada · $3.20 salida / 1M

200K ctx· calidad 8/10

GLM 4.5Más barato

z-ai/glm-4.5

$0.60 entrada · $2.20 salida / 1M

128K ctx· calidad 7/10

Preguntas frecuentes

¿Cuál es el costo por token para GLM 5.2?

El costo de los tokens de entrada es de $1.40 por millón de tokens, y el costo de los tokens de salida es de $4.40 por millón de tokens. No hay recargo por parte de OrcaRouter; usted paga la tarifa del proveedor de Z.ai.

¿Cuál es el tamaño de la ventana de contexto del modelo?

La ventana de contexto es de 1,000,000 tokens (entrada y salida combinadas). La salida máxima es de 128,000 tokens por solicitud.

¿Cuáles son las fortalezas del modelo?

Su principal fortaleza es la gran ventana de contexto (1M tokens) y el alto límite de salida (128k tokens), lo que permite procesar documentos o conversaciones muy largos en una sola llamada. Es solo texto.

¿Cómo se compara GLM 5.2 con otros modelos que tienen ventanas de contexto más pequeñas?

Tiene una ventana de contexto mucho más grande, lo que lo hace adecuado para tareas que requieren leer libros completos o grandes bases de código. Los modelos más pequeños son más baratos y rápidos para tareas que se ajustan a sus límites de contexto.

¿OrcaRouter almacena en caché tokens u ofrece descuentos?

No, OrcaRouter no anuncia almacenamiento en caché de tokens ni descuentos por volumen para este modelo. El precio es por token según la tarifa del proveedor, sin margen de beneficio.

¿Cómo llamo a GLM 5.2 a través de OrcaRouter?

Usa la API compatible con OpenAI en la URL base https://api.orcarouter.ai/v1, con el ID del modelo “z-ai/glm-5.2”. Envía una solicitud de finalización de chat estándar con tu clave de API.

¿Qué modalidades de entrada admite el modelo?

Z.ai: GLM 5.2 soporta solo entrada de texto. No puede procesar imágenes, audio u otras multimodalidades.

¿Hay algún puntaje de referencia conocido?

No se proporcionan puntuaciones de referencia para GLM 5.2 en los datos disponibles. Los usuarios deben evaluar el modelo en sus propios conjuntos de datos.

¿Puedo transmitir el resultado?

Sí, establece `stream: true` en tu llamada a la API. La respuesta se enviará como eventos enviados por el servidor, idéntico al formato de streaming de OpenAI.

¿Qué sucede si excedo el límite de 1M tokens?

Recibirás un error. Asegúrate de que el número total de tokens en tus mensajes más max_tokens no supere 1,000,000.

Insertar esta insignia

Pegar en tu artículo de blog

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•vía OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 en OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

¿Qué es Z.ai: GLM 5.2?

¿Para quién está diseñado este modelo?

¿Cuáles son las especificaciones clave?

¿Qué tareas principales puede realizar GLM 5.2?

¿Cuándo deberías usar este modelo en lugar de uno más pequeño?

¿Cuáles son las limitaciones del modelo?

¿Cómo afecta la gran ventana de contexto al rendimiento?

¿Cuáles son las puntuaciones de referencia reportadas del modelo?

¿Cómo se compara la latencia con modelos más pequeños?

¿Cuáles son las fortalezas conocidas del modelo?

¿Cómo se fija el precio de GLM 5.2?

¿Hay algún descuento o precio por volumen?

¿Cómo se compara el costo con modelos más pequeños?

¿Cómo llamo a GLM 5.2 mediante OrcaRouter?

¿Qué parámetros son compatibles?

¿Puedo transmitir respuestas en streaming?

¿Cómo migro desde un proveedor diferente?

¿Cómo se compara GLM 5.2 con otros modelos de contexto grande?

¿Cuándo debería elegir GLM 5.2 en lugar de un modelo más barato?

¿Qué hay de los modelos con un contexto más pequeño pero de calidad similar?