GLM 5.2

z-ai/glm-5.2
НовинкаРекомендуем
от Z.ai · text in · text out · 1M ctx · 2026-06-16

Контекстное окно в 1M токенов для обработки текстов большого объема, доступное через API OrcaRouter.

Эндпоинты:/v1/chat/completions
ВХОД$1.40/ 1M токенов
ВЫХОД$4.40/ 1M токенов
p50 TTFT5.60 s7 д
p95 TTFT7.54 s7 д
ТРАФИК8.0Mтокенов / 7 д

Что такое Z.ai: GLM 5.2?

Z.ai: GLM 5.2 — это текстовая большая языковая модель с окном контекста в 1,000,000 токенов и максимальным выводом в 128,000 токенов. Она разработана Z.ai и предлагается через API OrcaRouter. Модель обрабатывает только текстовые входные данные, что делает её идеальной для задач, требующих чтения и генерации очень длинных отрывков, таких как анализ целых книг или всестороннее обобщение многомодульных кодовых баз. Ценообразование соответствует тарифам провайдера: $1.40 за миллион входных токенов и $4.40 за миллион выходных токенов, без наценки со стороны OrcaRouter.

Для кого предназначена эта модель?

Z.ai: GLM 5.2 ориентирован на пользователей и организации, которым необходимо обрабатывать чрезвычайно длинные текстовые последовательности в одном вызове API. К типичным ролям относятся юристы, анализирующие целые контракты или документы по раскрытию информации, исследователи, изучающие обширную литературу, инженеры-программисты, разбирающиеся в больших репозиториях кода, и специалисты по данным, работающие с длинными файлами журналов. Большое контекстное окно снижает необходимость ручной разбивки, а высокий лимит вывода позволяет генерировать подробные отчеты или исправления кода.

Каковы ключевые спецификации?

Основные характеристики включают общий контекстный буфер в 1 000 000 токенов (как для ввода, так и для вывода вместе), с максимальным размером вывода — 128 000 токенов. Модель поддерживает только текстовый ввод, мультимодальные возможности не заявлены. Доступ к ней осуществляется через совместимый с OpenAI API OrcaRouter с идентификатором модели «z-ai/glm-5.2» по базовому URL https://api.orcarouter.ai/v1. Ценообразование — за токен: 1,40 $ за миллион входных токенов и 4,40 $ за миллион выходных токенов, по тарифам провайдера Z.ai без наценки.

Примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Цены

Ввод / 1M токенов$1.40
Вывод / 1M токенов$4.40
Чтение кэша / 1M$0.260
ВалютаUSD

Производительность

p50 TTFT
5.60 s
Скорость вывода
96.0 tok/s
p95 TTFT
7.54 s
Частота ошибок
0%

Публичные тесты

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
Источник: artificialanalysis.ai

Больше от Z.ai

FAQ

Какова стоимость за токен для GLM 5.2?
Входные токены стоят $1.40 за миллион токенов, а выходные токены стоят $4.40 за миллион токенов. OrcaRouter не добавляет наценку; вы платите ставку провайдера Z.ai.
Каков размер контекстного окна модели?
Контекстное окно составляет 1,000,000 токенов (входные и выходные вместе). Максимальный выход — 128,000 токенов на запрос.
Каковы сильные стороны модели?
Его основное преимущество — большой контекстный окно (1M токенов) и высокий лимит вывода (128k токенов), что позволяет обрабатывать очень длинные документы или беседы за один вызов. Он только текстовый.
Как GLM 5.2 сравнивается с другими моделями с меньшими контекстными окнами?
У него гораздо большее контекстное окно, что делает его подходящим для задач, требующих чтения целых книг или больших баз кода. Меньшие модели дешевле и быстрее для задач, которые укладываются в их контекстные ограничения.
OrcaRouter кэширует токены или предлагает скидки?
Нет, OrcaRouter не рекламирует кэширование токенов или оптовые скидки для этой модели. Ценообразование осуществляется за токен по тарифу провайдера без наценки.
Как вызвать GLM 5.2 через OrcaRouter?
Используйте совместимый с OpenAI API по базовому URL https://api.orcarouter.ai/v1, идентификатор модели “z-ai/glm-5.2”. Отправьте стандартный запрос на завершение чата с вашим API-ключом.
Какие модальности ввода поддерживает модель?
Z.ai: GLM 5.2 поддерживает только текстовый ввод. Он не может обрабатывать изображения, аудио или другие мультимодальные данные.
Есть ли известные результаты тестов производительности?
В доступных фактах не приведены результаты тестов для GLM 5.2. Пользователям следует оценивать модель на собственных наборах данных.
Можно ли передавать вывод в потоковом режиме?
Да, укажите `stream: true` в вашем вызове API. Ответ будет отправлен в виде server‑sent events, идентично формату потоковой передачи OpenAI.
Что произойдет, если я превышу лимит в 1M токенов?
Вы получите ошибку. Убедитесь, что общее количество токенов в ваших сообщениях плюс max_tokens не превышает 1,000,000.

Встроить значок

Z.ai: GLM 5.2$1.40/M in5596ms p50через OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 в OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)