GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

НовинкаРекомендуем

от Z.ai · text in · text out · 1M ctx · 2026-06-16

Контекстное окно в 1M токенов для обработки текстов большого объема, доступное через API OrcaRouter.

Эндпоинты:/v1/chat/completions

ВХОД$1.40/ 1M токенов

ВЫХОД$4.40/ 1M токенов

p50 TTFT5.60 s7 д

p95 TTFT7.54 s7 д

ТРАФИК8.0Mтокенов / 7 д

Получить API GLM 5.2 →▶ Попробовать в Playground </> Через API

Что такое Z.ai: GLM 5.2?

Z.ai: GLM 5.2 — это текстовая большая языковая модель с окном контекста в 1,000,000 токенов и максимальным выводом в 128,000 токенов. Она разработана Z.ai и предлагается через API OrcaRouter. Модель обрабатывает только текстовые входные данные, что делает её идеальной для задач, требующих чтения и генерации очень длинных отрывков, таких как анализ целых книг или всестороннее обобщение многомодульных кодовых баз. Ценообразование соответствует тарифам провайдера: $1.40 за миллион входных токенов и $4.40 за миллион выходных токенов, без наценки со стороны OrcaRouter.

Для кого предназначена эта модель?

Z.ai: GLM 5.2 ориентирован на пользователей и организации, которым необходимо обрабатывать чрезвычайно длинные текстовые последовательности в одном вызове API. К типичным ролям относятся юристы, анализирующие целые контракты или документы по раскрытию информации, исследователи, изучающие обширную литературу, инженеры-программисты, разбирающиеся в больших репозиториях кода, и специалисты по данным, работающие с длинными файлами журналов. Большое контекстное окно снижает необходимость ручной разбивки, а высокий лимит вывода позволяет генерировать подробные отчеты или исправления кода.

Каковы ключевые спецификации?

Основные характеристики включают общий контекстный буфер в 1 000 000 токенов (как для ввода, так и для вывода вместе), с максимальным размером вывода — 128 000 токенов. Модель поддерживает только текстовый ввод, мультимодальные возможности не заявлены. Доступ к ней осуществляется через совместимый с OpenAI API OrcaRouter с идентификатором модели «z-ai/glm-5.2» по базовому URL https://api.orcarouter.ai/v1. Ценообразование — за токен: 1,40 $ за миллион входных токенов и 4,40 $ за миллион выходных токенов, по тарифам провайдера Z.ai без наценки.

Примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Цены

Ввод / 1M токенов	$1.40
Вывод / 1M токенов	$4.40
Чтение кэша / 1M	$0.260
Валюта	USD

Производительность

за 7 дн.

p50 TTFT

5.60 s

Скорость вывода

96.0 tok/s

p95 TTFT

7.54 s

Частота ошибок

Публичные тесты

Последняя оценка 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

Источник: artificialanalysis.ai

Больше от Z.ai

Все модели от z-ai →

GLM 5.1Флагман

z-ai/glm-5.1

$1.40 вход · $4.40 выход / 1M

200K конт.· качество 9/10

GLM 5

z-ai/glm-5

$1.00 вход · $3.20 выход / 1M

200K конт.· качество 8/10

GLM 4.5Самый дешевый

z-ai/glm-4.5

$0.60 вход · $2.20 выход / 1M

128K конт.· качество 7/10

FAQ

Какова стоимость за токен для GLM 5.2?

Входные токены стоят $1.40 за миллион токенов, а выходные токены стоят $4.40 за миллион токенов. OrcaRouter не добавляет наценку; вы платите ставку провайдера Z.ai.

Каков размер контекстного окна модели?

Контекстное окно составляет 1,000,000 токенов (входные и выходные вместе). Максимальный выход — 128,000 токенов на запрос.

Каковы сильные стороны модели?

Его основное преимущество — большой контекстный окно (1M токенов) и высокий лимит вывода (128k токенов), что позволяет обрабатывать очень длинные документы или беседы за один вызов. Он только текстовый.

Как GLM 5.2 сравнивается с другими моделями с меньшими контекстными окнами?

У него гораздо большее контекстное окно, что делает его подходящим для задач, требующих чтения целых книг или больших баз кода. Меньшие модели дешевле и быстрее для задач, которые укладываются в их контекстные ограничения.

OrcaRouter кэширует токены или предлагает скидки?

Нет, OrcaRouter не рекламирует кэширование токенов или оптовые скидки для этой модели. Ценообразование осуществляется за токен по тарифу провайдера без наценки.

Как вызвать GLM 5.2 через OrcaRouter?

Используйте совместимый с OpenAI API по базовому URL https://api.orcarouter.ai/v1, идентификатор модели “z-ai/glm-5.2”. Отправьте стандартный запрос на завершение чата с вашим API-ключом.

Какие модальности ввода поддерживает модель?

Z.ai: GLM 5.2 поддерживает только текстовый ввод. Он не может обрабатывать изображения, аудио или другие мультимодальные данные.

Есть ли известные результаты тестов производительности?

В доступных фактах не приведены результаты тестов для GLM 5.2. Пользователям следует оценивать модель на собственных наборах данных.

Можно ли передавать вывод в потоковом режиме?

Да, укажите `stream: true` в вашем вызове API. Ответ будет отправлен в виде server‑sent events, идентично формату потоковой передачи OpenAI.

Что произойдет, если я превышу лимит в 1M токенов?

Вы получите ошибку. Убедитесь, что общее количество токенов в ваших сообщениях плюс max_tokens не превышает 1,000,000.

Встроить значок

Вставьте в свой блог

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•через OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 в OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Что такое Z.ai: GLM 5.2?

Для кого предназначена эта модель?

Каковы ключевые спецификации?

Какие основные задачи может выполнять GLM 5.2?

Когда следует использовать эту модель вместо меньшей?

Каковы ограничения модели?

Как большой контекстный окно влияет на производительность?

Каковы заявленные результаты тестов модели?

Какова задержка по сравнению с меньшими моделями?

Каковы известные сильные стороны модели?

Какова цена GLM 5.2?

Есть ли скидки или оптовые цены?

Какова стоимость по сравнению с меньшими моделями?

Как вызвать GLM 5.2 через OrcaRouter?

Какие параметры поддерживаются?

Могу ли я стримить ответы?

Как перейти от другого провайдера?

Как GLM 5.2 соотносится с другими моделями с большим контекстом?

Когда мне следует выбрать GLM 5.2 вместо более дешевой модели?

А как насчет моделей с меньшим контекстом, но аналогичным качеством?