GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

NowyPolecane

przez Z.ai · text in · text out · 1M ctx · 2026-06-16

Okno kontekstu 1M tokenów do przetwarzania długich form tekstu, dostępne przez API OrcaRouter.

Punkty końcowe:/v1/chat/completions

WEJŚCIE$1.40/ 1M tokenów

WYJŚCIE$4.40/ 1M tokenów

p50 TTFT5.60 s7 d

p95 TTFT7.54 s7 d

RUCH8.0Mtokenów / 7 d

Uzyskaj API GLM 5.2 →▶ Wypróbuj w Playground </> Użyj przez API

Czym jest Z.ai: GLM 5.2?

Z.ai: GLM 5.2 to model językowy obsługujący wyłącznie tekst, z kontekstem o długości 1,000,000 tokenów i maksymalnym wyjściem 128,000 tokenów. Jest opracowany przez Z.ai i oferowany przez API OrcaRouter. Model przetwarza wyłącznie dane wejściowe w formie tekstu, co czyni go idealnym do zadań wymagających czytania i generowania bardzo długich fragmentów, takich jak analiza całych książek czy kompleksowe podsumowywanie wieloplikowych baz kodu. Cennik jest zgodny ze stawką dostawcy: $1.40 za milion tokenów wejściowych i $4.40 za milion tokenów wyjściowych, bez narzutu ze strony OrcaRouter.

Dla kogo jest przeznaczony ten model?

Z.ai: GLM 5.2 jest skierowany do użytkowników i organizacji, które potrzebują obsługiwać bardzo długie sekwencje tekstu w pojedynczym wywołaniu API. Typowe role obejmują prawników analizujących całe umowy lub dokumenty z postępowania dowodowego, badaczy przeglądających obszerną literaturę, inżynierów oprogramowania rozumiejących duże repozytoria kodu oraz naukowców danych pracujących z długimi plikami logów. Hojne okno kontekstu zmniejsza potrzebę ręcznego dzielenia na fragmenty, podczas gdy wysoki limit generowania wspiera tworzenie szczegółowych raportów lub łat kodu.

Jakie są kluczowe specyfikacje?

Kluczowe specyfikacje obejmują całkowite okno kontekstowe wynoszące 1,000,000 tokenów (zarówno wejście, jak i wyjście łącznie), z maksymalną liczbą tokenów wyjściowych wynoszącą 128,000. Model obsługuje tylko wprowadzanie tekstu; nie reklamuje się możliwości multimodalnych. Jest dostępny za pośrednictwem kompatybilnego z OpenAI API OrcaRouter przy użyciu ID modelu „z-ai/glm-5.2” pod podstawowym adresem URL https://api.orcarouter.ai/v1. Cennik jest za token: 1,40 dolara za milion tokenów wejściowych i 4,40 dolara za milion tokenów wyjściowych, rozliczany według stawki dostawcy Z.ai z zerową marżą.

Przykłady kodu

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Cennik

Wejście / 1M tokenów	$1.40
Wyjście / 1M tokenów	$4.40
Odczyt cache / 1M	$0.260
Waluta	USD

Wydajność

ostatnie 7 dni

p50 TTFT

5.60 s

Prędkość wyjścia

96.0 tok/s

p95 TTFT

7.54 s

Wskaźnik błędów

Publiczne benchmarki

Ostatnia ocena 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

Źródło: artificialanalysis.ai

Więcej od Z.ai

Zobacz wszystkie modele z-ai →

GLM 5.1Flagowy

z-ai/glm-5.1

$1.40 wejście · $4.40 wyjście / 1M

200K kont.· jakość 9/10

GLM 5

z-ai/glm-5

$1.00 wejście · $3.20 wyjście / 1M

200K kont.· jakość 8/10

GLM 4.5Najtańszy

z-ai/glm-4.5

$0.60 wejście · $2.20 wyjście / 1M

128K kont.· jakość 7/10

FAQ

Ile wynosi koszt za token dla GLM 5.2?

Tokeny wejściowe kosztują $1.40 za milion tokenów, a tokeny wyjściowe kosztują $4.40 za milion tokenów. Nie ma narzutu ze strony OrcaRouter; płacisz stawkę dostawcy Z.ai.

Jaki jest rozmiar okna kontekstowego modelu?

Okno kontekstu wynosi 1 000 000 tokenów (łącznego wejścia i wyjścia). Maksymalna liczba tokenów wyjściowych to 128 000 tokenów na żądanie.

Jakie są mocne strony modelu?

Jego główną siłą jest duże okno kontekstowe (1M tokenów) i wysoki limit wyjściowy (128k tokenów), umożliwiające przetwarzanie bardzo długich dokumentów lub rozmów w jednym wywołaniu. Jest tylko tekstem.

Jak GLM 5.2 wypada w porównaniu do innych modeli z mniejszymi oknami kontekstu?

Ma znacznie większe okno kontekstowe, co czyni go odpowiednim do zadań wymagających czytania całych książek lub dużych baz kodu. Mniejsze modele są tańsze i szybsze w przypadku zadań mieszczących się w ich limitach kontekstowych.

Czy OrcaRouter przechowuje tokeny w pamięci podręcznej lub oferuje rabaty?

Nie, OrcaRouter nie reklamuje buforowania tokenów ani rabatów ilościowych dla tego modelu. Cennik oparty jest na stawce za token dostawcy, z zerową marżą.

Jak wywołać GLM 5.2 przez OrcaRouter?

Użyj kompatybilnego z OpenAI API pod adresem bazowym URL https://api.orcarouter.ai/v1, identyfikator modelu “z-ai/glm-5.2”. Wyślij standardowe żądanie uzupełnienia czatu z użyciem swojego klucza API.

Jakie modały wejściowe obsługuje model?

Z.ai: GLM 5.2 obsługuje tylko wprowadzanie tekstu. Nie może przetwarzać obrazów, dźwięku ani innych multimodalności.

Czy istnieją jakieś znane wyniki benchmarków?

Nie podano wyników benchmarków dla GLM 5.2 w dostępnych faktach. Użytkownicy powinni ocenić model na własnych zbiorach danych.

Czy mogę strumieniować wyjście?

Tak, ustaw `stream: true` w swoim wywołaniu API. Odpowiedź będzie wysłana jako zdarzenia wysyłane przez serwer, identyczne z formatem strumieniowania OpenAI.

Co się stanie, jeśli przekroczę limit 1M tokenów?

Otrzymasz błąd. Upewnij się, że łączna liczba tokenów w twoich wiadomościach plus max_tokens nie przekracza 1,000,000.

Osadź tę odznakę

Wklej do swojego bloga

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•przez OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 w OrcaRouter" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Czym jest Z.ai: GLM 5.2?

Dla kogo jest przeznaczony ten model?

Jakie są kluczowe specyfikacje?

Jakie podstawowe zadania może wykonać GLM 5.2?

Kiedy powinieneś użyć tego modelu zamiast mniejszego?

Jakie są ograniczenia modelu?

Jak duże okno kontekstu wpływa na wydajność?

Jakie są zgłoszone wyniki benchmarku modelu?

Jak wypada opóźnienie w porównaniu do mniejszych modeli?

Jakie są znane mocne strony modelu?

Jak jest wyceniony GLM 5.2?

Czy są jakieś zniżki lub ceny hurtowe?

Jak koszt wypada w porównaniu z mniejszymi modelami?

Jak wywołać GLM 5.2 przez OrcaRouter?

Jakie parametry są obsługiwane?

Czy mogę strumieniować odpowiedzi?

Jak przeprowadzić migrację z innego dostawcy?

Jak GLM 5.2 wypada w porównaniu do innych modeli o dużym kontekście?

Kiedy powinienem wybrać GLM 5.2 zamiast tańszego modelu?

A co z modelami o mniejszym kontekście, ale podobnej jakości?