GLM 5.2

z-ai/glm-5.2
NowyPolecane
przez Z.ai · text in · text out · 1M ctx · 2026-06-16

Okno kontekstu 1M tokenów do przetwarzania długich form tekstu, dostępne przez API OrcaRouter.

Punkty końcowe:/v1/chat/completions
WEJŚCIE$1.40/ 1M tokenów
WYJŚCIE$4.40/ 1M tokenów
p50 TTFT5.60 s7 d
p95 TTFT7.54 s7 d
RUCH8.0Mtokenów / 7 d

Czym jest Z.ai: GLM 5.2?

Z.ai: GLM 5.2 to model językowy obsługujący wyłącznie tekst, z kontekstem o długości 1,000,000 tokenów i maksymalnym wyjściem 128,000 tokenów. Jest opracowany przez Z.ai i oferowany przez API OrcaRouter. Model przetwarza wyłącznie dane wejściowe w formie tekstu, co czyni go idealnym do zadań wymagających czytania i generowania bardzo długich fragmentów, takich jak analiza całych książek czy kompleksowe podsumowywanie wieloplikowych baz kodu. Cennik jest zgodny ze stawką dostawcy: $1.40 za milion tokenów wejściowych i $4.40 za milion tokenów wyjściowych, bez narzutu ze strony OrcaRouter.

Dla kogo jest przeznaczony ten model?

Z.ai: GLM 5.2 jest skierowany do użytkowników i organizacji, które potrzebują obsługiwać bardzo długie sekwencje tekstu w pojedynczym wywołaniu API. Typowe role obejmują prawników analizujących całe umowy lub dokumenty z postępowania dowodowego, badaczy przeglądających obszerną literaturę, inżynierów oprogramowania rozumiejących duże repozytoria kodu oraz naukowców danych pracujących z długimi plikami logów. Hojne okno kontekstu zmniejsza potrzebę ręcznego dzielenia na fragmenty, podczas gdy wysoki limit generowania wspiera tworzenie szczegółowych raportów lub łat kodu.

Jakie są kluczowe specyfikacje?

Kluczowe specyfikacje obejmują całkowite okno kontekstowe wynoszące 1,000,000 tokenów (zarówno wejście, jak i wyjście łącznie), z maksymalną liczbą tokenów wyjściowych wynoszącą 128,000. Model obsługuje tylko wprowadzanie tekstu; nie reklamuje się możliwości multimodalnych. Jest dostępny za pośrednictwem kompatybilnego z OpenAI API OrcaRouter przy użyciu ID modelu „z-ai/glm-5.2” pod podstawowym adresem URL https://api.orcarouter.ai/v1. Cennik jest za token: 1,40 dolara za milion tokenów wejściowych i 4,40 dolara za milion tokenów wyjściowych, rozliczany według stawki dostawcy Z.ai z zerową marżą.

Przykłady kodu

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Cennik

Wejście / 1M tokenów$1.40
Wyjście / 1M tokenów$4.40
Odczyt cache / 1M$0.260
WalutaUSD

Wydajność

p50 TTFT
5.60 s
Prędkość wyjścia
96.0 tok/s
p95 TTFT
7.54 s
Wskaźnik błędów
0%

Publiczne benchmarki

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
Źródło: artificialanalysis.ai

FAQ

Ile wynosi koszt za token dla GLM 5.2?
Tokeny wejściowe kosztują $1.40 za milion tokenów, a tokeny wyjściowe kosztują $4.40 za milion tokenów. Nie ma narzutu ze strony OrcaRouter; płacisz stawkę dostawcy Z.ai.
Jaki jest rozmiar okna kontekstowego modelu?
Okno kontekstu wynosi 1 000 000 tokenów (łącznego wejścia i wyjścia). Maksymalna liczba tokenów wyjściowych to 128 000 tokenów na żądanie.
Jakie są mocne strony modelu?
Jego główną siłą jest duże okno kontekstowe (1M tokenów) i wysoki limit wyjściowy (128k tokenów), umożliwiające przetwarzanie bardzo długich dokumentów lub rozmów w jednym wywołaniu. Jest tylko tekstem.
Jak GLM 5.2 wypada w porównaniu do innych modeli z mniejszymi oknami kontekstu?
Ma znacznie większe okno kontekstowe, co czyni go odpowiednim do zadań wymagających czytania całych książek lub dużych baz kodu. Mniejsze modele są tańsze i szybsze w przypadku zadań mieszczących się w ich limitach kontekstowych.
Czy OrcaRouter przechowuje tokeny w pamięci podręcznej lub oferuje rabaty?
Nie, OrcaRouter nie reklamuje buforowania tokenów ani rabatów ilościowych dla tego modelu. Cennik oparty jest na stawce za token dostawcy, z zerową marżą.
Jak wywołać GLM 5.2 przez OrcaRouter?
Użyj kompatybilnego z OpenAI API pod adresem bazowym URL https://api.orcarouter.ai/v1, identyfikator modelu “z-ai/glm-5.2”. Wyślij standardowe żądanie uzupełnienia czatu z użyciem swojego klucza API.
Jakie modały wejściowe obsługuje model?
Z.ai: GLM 5.2 obsługuje tylko wprowadzanie tekstu. Nie może przetwarzać obrazów, dźwięku ani innych multimodalności.
Czy istnieją jakieś znane wyniki benchmarków?
Nie podano wyników benchmarków dla GLM 5.2 w dostępnych faktach. Użytkownicy powinni ocenić model na własnych zbiorach danych.
Czy mogę strumieniować wyjście?
Tak, ustaw `stream: true` w swoim wywołaniu API. Odpowiedź będzie wysłana jako zdarzenia wysyłane przez serwer, identyczne z formatem strumieniowania OpenAI.
Co się stanie, jeśli przekroczę limit 1M tokenów?
Otrzymasz błąd. Upewnij się, że łączna liczba tokenów w twoich wiadomościach plus max_tokens nie przekracza 1,000,000.

Osadź tę odznakę

Z.ai: GLM 5.2$1.40/M in5596ms p50przez OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="Z.ai: GLM 5.2 w OrcaRouter" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)