GLM 5.2

z-ai/glm-5.2
신규추천
제공 Z.ai · text in · text out · 1M ctx · 2026-06-16

OrcaRouter의 API를 통해 접근 가능한, 긴 형식의 텍스트 처리를 위한 1M 토큰 컨텍스트 윈도우

엔드포인트:/v1/chat/completions
입력$1.40/ 100만 토큰
출력$4.40/ 100만 토큰
p50 TTFT5.60 s7일
p95 TTFT7.54 s7일
트래픽8.0M토큰 / 7일

Z.ai: GLM 5.2란 무엇인가요?

Z.ai: GLM 5.2는 1,000,000토큰의 컨텍스트 윈도우와 최대 128,000토큰의 출력을 지원하는 텍스트 전용 대규모 언어 모델입니다. 이 모델은 Z.ai에서 개발되었으며 OrcaRouter의 API를 통해 제공됩니다. 모델은 텍스트 입력만 처리하므로 전체 도서 분석이나 다중 파일 코드베이스의 포괄적 요약과 같은 매우 긴 구절을 읽고 생성해야 하는 작업에 이상적입니다. 가격은 제공업체의 요율을 따릅니다: 입력 토큰 100만 개당 $1.40, 출력 토큰 100만 개당 $4.40이며, OrcaRouter는 마크업을 추가하지 않습니다.

이 모델은 누구를 위해 설계되었나요?

Z.ai: GLM 5.2는 단일 API 호출로 매우 긴 텍스트 시퀀스를 처리해야 하는 사용자 및 조직을 대상으로 합니다. 주요 사용자로는 전체 계약서나 증거 문서를 분석하는 법률 전문가, 방대한 문헌을 검토하는 연구자, 대규모 코드 저장소를 이해하는 소프트웨어 엔지니어, 긴 로그 파일을 작업하는 데이터 과학자가 포함됩니다. 넉넉한 컨텍스트 윈도우는 수동 청킹의 필요성을 줄여주며, 높은 출력 제한은 상세한 보고서나 코드 패치를 생성하는 데 도움을 줍니다.

주요 사양은 무엇인가요?

주요 사양은 다음과 같습니다: 총 컨텍스트 윈도우가 1,000,000 토큰(입력 및 출력 합계)이며, 최대 출력은 128,000 토큰입니다. 이 모델은 텍스트 입력만 지원하며, 멀티모달 기능은 제공되지 않습니다. OrcaRouter의 OpenAI 호환 API를 통해 모델 ID "z-ai/glm-5.2"로 액세스할 수 있으며, 기본 URL은 https://api.orcarouter.ai/v1입니다. 가격은 토큰당: 입력 토큰 100만 개당 $1.40, 출력 토큰 100만 개당 $4.40이며, Z.ai의 제공업체 요율로 청구되며 마크업이 없습니다.

코드 샘플

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

가격

입력 / 1M tokens$1.40
출력 / 1M tokens$4.40
캐시 읽기 / 1M$0.260
통화USD

성능

p50 TTFT
5.60 s
출력 속도
96.0 tok/s
p95 TTFT
7.54 s
오류율
0%

공개 벤치마크

AIME 2026
99.2
CritPt
16.7
DeepSWE
46.2
FrontierSWE (Dominance)
74.4
GPQA-Diamond
91.2
HLE
40.5
HLE (w/ Tools)
54.7
HMMT Feb. 2026
92.5
HMMT Nov. 2025
94.4
IMOAnswerBench
91.0
MCP-Atlas (Public Set)
76.8
NL2Repo
48.9
PostTrainBench
34.3
ProgramBench
63.7
SWE-bench Pro
62.1
SWE-Marathon
13.0
Terminal Bench 2.1 (Best Reported)
82.7
Terminal Bench 2.1 (Terminus-2)
81.0
Tool-Decathlon
48.2
소스: artificialanalysis.ai

FAQ

GLM 5.2의 토큰당 비용은 얼마인가요?
입력 토큰은 백만 개당 $1.40, 출력 토큰은 백만 개당 $4.40입니다. OrcaRouter는 마크업을 적용하지 않으며, 이용자는 Z.ai의 제공자 요금을 지불합니다.
모델의 컨텍스트 윈도우 크기는 무엇인가요?
컨텍스트 윈도우는 1,000,000개의 토큰(입력 및 출력 합계)입니다. 최대 출력은 요청당 128,000개의 토큰입니다.
모델의 강점은 무엇인가요?
주요 강점은 큰 컨텍스트 창(1M 토큰)과 높은 출력 제한(128k 토큰)으로, 단일 호출로 매우 긴 문서나 대화를 처리할 수 있습니다. 텍스트 전용입니다.
GLM 5.2는 더 작은 컨텍스트 창을 가진 다른 모델들과 어떻게 비교됩니까?
더 넓은 컨텍스트 윈도우를 가지고 있어 전체 책이나 큰 코드베이스를 읽는 작업에 적합합니다. 작은 모델은 컨텍스트 한도 내에서 작업할 때 더 저렴하고 빠릅니다.
OrcaRouter는 토큰을 캐시하거나 할인을 제공하나요?
아니요, OrcaRouter는 이 모델에 대해 토큰 캐싱이나 볼륨 할인을 광고하지 않습니다. 가격은 제공업체의 요율에 따라 토큰당 책정되며 마크업이 전혀 없습니다.
OrcaRouter를 통해 GLM 5.2를 어떻게 호출하나요?
OpenAI‑compatible API를 기본 URL https://api.orcarouter.ai/v1, 모델 ID “z-ai/glm-5.2”와 함께 사용하세요. 표준 채팅 완료 요청을 API 키와 함께 보내십시오.
모델이 지원하는 입력 방식은 무엇인가요?
Z.ai: GLM 5.2는 텍스트 입력만 지원합니다. 이미지, 오디오 또는 기타 멀티모달을 처리할 수 없습니다.
알려진 벤치마크 점수가 있나요?
제공된 사실에는 GLM 5.2에 대한 벤치마크 점수가 포함되어 있지 않습니다. 사용자는 자체 데이터셋으로 모델을 평가해야 합니다.
출력을 스트리밍할 수 있나요?
네, API 호출에서 `stream: true`를 설정하세요. 응답은 서버 전송 이벤트로 전송되며, 이는 OpenAI의 스트리밍 형식과 동일합니다.
1M 토큰 제한을 초과하면 어떻게 되나요?
오류가 발생할 것입니다. 메시지의 총 토큰 수와 max_tokens의 합이 1,000,000을 초과하지 않도록 하십시오.

이 배지 임베드

Z.ai: GLM 5.2$1.40/M in5596ms p50OrcaRouter를 통해
HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="OrcaRouter 의 Z.ai: GLM 5.2" /> </a>
Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)