GLM 5.2

Name: Z.ai: GLM 5.2 API
Brand: z-ai

z-ai/glm-5.2

신규추천

제공 Z.ai · text in · text out · 1M ctx · 2026-06-16

OrcaRouter의 API를 통해 접근 가능한, 긴 형식의 텍스트 처리를 위한 1M 토큰 컨텍스트 윈도우

엔드포인트:/v1/chat/completions

입력$1.40/ 100만 토큰

출력$4.40/ 100만 토큰

p50 TTFT5.60 s7일

p95 TTFT7.54 s7일

트래픽8.0M토큰 / 7일

GLM 5.2 API 받기 →▶ Playground에서 사용해보기 </> API로 사용

Z.ai: GLM 5.2란 무엇인가요?

Z.ai: GLM 5.2는 1,000,000토큰의 컨텍스트 윈도우와 최대 128,000토큰의 출력을 지원하는 텍스트 전용 대규모 언어 모델입니다. 이 모델은 Z.ai에서 개발되었으며 OrcaRouter의 API를 통해 제공됩니다. 모델은 텍스트 입력만 처리하므로 전체 도서 분석이나 다중 파일 코드베이스의 포괄적 요약과 같은 매우 긴 구절을 읽고 생성해야 하는 작업에 이상적입니다. 가격은 제공업체의 요율을 따릅니다: 입력 토큰 100만 개당 $1.40, 출력 토큰 100만 개당 $4.40이며, OrcaRouter는 마크업을 추가하지 않습니다.

이 모델은 누구를 위해 설계되었나요?

Z.ai: GLM 5.2는 단일 API 호출로 매우 긴 텍스트 시퀀스를 처리해야 하는 사용자 및 조직을 대상으로 합니다. 주요 사용자로는 전체 계약서나 증거 문서를 분석하는 법률 전문가, 방대한 문헌을 검토하는 연구자, 대규모 코드 저장소를 이해하는 소프트웨어 엔지니어, 긴 로그 파일을 작업하는 데이터 과학자가 포함됩니다. 넉넉한 컨텍스트 윈도우는 수동 청킹의 필요성을 줄여주며, 높은 출력 제한은 상세한 보고서나 코드 패치를 생성하는 데 도움을 줍니다.

주요 사양은 무엇인가요?

주요 사양은 다음과 같습니다: 총 컨텍스트 윈도우가 1,000,000 토큰(입력 및 출력 합계)이며, 최대 출력은 128,000 토큰입니다. 이 모델은 텍스트 입력만 지원하며, 멀티모달 기능은 제공되지 않습니다. OrcaRouter의 OpenAI 호환 API를 통해 모델 ID "z-ai/glm-5.2"로 액세스할 수 있으며, 기본 URL은 https://api.orcarouter.ai/v1입니다. 가격은 토큰당: 입력 토큰 100만 개당 $1.40, 출력 토큰 100만 개당 $4.40이며, Z.ai의 제공업체 요율로 청구되며 마크업이 없습니다.

코드 샘플

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

가격

입력 / 1M tokens	$1.40
출력 / 1M tokens	$4.40
캐시 읽기 / 1M	$0.260
통화	USD

성능

최근 7일

p50 TTFT

5.60 s

출력 속도

96.0 tok/s

p95 TTFT

7.54 s

오류율

공개 벤치마크

마지막 평가 2026-06-15

AIME 2026

99.2

CritPt

16.7

DeepSWE

46.2

FrontierSWE (Dominance)

74.4

GPQA-Diamond

91.2

HLE

40.5

HLE (w/ Tools)

54.7

HMMT Feb. 2026

92.5

HMMT Nov. 2025

94.4

IMOAnswerBench

91.0

MCP-Atlas (Public Set)

76.8

NL2Repo

48.9

PostTrainBench

34.3

ProgramBench

63.7

SWE-bench Pro

62.1

SWE-Marathon

13.0

Terminal Bench 2.1 (Best Reported)

82.7

Terminal Bench 2.1 (Terminus-2)

81.0

Tool-Decathlon

48.2

소스: artificialanalysis.ai

Z.ai의 다른 모델

z-ai의 모든 모델 보기 →

GLM 5.1플래그십

z-ai/glm-5.1

입력 $1.40 · 출력 $4.40 / 100만

200K 컨텍스트· 품질 9/10

GLM 5

z-ai/glm-5

입력 $1.00 · 출력 $3.20 / 100만

200K 컨텍스트· 품질 8/10

GLM 4.5최저가

z-ai/glm-4.5

입력 $0.60 · 출력 $2.20 / 100만

128K 컨텍스트· 품질 7/10

FAQ

GLM 5.2의 토큰당 비용은 얼마인가요?

입력 토큰은 백만 개당 $1.40, 출력 토큰은 백만 개당 $4.40입니다. OrcaRouter는 마크업을 적용하지 않으며, 이용자는 Z.ai의 제공자 요금을 지불합니다.

모델의 컨텍스트 윈도우 크기는 무엇인가요?

컨텍스트 윈도우는 1,000,000개의 토큰(입력 및 출력 합계)입니다. 최대 출력은 요청당 128,000개의 토큰입니다.

모델의 강점은 무엇인가요?

주요 강점은 큰 컨텍스트 창(1M 토큰)과 높은 출력 제한(128k 토큰)으로, 단일 호출로 매우 긴 문서나 대화를 처리할 수 있습니다. 텍스트 전용입니다.

GLM 5.2는 더 작은 컨텍스트 창을 가진 다른 모델들과 어떻게 비교됩니까?

더 넓은 컨텍스트 윈도우를 가지고 있어 전체 책이나 큰 코드베이스를 읽는 작업에 적합합니다. 작은 모델은 컨텍스트 한도 내에서 작업할 때 더 저렴하고 빠릅니다.

OrcaRouter는 토큰을 캐시하거나 할인을 제공하나요?

아니요, OrcaRouter는 이 모델에 대해 토큰 캐싱이나 볼륨 할인을 광고하지 않습니다. 가격은 제공업체의 요율에 따라 토큰당 책정되며 마크업이 전혀 없습니다.

OrcaRouter를 통해 GLM 5.2를 어떻게 호출하나요?

OpenAI‑compatible API를 기본 URL https://api.orcarouter.ai/v1, 모델 ID “z-ai/glm-5.2”와 함께 사용하세요. 표준 채팅 완료 요청을 API 키와 함께 보내십시오.

모델이 지원하는 입력 방식은 무엇인가요?

Z.ai: GLM 5.2는 텍스트 입력만 지원합니다. 이미지, 오디오 또는 기타 멀티모달을 처리할 수 없습니다.

알려진 벤치마크 점수가 있나요?

제공된 사실에는 GLM 5.2에 대한 벤치마크 점수가 포함되어 있지 않습니다. 사용자는 자체 데이터셋으로 모델을 평가해야 합니다.

출력을 스트리밍할 수 있나요?

네, API 호출에서 `stream: true`를 설정하세요. 응답은 서버 전송 이벤트로 전송되며, 이는 OpenAI의 스트리밍 형식과 동일합니다.

1M 토큰 제한을 초과하면 어떻게 되나요?

오류가 발생할 것입니다. 메시지의 총 토큰 수와 max_tokens의 합이 1,000,000을 초과하지 않도록 하십시오.

이 배지 임베드

블로그 포스트에 붙여넣기

Z.ai: GLM 5.2•$1.40/M in•5596ms p50•OrcaRouter를 통해

HTML <a href="https://www.orcarouter.ai/models/z-ai/glm-5.2" target="_blank"> <img src="https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg" alt="OrcaRouter 의 Z.ai: GLM 5.2" /> </a>

Markdown [![Z.ai: GLM 5.2](https://www.orcarouter.ai/embed/z-ai/glm-5.2.svg)](https://www.orcarouter.ai/models/z-ai/glm-5.2)

GLM 5.2

Z.ai: GLM 5.2란 무엇인가요?

이 모델은 누구를 위해 설계되었나요?

주요 사양은 무엇인가요?

GLM 5.2가 수행할 수 있는 핵심 작업은 무엇인가요?

이 모델을 더 작은 모델보다 언제 사용해야 하나요?

모델의 한계는 무엇인가요?

큰 컨텍스트 윈도우가 성능에 어떤 영향을 미치나요?

모델의 보고된 벤치마크 점수는 무엇인가요?

지연 시간이 더 작은 모델과 비교하여 어떤가요?

모델의 알려진 강점은 무엇인가요?

GLM 5.2의 가격은 어떻게 되나요?

할인이나 대량 구매 가격이 있나요?

소형 모델과 비용을 비교하면 어떻습니까?

OrcaRouter를 통해 GLM 5.2를 어떻게 호출하나요?

지원되는 매개변수는 무엇인가요?

응답을 스트리밍할 수 있나요?

다른 제공업체에서 마이그레이션하려면 어떻게 해야 하나요?

GLM 5.2는 다른 대규모 컨텍스트 모델과 어떻게 비교되나요?

GLM 5.2를 더 저렴한 모델보다 언제 선택하는 게 좋을까요?

컨텍스트가 더 작지만 비슷한 품질을 가진 모델은 어떤가요?

코드 샘플

가격

성능

공개 벤치마크

Z.ai의 다른 모델

FAQ

이 배지 임베드