Gemini 3.1 Pro Preview

Name: Google: Gemini 3.1 Pro Preview API
Brand: Google

google/gemini-3.1-pro-preview

플래그십추천

제공 Google · 2026-02-19

Google Gemini 3.1 Pro Preview: 플래그십 멀티모달 모델로, 1M 컨텍스트 윈도우와 95.6 τ²-Bench 점수를 갖추고 있으며, OrcaRouter API를 통해 접근 가능합니다.

엔드포인트:/v1/chat/completions /v1beta/models/{model}:generateContent

컨텍스트1.05M 토큰

입력audio + file + image + text + video

출력text

p50 TTFT5.71 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

입력$2.00/ 100만 토큰

출력$12.00/ 100만 토큰

p50 TTFT5.71 s7일

p95 TTFT10.00 s7일

트래픽5.1M토큰 / 7일

Gemini 3.1 Pro Preview API 받기 →▶ Playground에서 사용해보기 </> API로 사용

Google Gemini 3.1 Pro Preview란 무엇인가요?

Google Gemini 3.1 Pro Preview는 Google의 플래그십 모델로, 프리뷰 형태로 제공됩니다. 텍스트, 이미지, 비디오, 오디오 및 파일 입력을 처리할 수 있는 멀티모달 모델입니다. 이 모델은 플래그십 등급으로 분류되며, 성능과 용량이 중요한 고수요 및 복잡한 애플리케이션을 위해 설계되었음을 의미합니다. 프리뷰 버전이므로 안정적인 릴리스에 비해 안정성이나 가용성에 제한이 있을 수 있습니다. OrcaRouter API를 통해 액세스할 수 있습니다.

이 모델은 누가 사용해야 하나요?

이 모델은 최대 1,048,576개의 토큰까지 처리해야 하는 대규모 컨텍스트 윈도우와 멀티모달 이해를 필요로 하는 개발자와 기업을 대상으로 합니다. 사용 사례로는 장문 문서 분석, 비디오 모더레이션, 전체 대화를 기억하는 고급 챗봇, 혼합 매체에서의 복잡한 데이터 추출이 포함됩니다. 미리보기 상태이므로 실험 및 초기 통합에 적합하지만, 프로덕션 배포 시 안정성을 평가해야 합니다. 또한 이미 OrcaRouter의 OpenAI 호환 API를 사용 중이며 Google의 최신 플래그십 기능을 테스트하려는 팀에게도 이상적입니다.

주요 사양은 무엇인가요?

이 모델은 1,048,576개의 토큰(입력) 컨텍스트 창과 최대 65,536개의 토큰 출력을 지원합니다. 오디오, 파일(예: PDF, 코드 파일), 이미지, 텍스트, 비디오 등 여러 형식의 입력을 받습니다. 주요 벤치마크 점수는 작업 완료 성능을 측정하는 τ²-Bench에서 95.6입니다. 이 모델은 제공업체인 Google에서 플래그십 등급으로 분류됩니다. 이는 기본 URL https://api.orcarouter.ai/v1에서 모델 ID "google/gemini-3.1-pro-preview"로 OrcaRouter의 API를 통해 액세스됩니다.

다른 Gemini previews와 비교하면 어떻습니까?

Gemini 3.1 Pro의 미리보기 버전으로, 이 모델은 현재 Google의 프리뷰 릴리스 중 최상위에 위치합니다. 이전 Gemini 2.0 모델이나 Gemini 3.0 프리뷰에 비해 훨씬 더 큰 컨텍스트 창(100만 토큰)과 더 높은 출력 제한(65,000 토큰)을 제공합니다. τ²-Bench 점수 95.6은 작업 지향 성능에 대한 정량적 벤치마크를 제시합니다. Google의 다른 프리뷰 모델과 비교하여, 이 모델은 컨텍스트의 폭과 추론의 깊이가 모두 요구되는 가장 까다로운 사용 사례를 대상으로 합니다.

코드 샘플

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

가격

등급	입력 / 1M tokens	출력 / 1M tokens	캐시 읽기 / 1M	캐시 쓰기 / 1M
≤ 200K	$2.00	$12.00	$0.200	$0.375
≤ ∞	$4.00	$18.00	$0.400	$0.375
등급은 요청별 입력 토큰 수에 따라 결정됩니다

성능

최근 7일

p50 TTFT

5.71 s

출력 속도

429 tok/s

p95 TTFT

10.00 s

오류율

공개 벤치마크

마지막 평가 2026-02-19

55.5

AA Coding

비교된 모델 중 75%보다 우수

57.2

AA Intelligence

비교된 모델 중 80%보다 우수

GPQA Diamond

94.1

Humanity's Last Exam

44.7

IFBench

77.1

Long-Context Recall

72.7

SciCode

58.9

TerminalBench Hard

53.8

τ²-Bench

95.6

소스: artificialanalysis.ai

Google의 다른 모델

google의 모든 모델 보기 →

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

입력 $4.00 · 출력 $18.00 / 100만

1.05M 컨텍스트· 품질 10/10

Gemini 3 Flash Preview최저가

google/gemini-3-flash-preview

입력 $0.50 · 출력 $3.00 / 100만

1.05M 컨텍스트· 품질 9/10

Gemini 3.5 Flash

google/gemini-3.5-flash

입력 $1.50 · 출력 $9.00 / 100만

1.05M 컨텍스트· 품질 9/10

FAQ

OrcaRouter에서 Gemini 3.1 Pro Preview를 사용하는 비용은 얼마인가요?

가용한 정보에는 가격 세부 정보가 포함되어 있지 않습니다. 플래그십 모델로서 일반적으로 소형 모델보다 토큰당 가격이 높습니다. 비용은 입력 및 출력 토큰 사용량에 따라 달라집니다. 정확한 요금은 OrcaRouter의 현재 가격 페이지를 확인하세요.

컨텍스트 윈도우는 얼마나 큰가요?

이 모델은 1,048,576개의 토큰(입력) 컨텍스트 윈도우를 지원합니다. 즉, 매우 긴 문서, 코드 또는 대화 내역을 한 번의 요청으로 제출할 수 있습니다. 최대 출력은 65,536개의 토큰입니다.

이 모델의 주요 강점은 무엇인가요?

주요 강점으로는 방대한 컨텍스트 윈도우(1M 토큰), 높은 출력 제한(65K 토큰), 멀티모달 입력(오디오, 파일, 이미지, 텍스트, 비디오), 그리고 에이전트 작업에서 높은 정확도를 나타내는 95.6의 강력한 τ²-Bench 점수가 있습니다.

Gemini 3.1 Pro Preview는 Gemini 2.0 모델과 어떻게 비교되나요?

훨씬 더 큰 컨텍스트 창(1M 대 최대 32K)과 더 높은 출력 한도(65K 대 8K)를 제공합니다. 또한 더 많은 입력 모드를 지원합니다. 하지만 프리뷰 버전으로, Gemini 2.0 안정 릴리스보다 안정성이 떨어질 수 있습니다.

OrcaRouter가 요청에 대한 데이터 개인 정보 보호를 처리합니까?

제공된 사실에는 데이터 처리 정책이 명시되어 있지 않습니다. 사용자는 OrcaRouter의 데이터 처리 및 개인정보 보호 문서를 검토하여 입력 및 출력 데이터가 어떻게 처리되는지 이해해야 합니다.

이 모델을 OpenAI-compatible API를 통해 어떻게 호출하나요?

기본 URL https://api.orcarouter.ai/v1을 사용하고 모델 ID를 "google/gemini-3.1-pro-preview"로 설정하십시오. API는 표준 OpenAI 채팅 완료 형식을 따릅니다. 인증을 위해서는 OrcaRouter의 API 키가 필요합니다.

τ²-Bench 점수는 무엇이며 왜 중요한가요?

해당 모델은 작업 완료 성능을 측정하는 벤치마크인 τ²-Bench에서 95.6점을 기록했습니다. 이 정량적 지표는 모델이 복잡한 다단계 작업을 정확하게 처리할 수 있는 능력을 반영합니다.

이 모델을 프로덕션에 사용할 수 있나요?

프리뷰 모델로서 테스트 및 실험 목적으로 제공됩니다. 이 모델은 낮은 속도 제한, 낮은 신뢰성, 지속적인 변경이 있을 수 있습니다. 프로덕션 환경에서는 안정적인 비프리뷰 모델을 사용하는 것을 고려하세요.

어떤 입력 방식을 지원하나요?

이 모델은 오디오, 파일(예: PDF, 코드 파일), 이미지, 텍스트 및 비디오 입력을 지원합니다. 이 모든 것은 교차 모달 추론을 위해 단일 요청에 포함될 수 있습니다.

모델이 스트리밍 응답을 지원합니까?

현재 제공된 정보에는 스트리밍 지원이 명시되어 있지 않습니다. OrcaRouter의 API는 호환 모델에 대해 스트리밍을 지원할 가능성이 있지만, 이 프리뷰에서는 stream 매개변수 사용 가능 여부에 대해 문서를 확인하세요.

이 배지 임베드

블로그 포스트에 붙여넣기

Google: Gemini 3.1 Pro Preview•$2.00/M in•5707ms p50•OrcaRouter를 통해

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="OrcaRouter 의 Google: Gemini 3.1 Pro Preview" /> </a>

Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)

Gemini 3.1 Pro Preview

Google Gemini 3.1 Pro Preview란 무엇인가요?

이 모델은 누가 사용해야 하나요?

주요 사양은 무엇인가요?

다른 Gemini previews와 비교하면 어떻습니까?

어떤 입력 방식을 처리하나요?

얼마나 큰 컨텍스트 윈도우를 제공하나요?

이 모델의 가장 좋은 사용 사례는 무엇인가요?

언제 더 저렴한 모델을 대신 사용해야 합니까?

τ²-Bench 점수는 무엇이며, 이는 무엇을 의미하나요?

속도와 레이턴시에 대해 알려진 것은 무엇인가요?

사용 가능한 데이터를 기반으로 모델의 강점은 무엇인가요?

고려해야 할 솔직한 한계점들은 무엇인가요?

OrcaRouter에서 이 모델의 가격 구조는 어떻게 되나요?

사용자들이 고려해야 할 비용 트레이드오프는 무엇인가요?

비용을 줄이기 위해 캐싱을 사용할 수 있나요?

다른 Google 모델들과 비교했을 때 예상 비용은 얼마인가요?

OrcaRouter의 API를 통해 모델을 어떻게 호출하나요?

어떤 매개변수를 구성할 수 있나요?

다른 제공업체에서 OrcaRouter로 마이그레이션하려면 어떻게 해야 하나요?

API를 사용할 때 미리보기 상태에 대해 알아야 할 사항은 무엇인가요?