Gemini 3 Flash Preview

google/gemini-3-flash-preview
제공 Google · 2025-12-17

Google Gemini 3 Flash Preview – 1M 토큰 컨텍스트를 갖춘 멀티모달 모델, 88.2 MMLU-Pro, OrcaRouter를 통해 접근 가능.

컨텍스트1.05M 토큰
입력text + image + file + audio + video
출력text
p50 TTFT3.81 s
입력$0.50/ 100만 토큰
출력$3.00/ 100만 토큰
p50 TTFT3.81 s7일
p95 TTFT10.00 s7일
트래픽1.1M토큰 / 7일

모델 세부정보

Google Gemini 3 Flash Preview란 무엇인가요?

Google Gemini 3 Flash Preview는 Google이 개발한 멀티모달 모델로, 속도와 대규모 컨텍스트 처리에 최적화되어 있습니다. 텍스트, 이미지, 파일, 오디오, 비디오 형식의 입력을 받아들이며 최대 65,536개의 토큰을 출력할 수 있습니다. 이 모델은 1,048,576개의 토큰으로 구성된 컨텍스트 창을 가지고 있어 매우 긴 시퀀스를 추론할 수 있습니다. MMLU-Pro 벤치마크에서 88.2점을 기록하여 다양한 학문 및 추론 작업에서 강력한 성능을 나타냅니다. 이 프리뷰 버전은 OrcaRouter의 OpenAI 호환 API를 통해 모델 ID google/gemini-3-flash-preview로 제공됩니다.

이 모델의 대상 사용자는 누구인가요?

Gemini 3 Flash Preview는 대규모 컨텍스트와 함께 빠른 멀티모달 추론이 필요한 애플리케이션을 구축하는 개발자 및 조직을 대상으로 합니다. 이는 비디오 분석, 장문 문서 요약, 실시간 오디오-비디오 이해와 같은 사용 사례에 적합합니다. 모델의 가격은 입력 토큰 100만 개당 $0.50, 출력 토큰 100만 개당 $3.00으로, 스타트업과 기업 모두 접근하기 쉽습니다. 프리뷰 버전이므로, 초기 사용자는 안정적인 릴리스 전에 기능을 평가할 수 있습니다. OrcaRouter는 OpenAI 호환 엔드포인트와 제공업체 요금에 대한 제로 마크업을 포함하여 이 모델에 대한 원활한 액세스를 제공합니다.

어떤 멀티모달 입력을 지원하나요?

Gemini 3 Flash Preview는 다섯 가지 입력 모드를 지원합니다: 텍스트, 이미지, 파일, 오디오, 비디오. 텍스트는 일반 텍스트 또는 구조화된 텍스트일 수 있고, 이미지는 사진, 다이어그램, 스크린샷을 포함할 수 있으며, 파일은 PDF 및 문서와 같은 형식을 포함하고, 오디오는 음성과 음악을 포함하며, 비디오는 시각 및 오디오 트랙을 모두 처리할 수 있습니다. 이 모델은 단일 프롬프트에서 여러 모드를 결합할 수 있습니다. 예를 들어 비디오를 분석하면서 첨부된 PDF를 읽는 것이 가능합니다. 이러한 다용도성 덕분에 별도의 파이프라인 없이도 복잡한 혼합 미디어 작업을 처리할 수 있습니다. 입력 토큰은 각 모드의 특정 토크나이저 규칙에 따라 계산됩니다.

미리보기 상태는 무엇이며 얼마나 안정적인가요?

Gemini 3 Flash Preview는 Google의 3세대 Flash 모델의 사전 출시 버전입니다. 프리뷰 버전이므로 동작, 성능 및 가용성에 변경이 있을 수 있습니다. Google은 일반적으로 사용자 피드백을 기반으로 프리뷰 모델을 업데이트하며, 결국 프리뷰 엔드포인트를 안정적인 릴리스로 대체할 수 있습니다. 이 모델은 기능적이며 테스트 및 개발에 적합하지만, 프로덕션 배포 시에는 업데이트를 모니터링해야 합니다. OrcaRouter는 제공자의 엔드포인트를 미러링하여 Google의 변경 사항이 신속하게 반영되도록 보장합니다. 모델 ID google/gemini-3-flash-preview는 Google이 이름을 변경하지 않는 한 일관성을 유지합니다.

코드 샘플

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

가격

입력 / 1M tokens$0.500
출력 / 1M tokens$3.00
캐시 읽기 / 1M$0.050
통화USD

성능

p50 TTFT
3.81 s
출력 속도
851 tok/s
p95 TTFT
10.00 s
오류율
0%

공개 벤치마크

37.8
AA Coding
비교된 모델 중 47%보다 우수
35.0
AA Intelligence
비교된 모델 중 35%보다 우수
55.7
AA Math
비교된 모델 중 32%보다 우수
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
소스: artificialanalysis.ai

Google의 다른 모델

FAQ

Gemini 3 Flash Preview를 사용하는 비용은 얼마인가요?
가격은 백만 입력 토큰당 $0.50이고 백만 출력 토큰당 $3.00이며, 공급업체 요율로 청구되며 OrcaRouter에서 추가 마크업은 없습니다.
컨텍스트 윈도우 크기는 얼마인가요?
컨텍스트 창은 입력에 대해 1,048,576개의 토큰이며, 모델은 최대 65,536개의 출력 토큰을 생성할 수 있습니다.
지원되는 입력 방식은 무엇인가요?
텍스트, 이미지, 파일, 오디오, 비디오는 모두 입력으로 허용됩니다. 출력은 텍스트만 가능합니다.
Gemini 2 Flash와 어떻게 비교되나요?
Gemini 3 Flash Preview는 더 큰 컨텍스트 윈도우(1M 대 최대 1M지만 종종 더 작은), 더 높은 MMLU-Pro 점수(88.2), 그리고 비디오를 포함한 확장된 멀티모달 지원을 가지고 있습니다. 복잡한 작업에 대해 더 빠르고 더 능숙하지만, Gemini 2 Flash는 토큰당 더 저렴합니다.
OrcaRouter는 데이터 프라이버시를 어떻게 처리하나요?
OrcaRouter는 사용자의 요청을 Google의 API로 전달합니다. 데이터 처리는 Google의 개인정보 보호정책을 따릅니다. OrcaRouter는 요청을 처리하는 데 필요한 범위를 넘어서는 콘텐츠를 기록하거나 저장하지 않습니다. 자세한 내용은 두 제공업체의 정책을 확인하세요.
OpenAI 호환 API를 사용하여 Gemini 3 Flash Preview를 호출할 수 있나요?
네. OrcaRouter의 API(https://api.orcarouter.ai/v1)를 사용하고 모델 ID는 "google/gemini-3-flash-preview"입니다. 인증은 OrcaRouter API 키를 사용합니다. 요청 및 응답 형식은 OpenAI의 Chat Completions 스키마를 따릅니다.
모델의 주요 장점은 무엇인가요?
빠른 추론 속도, 1M 토큰의 큰 컨텍스트, 멀티모달 입력(텍스트, 이미지, 파일, 오디오, 비디오), 강력한 MMLU-Pro 벤치마크(88.2), 더 큰 모델 대비 낮은 비용.
Gemini 3 Flash Preview를 프로덕션에서 사용할 수 있나요?
프리뷰 버전입니다. 즉, 변경될 수 있고 간헐적으로만 사용 가능하거나 지원이 제한될 수 있습니다. 테스트 및 개발에 적합하며, 중요한 프로덕션 워크로드의 경우 사용 가능한 안정적인 릴리스를 사용하는 것을 고려하세요.
다중 모드 입력에 대한 토큰 사용량을 어떻게 추정하나요?
각 모달리티는 고유한 토큰화 방식을 가지고 있습니다. 이미지, 오디오, 비디오는 해상도와 길이에 따라 토큰으로 분할됩니다. OrcaRouter는 API 응답에서 토큰 사용량을 보고합니다. 자세한 토큰 계산 규칙은 Google의 문서를 참조할 수도 있습니다.
컨텍스트 윈도우를 초과하면 어떻게 되나요?
입력이 1,048,576 토큰을 초과하면 가장 오래된 콘텐츠부터 잘려 나갑니다. 모델은 초과된 토큰을 무시합니다. 요청의 총 토큰 수를 모니터링하여 메시지가 제한 내에 맞도록 하십시오.

이 배지 임베드

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50OrcaRouter를 통해
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="OrcaRouter 의 Google: Gemini 3 Flash Preview" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)