Gemini 3.5 Flash

google/gemini-3.5-flash
제공 google · 2026-05-23

Google의 효율적인 멀티모달 모델: 1M 컨텍스트, 높은 출력, OrcaRouter를 통한 비용 효율적인 가격.

컨텍스트1.05M 토큰
입력text + image + video + file + audio
출력text
p50 TTFT10.00 s
입력$1.50/ 100만 토큰
출력$9.00/ 100만 토큰
p50 TTFT10.00 s7일
p95 TTFT10.00 s7일
트래픽4.5M토큰 / 7일

모델 세부정보

Gemini 3.5 Flash는 무엇인가요?

Gemini 3.5 Flash는 Google이 개발한 대규모 언어 모델로, 속도와 효율성에 맞게 미세 조정되었습니다. 이는 Gemini 제품군에 속하며, 텍스트, 이미지, 비디오, 파일, 오디오 등 멀티모달 입력을 처리하면서 빠른 응답을 제공하도록 설계되었습니다. 이 모델은 1,048,576개의 토큰을 지원하는 컨텍스트 윈도우를 갖추고 있어, 전체 책, 1시간 분량의 비디오, 방대한 코드 저장소와 같은 매우 긴 시퀀스를 처리할 수 있습니다. 최대 출력 길이가 65,536개의 토큰이므로 전체 보고서나 긴 코드 파일 등 긴 생성이 가능합니다. Gemini 3.5 Flash는 OrcaRouter의 OpenAI 호환 API를 통해 액세스할 수 있으며, 이는 최소한의 코드 변경으로 기존 애플리케이션에 통합할 수 있음을 의미합니다.

Gemini 3.5 Flash는 누가 사용해야 하나요?

Gemini 3.5 Flash는 높은 처리량, 낮은 지연 시간, 비용 간의 균형이 필요한 개발자와 조직에 이상적입니다. 특히 실시간 챗봇, 콘텐츠 조정 파이프라인, 자동화된 고객 지원과 같이 추론 속도가 중요한 프로덕션 환경에 적합합니다. 넉넉한 컨텍스트 창은 데이터를 청크하지 않고 대규모 데이터셋, 긴 문서, 방대한 대화 기록을 분석해야 하는 사용자에게 유용합니다. 또한 이미지 캡셔닝, 비디오 요약, 오디오 전사와 같은 멀티모달 애플리케이션을 구축하는 팀은 여러 입력 유형에 대한 기본 지원을 활용할 수 있습니다. 워크로드에 극도로 높은 추론 능력이나 복잡한 수학이 필요한 경우, 더 강력하지만 느린 모델을 대신 고려하십시오.

Gemini 3.5 Flash는 어떤 입력 모달리티를 지원하나요?

Gemini 3.5 Flash는 텍스트, 이미지, 동영상, 파일, 오디오의 다섯 가지 입력 모달을 지원합니다. 텍스트 입력은 일반 문자열 또는 구조화된 메시지일 수 있습니다. 이미지는 base64로 인코딩된 데이터나 URL로 전달할 수 있으며, 모델은 차트, 다이어그램, 사진과 같은 시각적 콘텐츠를 해석할 수 있습니다. 동영상 입력은 프레임 시퀀스 또는 압축된 동영상 파일로 지원되어, 모델이 움직임과 시간적 변화를 분석할 수 있습니다. 파일 입력은 PDF, DOCX, 코드 파일 등의 일반적인 형식을 포함하며, 모델은 해당 콘텐츠를 추출하고 추론할 수 있습니다. 오디오 입력은 원시 또는 압축(예: MP3, WAV) 형식을 지원하여 음성 전사 및 소리 분석을 가능하게 합니다. 모든 모달은 단일 요청에서 조합할 수 있으므로, Gemini 3.5 Flash는 다중 모달 작업에 적합한 다용도 도구입니다.

Gemini 3.5 Flash는 OrcaRouter를 통해 어떻게 접근하나요?

OrcaRouter는 OpenAI 호환 API를 통해 Gemini 3.5 Flash를 제공합니다. 기본 URL은 https://api.orcarouter.ai/v1이며, 특정 모델 ID는 "google/gemini-3.5-flash"입니다. OpenAI SDK나 직접 HTTP 요청을 통해 기본 URL과 모델 이름만 변경하면 호출할 수 있습니다. 인증은 OrcaRouter에서 제공하는 API 키를 통해 처리됩니다. API는 표준 채팅 완료 엔드포인트, 스트리밍 및 온도, top_p, max_tokens와 같은 선택적 매개변수를 지원합니다. OrcaRouter는 제공업체 요금에 마크업을 추가하지 않으므로, 입력 토큰 1M개당 정확히 $1.50, 출력 토큰 1M개당 $9.00를 지불합니다. 추가 게이트웨이 수수료는 없습니다.

코드 샘플

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

가격

입력 / 1M tokens$1.50
출력 / 1M tokens$9.00
캐시 읽기 / 1M$0.150
캐시 쓰기 / 1M$0.083
통화USD

성능

p50 TTFT
10.00 s
출력 속도
10766 tok/s
p95 TTFT
10.00 s
오류율
0.44%

공개 벤치마크

49.0
AA Coding
비교된 모델 중 68%보다 우수
47.0
AA Intelligence
비교된 모델 중 58%보다 우수
51.0
AA Math
비교된 모델 중 27%보다 우수
GPQA Diamond
45.0 index
MMLU-Pro
59.0 index
τ²-Bench
42.0 index
소스: artificialanalysis.ai

google의 다른 모델

FAQ

OrcaRouter에서 Gemini 3.5 Flash의 가격은 얼마인가요?
입력 토큰은 1백만 개당 $1.50이며, 출력 토큰은 1백만 개당 $9.00입니다. OrcaRouter는 공급업체 요율로 청구하며 마크업이 없습니다. 추가 수수료는 없습니다.
Gemini 3.5 Flash의 컨텍스트 윈도우 크기는 얼마인가요?
1,048,576개의 토큰(약 100만 개의 토큰)으로 구성된 컨텍스트 윈도우를 지원합니다. 이는 입력 토큰과 출력 토큰을 모두 합친 것입니다.
Gemini 3.5 Flash의 주요 강점은 무엇인가요?
저지연, 고처리량, 비용 효율성에 최적화되어 있습니다. 멀티모달 입력(텍스트, 이미지, 비디오, 파일, 오디오)과 큰 컨텍스트 창을 지원하므로 실시간 애플리케이션 및 긴 문서 처리에 이상적입니다.
Gemini 3.5 Flash와 Gemini 3.5 Pro는 어떻게 비교되나요?
Flash는 더 빠르고 저렴하지만, 복잡한 추론 및 수학 작업에서 벤치마크 성능이 낮습니다. Pro는 더 정확하지만 더 느리고 비쌉니다. Flash는 대량 처리와 지연 시간에 민감한 애플리케이션에 더 적합합니다.
OrcaRouter를 통해 Gemini 3.5 Flash를 사용할 때 데이터는 어떻게 처리되나요?
OrcaRouter는 프록시 역할을 하며 사용자의 데이터를 저장하지 않습니다. 그러나 Google의 데이터 처리 정책이 기본 모델에 적용됩니다. OrcaRouter는 데이터 보관 및 개인정보 보호에 관한 Google의 약관을 검토할 것을 권장합니다.
OpenAI 호환 API를 사용하여 Gemini 3.5 Flash를 어떻게 호출하나요?
기본 URL https://api.orcarouter.ai/v1, 모델 ID "google/gemini-3.5-flash"를 사용하고, Authorization 헤더에 OrcaRouter API 키를 전달하세요. 이 API는 표준 채팅 완료 및 스트리밍을 지원합니다.
Gemini 3.5 Flash가 생성할 수 있는 출력 길이는 얼마인가요?
응답당 최대 65,536개의 토큰을 생성할 수 있습니다. 이는 많은 모델보다 훨씬 큰 양으로, 장문의 콘텐츠, 코드, 또는 확장된 추론을 가능하게 합니다.
반복되거나 캐시된 토큰에 대한 할인이 있나요?
제공된 사실에 따르면, OrcaRouter는 캐싱이나 볼륨 할인을 제공하지 않습니다. 각 토큰은 재사용 여부와 관계없이 표준 요금으로 청구됩니다.

이 배지 임베드

Gemini 3.5 Flash$1.50/M in10000ms p50OrcaRouter를 통해
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="OrcaRouter 의 Gemini 3.5 Flash" /> </a>
Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)