Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

제공 google · 2026-05-23

Google의 효율적인 멀티모달 모델: 1M 컨텍스트, 높은 출력, OrcaRouter를 통한 비용 효율적인 가격.

엔드포인트:/v1/chat/completions /v1beta/models/{model}:generateContent

컨텍스트1.05M 토큰

입력text + image + video + file + audio

출력text

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

입력$1.50/ 100만 토큰

출력$9.00/ 100만 토큰

p50 TTFT10.00 s7일

p95 TTFT10.00 s7일

트래픽4.5M토큰 / 7일

Gemini 3.5 Flash API 받기 →▶ Playground에서 사용해보기 </> API로 사용

Gemini 3.5 Flash는 무엇인가요?

Gemini 3.5 Flash는 Google이 개발한 대규모 언어 모델로, 속도와 효율성에 맞게 미세 조정되었습니다. 이는 Gemini 제품군에 속하며, 텍스트, 이미지, 비디오, 파일, 오디오 등 멀티모달 입력을 처리하면서 빠른 응답을 제공하도록 설계되었습니다. 이 모델은 1,048,576개의 토큰을 지원하는 컨텍스트 윈도우를 갖추고 있어, 전체 책, 1시간 분량의 비디오, 방대한 코드 저장소와 같은 매우 긴 시퀀스를 처리할 수 있습니다. 최대 출력 길이가 65,536개의 토큰이므로 전체 보고서나 긴 코드 파일 등 긴 생성이 가능합니다. Gemini 3.5 Flash는 OrcaRouter의 OpenAI 호환 API를 통해 액세스할 수 있으며, 이는 최소한의 코드 변경으로 기존 애플리케이션에 통합할 수 있음을 의미합니다.

Gemini 3.5 Flash는 누가 사용해야 하나요?

Gemini 3.5 Flash는 높은 처리량, 낮은 지연 시간, 비용 간의 균형이 필요한 개발자와 조직에 이상적입니다. 특히 실시간 챗봇, 콘텐츠 조정 파이프라인, 자동화된 고객 지원과 같이 추론 속도가 중요한 프로덕션 환경에 적합합니다. 넉넉한 컨텍스트 창은 데이터를 청크하지 않고 대규모 데이터셋, 긴 문서, 방대한 대화 기록을 분석해야 하는 사용자에게 유용합니다. 또한 이미지 캡셔닝, 비디오 요약, 오디오 전사와 같은 멀티모달 애플리케이션을 구축하는 팀은 여러 입력 유형에 대한 기본 지원을 활용할 수 있습니다. 워크로드에 극도로 높은 추론 능력이나 복잡한 수학이 필요한 경우, 더 강력하지만 느린 모델을 대신 고려하십시오.

Gemini 3.5 Flash는 어떤 입력 모달리티를 지원하나요?

Gemini 3.5 Flash는 텍스트, 이미지, 동영상, 파일, 오디오의 다섯 가지 입력 모달을 지원합니다. 텍스트 입력은 일반 문자열 또는 구조화된 메시지일 수 있습니다. 이미지는 base64로 인코딩된 데이터나 URL로 전달할 수 있으며, 모델은 차트, 다이어그램, 사진과 같은 시각적 콘텐츠를 해석할 수 있습니다. 동영상 입력은 프레임 시퀀스 또는 압축된 동영상 파일로 지원되어, 모델이 움직임과 시간적 변화를 분석할 수 있습니다. 파일 입력은 PDF, DOCX, 코드 파일 등의 일반적인 형식을 포함하며, 모델은 해당 콘텐츠를 추출하고 추론할 수 있습니다. 오디오 입력은 원시 또는 압축(예: MP3, WAV) 형식을 지원하여 음성 전사 및 소리 분석을 가능하게 합니다. 모든 모달은 단일 요청에서 조합할 수 있으므로, Gemini 3.5 Flash는 다중 모달 작업에 적합한 다용도 도구입니다.

Gemini 3.5 Flash는 OrcaRouter를 통해 어떻게 접근하나요?

OrcaRouter는 OpenAI 호환 API를 통해 Gemini 3.5 Flash를 제공합니다. 기본 URL은 https://api.orcarouter.ai/v1이며, 특정 모델 ID는 "google/gemini-3.5-flash"입니다. OpenAI SDK나 직접 HTTP 요청을 통해 기본 URL과 모델 이름만 변경하면 호출할 수 있습니다. 인증은 OrcaRouter에서 제공하는 API 키를 통해 처리됩니다. API는 표준 채팅 완료 엔드포인트, 스트리밍 및 온도, top_p, max_tokens와 같은 선택적 매개변수를 지원합니다. OrcaRouter는 제공업체 요금에 마크업을 추가하지 않으므로, 입력 토큰 1M개당 정확히 $1.50, 출력 토큰 1M개당 $9.00를 지불합니다. 추가 게이트웨이 수수료는 없습니다.

코드 샘플

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

가격

입력 / 1M tokens	$1.50
출력 / 1M tokens	$9.00
캐시 읽기 / 1M	$0.150
캐시 쓰기 / 1M	$0.083
통화	USD

성능

최근 7일

p50 TTFT

10.00 s

출력 속도

10766 tok/s

p95 TTFT

10.00 s

오류율

0.44%

공개 벤치마크

마지막 평가 2026-06-25

49.0

AA Coding

비교된 모델 중 68%보다 우수

47.0

AA Intelligence

비교된 모델 중 58%보다 우수

51.0

AA Math

비교된 모델 중 27%보다 우수

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

소스: artificialanalysis.ai

google의 다른 모델

google의 모든 모델 보기 →

Gemini 3.1 Pro Preview플래그십

google/gemini-3.1-pro-preview

입력 $2.00 · 출력 $12.00 / 100만

1.05M 컨텍스트· 품질 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

입력 $4.00 · 출력 $18.00 / 100만

1.05M 컨텍스트· 품질 10/10

Gemini 3 Flash Preview최저가

google/gemini-3-flash-preview

입력 $0.50 · 출력 $3.00 / 100만

1.05M 컨텍스트· 품질 9/10

FAQ

OrcaRouter에서 Gemini 3.5 Flash의 가격은 얼마인가요?

입력 토큰은 1백만 개당 $1.50이며, 출력 토큰은 1백만 개당 $9.00입니다. OrcaRouter는 공급업체 요율로 청구하며 마크업이 없습니다. 추가 수수료는 없습니다.

Gemini 3.5 Flash의 컨텍스트 윈도우 크기는 얼마인가요?

1,048,576개의 토큰(약 100만 개의 토큰)으로 구성된 컨텍스트 윈도우를 지원합니다. 이는 입력 토큰과 출력 토큰을 모두 합친 것입니다.

Gemini 3.5 Flash의 주요 강점은 무엇인가요?

저지연, 고처리량, 비용 효율성에 최적화되어 있습니다. 멀티모달 입력(텍스트, 이미지, 비디오, 파일, 오디오)과 큰 컨텍스트 창을 지원하므로 실시간 애플리케이션 및 긴 문서 처리에 이상적입니다.

Gemini 3.5 Flash와 Gemini 3.5 Pro는 어떻게 비교되나요?

Flash는 더 빠르고 저렴하지만, 복잡한 추론 및 수학 작업에서 벤치마크 성능이 낮습니다. Pro는 더 정확하지만 더 느리고 비쌉니다. Flash는 대량 처리와 지연 시간에 민감한 애플리케이션에 더 적합합니다.

OrcaRouter를 통해 Gemini 3.5 Flash를 사용할 때 데이터는 어떻게 처리되나요?

OrcaRouter는 프록시 역할을 하며 사용자의 데이터를 저장하지 않습니다. 그러나 Google의 데이터 처리 정책이 기본 모델에 적용됩니다. OrcaRouter는 데이터 보관 및 개인정보 보호에 관한 Google의 약관을 검토할 것을 권장합니다.

OpenAI 호환 API를 사용하여 Gemini 3.5 Flash를 어떻게 호출하나요?

기본 URL https://api.orcarouter.ai/v1, 모델 ID "google/gemini-3.5-flash"를 사용하고, Authorization 헤더에 OrcaRouter API 키를 전달하세요. 이 API는 표준 채팅 완료 및 스트리밍을 지원합니다.

Gemini 3.5 Flash가 생성할 수 있는 출력 길이는 얼마인가요?

응답당 최대 65,536개의 토큰을 생성할 수 있습니다. 이는 많은 모델보다 훨씬 큰 양으로, 장문의 콘텐츠, 코드, 또는 확장된 추론을 가능하게 합니다.

반복되거나 캐시된 토큰에 대한 할인이 있나요?

제공된 사실에 따르면, OrcaRouter는 캐싱이나 볼륨 할인을 제공하지 않습니다. 각 토큰은 재사용 여부와 관계없이 표준 요금으로 청구됩니다.

이 배지 임베드

블로그 포스트에 붙여넣기

Gemini 3.5 Flash•$1.50/M in•10000ms p50•OrcaRouter를 통해

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="OrcaRouter 의 Gemini 3.5 Flash" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

Gemini 3.5 Flash는 무엇인가요?

Gemini 3.5 Flash는 누가 사용해야 하나요?

Gemini 3.5 Flash는 어떤 입력 모달리티를 지원하나요?

Gemini 3.5 Flash는 OrcaRouter를 통해 어떻게 접근하나요?

Gemini 3.5 Flash가 어떤 작업에 가장 적합한가요?

Gemini 3.5 Flash보다 더 저렴한 모델을 선택해야 하는 경우는 언제인가요?

Gemini 3.5 Flash는 스트리밍과 실시간 상호작용을 처리할 수 있나요?

Gemini 3.5 Flash의 컨텍스트 창을 사용하기 위한 모범 사례는 무엇인가요?

Gemini 3.5 Flash의 알려진 장점은 무엇인가요?

Gemini 3.5 Flash의 솔직한 한계는 무엇인가요?

지연 시간이 다른 모델과 비교하여 어떤가요?

코드와 구조화된 데이터에 대한 모델의 출력 품질은 어떤가요?

Gemini 3.5 Flash는 OrcaRouter에서 어떻게 가격이 책정되나요?

입력 토큰과 출력 토큰 간의 비용 트레이드오프는 무엇인가요?

OrcaRouter는 캐싱이나 할인 기능을 제공하나요?

OrcaRouter에서 다른 모델들과 비용을 어떻게 비교하나요?

OrcaRouter의 API를 통해 Gemini 3.5 Flash를 어떻게 호출하나요?

Gemini 3.5 Flash에 사용 가능한 매개변수는 무엇인가요?

Google AI 또는 Vertex AI API에서 OrcaRouter로 마이그레이션할 수 있나요?

API를 사용할 때 어떤 오류 처리를 기대해야 합니까?

Gemini 3.5 Flash와 Gemini 3.5 Pro는 어떻게 비교되나요?

Gemini 3.5 Flash는 GPT-4o Mini와 어떻게 비교되나요?

Gemini 3.5 Flash는 Claude 3 Haiku와 어떻게 비교되나요?

Gemini 3.5 Flash가 오픈소스 모델에 비해 가지는 주요 장점은 무엇인가요?

코드 샘플

가격

성능

공개 벤치마크

google의 다른 모델

FAQ

이 배지 임베드

Gemini 3.5 Flash

모델 세부정보

Gemini 3.5 Flash는 무엇인가요?

Gemini 3.5 Flash는 누가 사용해야 하나요?

Gemini 3.5 Flash는 어떤 입력 모달리티를 지원하나요?

Gemini 3.5 Flash는 OrcaRouter를 통해 어떻게 접근하나요?

Gemini 3.5 Flash가 어떤 작업에 가장 적합한가요?

Gemini 3.5 Flash보다 더 저렴한 모델을 선택해야 하는 경우는 언제인가요?

Gemini 3.5 Flash는 스트리밍과 실시간 상호작용을 처리할 수 있나요?

Gemini 3.5 Flash의 컨텍스트 창을 사용하기 위한 모범 사례는 무엇인가요?

Gemini 3.5 Flash의 알려진 장점은 무엇인가요?

Gemini 3.5 Flash의 솔직한 한계는 무엇인가요?

지연 시간이 다른 모델과 비교하여 어떤가요?

코드와 구조화된 데이터에 대한 모델의 출력 품질은 어떤가요?

Gemini 3.5 Flash는 OrcaRouter에서 어떻게 가격이 책정되나요?

입력 토큰과 출력 토큰 간의 비용 트레이드오프는 무엇인가요?

OrcaRouter는 캐싱이나 할인 기능을 제공하나요?

OrcaRouter에서 다른 모델들과 비용을 어떻게 비교하나요?

OrcaRouter의 API를 통해 Gemini 3.5 Flash를 어떻게 호출하나요?

Gemini 3.5 Flash에 사용 가능한 매개변수는 무엇인가요?

Google AI 또는 Vertex AI API에서 OrcaRouter로 마이그레이션할 수 있나요?

API를 사용할 때 어떤 오류 처리를 기대해야 합니까?

Gemini 3.5 Flash와 Gemini 3.5 Pro는 어떻게 비교되나요?

Gemini 3.5 Flash는 GPT-4o Mini와 어떻게 비교되나요?

Gemini 3.5 Flash는 Claude 3 Haiku와 어떻게 비교되나요?

Gemini 3.5 Flash가 오픈소스 모델에 비해 가지는 주요 장점은 무엇인가요?

코드 샘플

가격

성능

공개 벤치마크

google의 다른 모델

FAQ

이 배지 임베드