google/gemini-3.1-flash-lite

Name: google/gemini-3.1-flash-lite API
Brand: google

제공 google

엔드포인트:/v1/chat/completions /v1beta/models/{model}:generateContent

p50 TTFT759 ms

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

입력$0.25/ 100만 토큰

출력$1.50/ 100만 토큰

p50 TTFT759 ms7일

p95 TTFT1.37 s7일

트래픽4.4M토큰 / 7일

google/gemini-3.1-flash-lite API 받기 →▶ Playground에서 사용해보기 </> API로 사용

코드 샘플

어떤 SDK에서도 호출

OpenAI 호환 — 쓰던 SDK 그대로

OpenAI SDKhttps://api.orcarouter.ai/v1
Gemini SDKhttps://api.orcarouter.ai

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-flash-lite",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

가격

입력 / 1M tokens	$0.250
출력 / 1M tokens	$1.50
캐시 읽기 / 1M	$0.025
통화	USD

비용 계산기

월 토큰 수10MM

70%

정가 기준 추정치

토큰 및 비용 추정기

예상 출력 토큰

입력 토큰: 9요청당 비용: $0.000752

추정치일 뿐입니다 — 실제 토큰 수는 제공자의 토크나이저에 따라 달라집니다.

성능

최근 7일

p50 TTFT

759 ms

출력 속도

19.0 tok/s

p95 TTFT

1.37 s

오류율

공개 벤치마크

대기 중

Design Arena 작동 방식

소스: Design Arena

비교

	google/gemini-3.1-flash-lite	Gemini 3.1 Pro Preview	Gemini 3.1 Pro Preview Custom Tools	Gemini 3 Flash Preview
입력 $/100만	$0.25	$2.00	$4.00	$0.50
출력 $/100만	$1.50	$12.00	$18.00	$3.00
컨텍스트	—	1.0M	1.0M	1.0M
품질	5/10	10/10	10/10	9/10
나란히 비교		나란히 비교	나란히 비교	나란히 비교

google의 다른 모델

google의 모든 모델 보기 →

Gemini 3.5 Flash최저가

google/gemini-3.5-flash

입력 $1.50 · 출력 $9.00 / 100만

1.05M 컨텍스트· 품질 9/10

나란히 비교

Gemini 3.6 Flash신규

google/gemini-3.6-flash

입력 $1.50 · 출력 $7.50 / 100만

1.05M 컨텍스트· 품질 8/10

나란히 비교

google/gemini-pro-latest

google/gemini-pro-latest

입력 $4.00 · 출력 $18.00 / 100만

· 품질 8/10

나란히 비교

FAQ

OrcaRouter에서 google/gemini-3.1-flash-lite 비용은 얼마인가요?

google/gemini-3.1-flash-lite는 OrcaRouter를 통해 1M 입력 토큰당 $0.25, 1M 출력 토큰당 $1.50에 가격이 책정되어 있습니다. 가격은 라우팅 레이어에서 실시간으로 가져옵니다.

google/gemini-3.1-flash-lite의 컨텍스트 윈도우는 얼마인가요?

google/gemini-3.1-flash-lite는 — 토큰의 컨텍스트 윈도우를 지원합니다. 해당 제한까지 롱 컨텍스트 기능(RAG, 요약)을 사용하세요.

OpenAI SDK를 통해 google/gemini-3.1-flash-lite를 호출하려면 어떻게 하나요?

OpenAI base_url을 https://api.orcarouter.ai/v1로 설정하고, OrcaRouter API 키를 제공한 후, chat.completions.create 호출에서 model="google/gemini-3.1-flash-lite"를 전달하세요.

OrcaRouter가 google/gemini-3.1-flash-lite를 속도 제한합니까?

모델별 속도 제한은 OrcaRouter 플랜을 따릅니다. 무료 티어는 보수적인 한도로 제공되며, 유료 티어는 한도를 높입니다. 현재 할당량은 /pricing에서 확인하세요.

이 배지 임베드

블로그 포스트에 붙여넣기

google/gemini-3.1-flash-lite•$0.25/M in•759ms p50•OrcaRouter를 통해

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-flash-lite" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-flash-lite.svg" alt="OrcaRouter 의 google/gemini-3.1-flash-lite" /> </a>

Markdown [![google/gemini-3.1-flash-lite](https://www.orcarouter.ai/embed/google/gemini-3.1-flash-lite.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-flash-lite)

모델 카드를 데이터로

GET /api/public/models/google/gemini-3.1-flash-lite열기

기계 판독 가능:/llms.txt /llms-full.txt