google/gemini-3.1-flash-lite

google/gemini-3.1-flash-lite
제공 google
입력$0.25/ 100만 토큰
출력$1.50/ 100만 토큰
p50 TTFT623 ms7일
p95 TTFT623 ms7일
트래픽6.6M토큰 / 7일
코드 샘플
from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-flash-lite",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)
가격
입력 / 1M tokens$0.250
출력 / 1M tokens$1.50
캐시 읽기 / 1M$0.025
통화USD
성능
p50 TTFT
623 ms
출력 속도
p95 TTFT
623 ms
오류율
0.68%
공개 벤치마크
공개 벤치마크 점수가 아직 수집되지 않았습니다.
google의 다른 모델
FAQ
OrcaRouter에서 google/gemini-3.1-flash-lite 비용은 얼마인가요?
google/gemini-3.1-flash-lite는 OrcaRouter를 통해 1M 입력 토큰당 $0.25, 1M 출력 토큰당 $1.50에 가격이 책정되어 있습니다. 가격은 라우팅 레이어에서 실시간으로 가져옵니다.
google/gemini-3.1-flash-lite의 컨텍스트 윈도우는 얼마인가요?
google/gemini-3.1-flash-lite는 — 토큰의 컨텍스트 윈도우를 지원합니다. 해당 제한까지 롱 컨텍스트 기능(RAG, 요약)을 사용하세요.
OpenAI SDK를 통해 google/gemini-3.1-flash-lite를 호출하려면 어떻게 하나요?
OpenAI base_url을 https://api.orcarouter.ai/v1로 설정하고, OrcaRouter API 키를 제공한 후, chat.completions.create 호출에서 model="google/gemini-3.1-flash-lite"를 전달하세요.
OrcaRouter가 google/gemini-3.1-flash-lite를 속도 제한합니까?
모델별 속도 제한은 OrcaRouter 플랜을 따릅니다. 무료 티어는 보수적인 한도로 제공되며, 유료 티어는 한도를 높입니다. 현재 할당량은 /pricing에서 확인하세요.
이 배지 임베드
google/gemini-3.1-flash-lite$0.25/M in623ms p50OrcaRouter를 통해
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-flash-lite" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-flash-lite.svg" alt="OrcaRouter 의 google/gemini-3.1-flash-lite" /> </a>
Markdown [![google/gemini-3.1-flash-lite](https://www.orcarouter.ai/embed/google/gemini-3.1-flash-lite.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-flash-lite)