google/gemini-3.1-flash-lite

google/gemini-3.1-flash-lite
来自 google
输入$0.25/ 百万 tokens
输出$1.50/ 百万 tokens
p50 首字节623 ms7 天
p95 首字节623 ms7 天
流量6.6Mtokens / 7 天
代码示例
from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-flash-lite",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)
价格
输入 / 1M tokens$0.250
输出 / 1M tokens$1.50
缓存读取 / 1M$0.025
货币USD
性能
p50 首字节
623 ms
输出速度
p95 首字节
623 ms
错误率
0.68%
公共基准测试
暂无公开基准评分数据。
更多 google 模型
常见问题
在 OrcaRouter 上,google/gemini-3.1-flash-lite 的价格是多少?
google/gemini-3.1-flash-lite 通过 OrcaRouter 的定价为每百万输入 token $0.25,每百万输出 token $1.50。定价从路由层实时获取。
google/gemini-3.1-flash-lite的上下文窗口是多少?
google/gemini-3.1-flash-lite 支持 — 个 token 的上下文窗口。可使用长上下文功能(RAG、摘要)直至该限制。
如何通过 OpenAI SDK 调用 google/gemini-3.1-flash-lite?
将 OpenAI base_url 设置为 https://api.orcarouter.ai/v1,提供您的 OrcaRouter API 密钥,并在 chat.completions.create 调用中传递 model="google/gemini-3.1-flash-lite"。
OrcaRouter 是否对 google/gemini-3.1-flash-lite 进行速率限制?
每个模型的速率限制遵循您的 OrcaRouter 计划。免费套餐设有保守的上限;付费套餐则会提升这些上限。请查看 /pricing 了解当前配额。
嵌入此徽章
google/gemini-3.1-flash-lite$0.25/M in623ms p50通过 OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-flash-lite" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-flash-lite.svg" alt="google/gemini-3.1-flash-lite 在 OrcaRouter" /> </a>
Markdown [![google/gemini-3.1-flash-lite](https://www.orcarouter.ai/embed/google/gemini-3.1-flash-lite.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-flash-lite)