Gemini 3 Flash Preview

google/gemini-3-flash-preview
来自 Google · 2025-12-17

Google Gemini 3 Flash Preview – 多模态模型,拥有1M token上下文,MMLU-Pro得分88.2,可通过OrcaRouter访问。

上下文1.05M tokens
输入模态text + image + file + audio + video
输出模态text
p50 首字节3.81 s
输入$0.50/ 百万 tokens
输出$3.00/ 百万 tokens
p50 首字节3.81 s7 天
p95 首字节10.00 s7 天
流量1.1Mtokens / 7 天

模型详情

什么是Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview是由Google开发的多模态模型,针对速度和长上下文处理进行了优化。它支持文本、图像、文件、音频和视频格式的输入,并可生成最多65,536个令牌的输出。该模型的上下文窗口为1,048,576个令牌,能够在极长序列上进行推理。它在MMLU-Pro基准测试中得分为88.2,表明在广泛的学术和推理任务中具有强劲性能。此预览版本可通过OrcaRouter的兼容OpenAI API使用,模型ID为google/gemini-3-flash-preview。

这个模型的目标受众是谁?

Gemini 3 Flash Preview 面向需要快速多模态推理与长上下文的开发者及组织,适用于视频分析、长文档摘要、实时音视频理解等场景。该模型定价为每百万输入Token 0.50美元、每百万输出Token 3.00美元,对初创企业和大型企业均具可及性。作为预览版,早期采用者可在稳定版发布前评估其能力。OrcaRouter 提供对该模型的无缝接入,包括兼容OpenAI的接口和零加价的提供商费率。

它支持哪些多模态输入?

Gemini 3 Flash Preview 支持五种输入模态:文本、图像、文件、音频和视频。文本可以是纯文本或结构化文本;图像包括照片、图表和截图;文件覆盖 PDF 和文档等格式;音频涵盖语音和音乐;视频则可同时处理视觉和音频轨道。该模型能够在单条提示中组合多种模态——例如,在分析视频的同时读取所附的 PDF。这种多功能性使其能够处理复杂的混合媒体任务,无需独立的处理流程。输入令牌的计数基于每种模态特定的分词器规则。

预览状态指的是软件的实验性或早期版本,稳定性因开发阶段而异。通常预览版功能接近完善但可能存在缺陷,适合测试使用,不建议直接用于生产环境。具体稳定性需结合发布说明和更新日志评估。

Gemini 3 Flash Preview 是谷歌第三代 Flash 模型的预发布版本。作为预览版,其行为、性能及可用性可能会发生变化。谷歌通常会根据用户反馈更新预览模型,并最终可能用稳定版替换预览端点。该模型功能完善,适合测试与开发,但生产部署时应关注更新动态。OrcaRouter 镜像了提供商的端点,确保谷歌的任何变更都能及时反映。模型 ID google/gemini-3-flash-preview 将保持不变,除非谷歌修改其命名。

代码示例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

价格

输入 / 1M tokens$0.500
输出 / 1M tokens$3.00
缓存读取 / 1M$0.050
货币USD

性能

p50 首字节
3.81 s
输出速度
851 tok/s
p95 首字节
10.00 s
错误率
0%

公共基准测试

37.8
AA Coding
优于所参与对比模型中的 47%
35.0
AA Intelligence
优于所参与对比模型中的 35%
55.7
AA Math
优于所参与对比模型中的 32%
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
来源: artificialanalysis.ai

更多 Google 模型

常见问题

使用 Gemini 3 Flash Preview 的成本是多少?
定价为每百万输入令牌0.50美元,每百万输出令牌3.00美元,按提供商费率计费,OrcaRouter不收取任何加价。
上下文窗口大小是多少?
上下文窗口的输入令牌数为1,048,576个,模型最多可生成65,536个输出令牌。
支持的输入模态有哪些?
文本、图像、文件、音频和视频均可作为输入。输出仅为文本。
它和Gemini 2 Flash相比如何?
Gemini 3 Flash Preview 拥有更大的上下文窗口(1M vs 最高1M但通常更小),更高的MMLU-Pro得分(88.2),并扩展了多模态支持,包括视频。它更快速,处理复杂任务的能力更强,但Gemini 2 Flash 的每token成本更低。
OrcaRouter如何处理数据隐私?
OrcaRouter 将您的请求传递给 Google 的 API。数据处理遵循 Google 的隐私政策。OrcaRouter 不会记录或存储超出处理请求所需内容之外的信息。查看两家提供商的政策以了解详情。
我能否使用兼容 OpenAI 的 API 调用 Gemini 3 Flash Preview?
是的。请使用 OrcaRouter 的 API,地址为 https://api.orcarouter.ai/v1,模型 ID 为 "google/gemini-3-flash-preview"。认证方式使用 OrcaRouter API 密钥。请求和响应的格式遵循 OpenAI 的 Chat Completions 模式。
该模型的主要优势是什么?
高推理速度,大型1M-token上下文,多模态输入(文本、图像、文件、音频、视频),强大的MMLU-Pro基准测试(88.2),以及相对于更大模型的低成本。
Gemini 3 Flash Preview 是否可用于生产环境?
这是一个预览版本,意味着它可能会有变化、间歇性可用性或有限支持。它适合测试和开发;对于关键的生产工作负载,请考虑在稳定版本可用后使用。
如何估算多模态输入的令牌使用量?
每种模态都有其自身的分词方式。图像、音频和视频根据分辨率和时长被分割为token。OrcaRouter在API响应中报告token使用情况。您也可以查阅Google的文档了解详细的token计数规则。
如果我超出了上下文窗口会怎样?
超过1,048,576个令牌的输入将从最早的内容开始截断。模型将忽略多余的令牌。请通过监控请求中的总令牌数,确保您的消息在限制范围内。

嵌入此徽章

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50通过 OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview 在 OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)