Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

来自 Google · 2025-12-17

Google Gemini 3 Flash Preview – 多模态模型，拥有1M token上下文，MMLU-Pro得分88.2，可通过OrcaRouter访问。

端点:/v1/chat/completions /v1beta/models/{model}:generateContent

上下文1.05M tokens

输入模态text + image + file + audio + video

输出模态text

p50 首字节3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

输入$0.50/ 百万 tokens

输出$3.00/ 百万 tokens

p50 首字节3.81 s7 天

p95 首字节10.00 s7 天

流量1.1Mtokens / 7 天

获取 Gemini 3 Flash Preview API →▶ 在 Playground 中试用 </> 通过 API 使用

什么是Google Gemini 3 Flash Preview？

Google Gemini 3 Flash Preview是由Google开发的多模态模型，针对速度和长上下文处理进行了优化。它支持文本、图像、文件、音频和视频格式的输入，并可生成最多65,536个令牌的输出。该模型的上下文窗口为1,048,576个令牌，能够在极长序列上进行推理。它在MMLU-Pro基准测试中得分为88.2，表明在广泛的学术和推理任务中具有强劲性能。此预览版本可通过OrcaRouter的兼容OpenAI API使用，模型ID为google/gemini-3-flash-preview。

这个模型的目标受众是谁？

Gemini 3 Flash Preview 面向需要快速多模态推理与长上下文的开发者及组织，适用于视频分析、长文档摘要、实时音视频理解等场景。该模型定价为每百万输入Token 0.50美元、每百万输出Token 3.00美元，对初创企业和大型企业均具可及性。作为预览版，早期采用者可在稳定版发布前评估其能力。OrcaRouter 提供对该模型的无缝接入，包括兼容OpenAI的接口和零加价的提供商费率。

它支持哪些多模态输入？

Gemini 3 Flash Preview 支持五种输入模态：文本、图像、文件、音频和视频。文本可以是纯文本或结构化文本；图像包括照片、图表和截图；文件覆盖 PDF 和文档等格式；音频涵盖语音和音乐；视频则可同时处理视觉和音频轨道。该模型能够在单条提示中组合多种模态——例如，在分析视频的同时读取所附的 PDF。这种多功能性使其能够处理复杂的混合媒体任务，无需独立的处理流程。输入令牌的计数基于每种模态特定的分词器规则。

预览状态指的是软件的实验性或早期版本，稳定性因开发阶段而异。通常预览版功能接近完善但可能存在缺陷，适合测试使用，不建议直接用于生产环境。具体稳定性需结合发布说明和更新日志评估。

Gemini 3 Flash Preview 是谷歌第三代 Flash 模型的预发布版本。作为预览版，其行为、性能及可用性可能会发生变化。谷歌通常会根据用户反馈更新预览模型，并最终可能用稳定版替换预览端点。该模型功能完善，适合测试与开发，但生产部署时应关注更新动态。OrcaRouter 镜像了提供商的端点，确保谷歌的任何变更都能及时反映。模型 ID google/gemini-3-flash-preview 将保持不变，除非谷歌修改其命名。

代码示例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

价格

输入 / 1M tokens	$0.500
输出 / 1M tokens	$3.00
缓存读取 / 1M	$0.050
货币	USD

性能

公共基准测试

最近评估 2025-12-17

37.8

AA Coding

优于所参与对比模型中的 47%

35.0

AA Intelligence

优于所参与对比模型中的 35%

55.7

AA Math

优于所参与对比模型中的 32%

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

来源: artificialanalysis.ai

常见问题

使用 Gemini 3 Flash Preview 的成本是多少？

定价为每百万输入令牌0.50美元，每百万输出令牌3.00美元，按提供商费率计费，OrcaRouter不收取任何加价。

上下文窗口大小是多少？

上下文窗口的输入令牌数为1,048,576个，模型最多可生成65,536个输出令牌。

支持的输入模态有哪些？

文本、图像、文件、音频和视频均可作为输入。输出仅为文本。

它和Gemini 2 Flash相比如何？

Gemini 3 Flash Preview 拥有更大的上下文窗口（1M vs 最高1M但通常更小），更高的MMLU-Pro得分（88.2），并扩展了多模态支持，包括视频。它更快速，处理复杂任务的能力更强，但Gemini 2 Flash 的每token成本更低。

OrcaRouter如何处理数据隐私？

OrcaRouter 将您的请求传递给 Google 的 API。数据处理遵循 Google 的隐私政策。OrcaRouter 不会记录或存储超出处理请求所需内容之外的信息。查看两家提供商的政策以了解详情。

我能否使用兼容 OpenAI 的 API 调用 Gemini 3 Flash Preview？

是的。请使用 OrcaRouter 的 API，地址为 https://api.orcarouter.ai/v1，模型 ID 为 "google/gemini-3-flash-preview"。认证方式使用 OrcaRouter API 密钥。请求和响应的格式遵循 OpenAI 的 Chat Completions 模式。

该模型的主要优势是什么？

高推理速度，大型1M-token上下文，多模态输入（文本、图像、文件、音频、视频），强大的MMLU-Pro基准测试（88.2），以及相对于更大模型的低成本。

Gemini 3 Flash Preview 是否可用于生产环境？

这是一个预览版本，意味着它可能会有变化、间歇性可用性或有限支持。它适合测试和开发；对于关键的生产工作负载，请考虑在稳定版本可用后使用。

如何估算多模态输入的令牌使用量？

每种模态都有其自身的分词方式。图像、音频和视频根据分辨率和时长被分割为token。OrcaRouter在API响应中报告token使用情况。您也可以查阅Google的文档了解详细的token计数规则。

如果我超出了上下文窗口会怎样？

超过1,048,576个令牌的输入将从最早的内容开始截断。模型将忽略多余的令牌。请通过监控请求中的总令牌数，确保您的消息在限制范围内。

嵌入此徽章

粘贴到您的博客文章

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•通过 OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview 在 OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

什么是Google Gemini 3 Flash Preview？

这个模型的目标受众是谁？

它支持哪些多模态输入？

预览状态指的是软件的实验性或早期版本，稳定性因开发阶段而异。通常预览版功能接近完善但可能存在缺陷，适合测试使用，不建议直接用于生产环境。具体稳定性需结合发布说明和更新日志评估。