Gemini 3 Flash Preview

google/gemini-3-flash-preview
來自 Google · 2025-12-17

Google Gemini 3 Flash Preview – 多模態模型,擁有 1M tokens 上下文,88.2 MMLU-Pro,可通過 OrcaRouter 訪問。

上下文1.05M tokens
輸入模態text + image + file + audio + video
輸出模態text
p50 首字節3.81 s
輸入$0.50/ 百萬 tokens
輸出$3.00/ 百萬 tokens
p50 首字節3.81 s7 天
p95 首字節10.00 s7 天
流量1.1Mtokens / 7 天

模型詳情

什麼是 Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview 是由 Google 開發的多模態模型,專為高速與大上下文處理最佳化。該模型可接受文字、圖片、檔案、音訊及影片格式的輸入,並能生成多達 65,536 個 Token 的輸出。模型的上下文視窗為 1,048,576 個 Token,使其能夠對極長序列進行推理。其在 MMLU-Pro 基準測試中獲得 88.2 分,展現出在廣泛學術與推理任務中的強大表現。此預覽版本可透過 OrcaRouter 的 OpenAI 相容 API 以模型 ID google/gemini-3-flash-preview 取得。

這個模型的目標受眾是誰?

「Gemini 3 Flash Preview」的目標對象是正在開發需要快速、多模態推理且具備大上下文能力的應用程式之開發人員與組織。此模型非常適合影片分析、長文件摘要以及即時音訊-視訊理解等使用案例。其定價——每百萬個輸入Token 0.50美元,每百萬個輸出Token 3.00美元——讓新創公司與大型企業都能負擔。由於目前為預覽版本,早期採用者可在穩定版釋出前評估其功能。OrcaRouter 提供對此模型的順暢存取,包括 OpenAI 相容的端點以及零加成供應商費率。

它支援哪些多模態輸入?

Gemini 3 Flash Preview 支援五種輸入模態:文字、影像、檔案、音訊和影片。文字可以是純文字或結構化文字;影像可包含照片、圖表和螢幕擷取畫面;檔案涵蓋 PDF 和文件等格式;音訊包含語音和音樂;影片可同時處理視覺和音訊軌道。該模型可在單一提示中結合多種模態——例如,在分析影片的同時也讀取附加的 PDF。這種多功能性使其能夠處理複雜的多媒體任務,而無需分開的處理管道。輸入 token 是根據每種模態的特定標記器規則來計算的。

預覽狀態為何?以及其穩定度如何?

Gemini 3 Flash Preview 是 Google 第三代 Flash 模型的預覽版本。作為預覽版,其行為、效能與可用性可能會有變動。Google 通常會根據使用者回饋更新預覽模型,並可能最終以穩定版本取代預覽端點。雖然此模型功能完整且適合測試與開發,但在正式環境部署時應留意更新。OrcaRouter 鏡像了供應商的端點,確保 Google 的任何變更都能即時反映。模型 ID google/gemini-3-flash-preview 將保持不變,除非 Google 修改其命名方式。

程式碼範例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

價格

輸入 / 1M tokens$0.500
輸出 / 1M tokens$3.00
快取讀取 / 1M$0.050
貨幣USD

效能

p50 首字節
3.81 s
輸出速度
851 tok/s
p95 首字節
10.00 s
錯誤率
0%

公開基準測試

37.8
AA Coding
優於所參與比較模型中的 47%
35.0
AA Intelligence
優於所參與比較模型中的 35%
55.7
AA Math
優於所參與比較模型中的 32%
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
來源: artificialanalysis.ai

更多 Google 模型

常見問題

使用 Gemini 3 Flash Preview 的成本是多少?
定價為每百萬輸入令牌 0.50 美元,每百萬輸出令牌 3.00 美元,按提供商費率計費,OrcaRouter 不附加任何加價。
上下文窗口大小是多少?
上下文視窗為輸入提供1,048,576個token,模型最多可生成65,536個輸出token。
支援哪些輸入模態?
文字、圖片、檔案、音訊和影片均可作為輸入。輸出僅限文字。
它與 Gemini 2 Flash 相比如何?
Gemini 3 Flash Preview 擁有更大的上下文視窗(1M vs 最高1M但通常更小)、更高的 MMLU-Pro 分數(88.2),以及擴展的多模態支援,包含影片。它在處理複雜任務時更快、能力更強,但 Gemini 2 Flash 的每 token 成本更低。
OrcaRouter如何處理數據隱私?
OrcaRouter 會將您的請求傳送至 Google 的 API。資料處理遵循 Google 的隱私權政策。OrcaRouter 不會記錄或儲存超出處理請求所需範圍的您的內容。詳情請參閱兩個提供者的政策。
我可以使用與OpenAI相容的API來呼叫Gemini 3 Flash Preview嗎?
是的。使用OrcaRouter的API,網址為https://api.orcarouter.ai/v1,模型ID為"google/gemini-3-flash-preview"。驗證使用OrcaRouter API金鑰。請求和回應格式遵循OpenAI的Chat Completions架構。
該模型的主要優勢是什麼?
高推理速度、1M token 超大上下文、多模態輸入(文字、圖片、檔案、音訊、影片)、強大的 MMLU-Pro 基準表現(88.2),以及相對於更大模型更低的成本。
Gemini 3 Flash Preview 是否可用於生產?
這是一個預覽版本,意味著它可能會有變更、間歇性可用性或有限支援。它適用於測試和開發;對於關鍵的生產工作負載,請考慮在穩定版本可用時使用。
如何估算多模態輸入的token使用量?
每種模態都有其自己的分詞方式。圖像、音訊和影片會根據解析度和時長分割成令牌(tokens)。OrcaRouter 會在 API 回應中回報令牌使用量。您也可以查閱 Google 的文件,了解詳細的令牌計數規則。
若超出上下文視窗,模型將無法處理額外的輸入內容,導致回覆時忽略超出的部分、產生不連貫的回應,或直接出現錯誤提示。具體行為取決於模型的實作方式,部分系統會自動截斷輸入,而其他系統可能回傳錯誤訊息。
輸入超過 1,048,576 個 tokens 時,將從最舊的內容開始截斷。模型會忽略超出的 tokens。請透過監控請求中的總 tokens 數,確保您的訊息不超過限制。

嵌入此徽章

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50透過 OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview 於 OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)