Gemini 3.5 Flash

google/gemini-3.5-flash
來自 google · 2026-05-23

Google 高效的多模態模型,擁有 1M 上下文、高輸出,並通過 OrcaRouter 提供具成本效益的定價。

上下文1.05M tokens
輸入模態text + image + video + file + audio
輸出模態text
p50 首字節10.00 s
輸入$1.50/ 百萬 tokens
輸出$9.00/ 百萬 tokens
p50 首字節10.00 s7 天
p95 首字節10.00 s7 天
流量4.5Mtokens / 7 天

模型詳情

什麼是Gemini 3.5 Flash?

Gemini 3.5 Flash 是由 Google 開發的大型語言模型,針對速度與效率進行了微調。它屬於 Gemini 系列,設計用於處理多模態輸入——文字、圖片、影片、檔案和音訊——同時提供快速回應。該模型支援 1,048,576 個 tokens 的上下文視窗,使其能夠處理非常長的序列,例如整本書籍、長達一小時的影片或大型程式碼儲存庫。其最大輸出長度為 65,536 個 tokens,可產生長篇內容,包括完整報告或延伸程式碼檔案。Gemini 3.5 Flash 透過 OrcaRouter 的 OpenAI 相容 API 存取,這意味著您只需極少的程式碼修改即可將其整合到現有應用程式中。

誰應該使用 Gemini 3.5 Flash?

Gemini 3.5 Flash 非常適合需要在高吞吐量、低延遲與成本之間取得平衡的開發者與組織。尤其適用於推論速度至關重要的生產環境,例如即時聊天機器人、內容審核管線或自動化客戶支援。其寬廣的上下文視窗對需要分析大型資料集、長篇文件或大量對話歷史(無需分段處理)的使用者特別有幫助。此外,建立多模態應用(如圖片說明生成、影片摘要或語音轉錄)的團隊,可善用其對多種輸入類型的原生支援。若您的工作負載需要極高推理能力或複雜數學運算,請考慮改用效能更強但速度較慢的模型。

Gemini 3.5 Flash 支援哪些輸入模態?

Gemini 3.5 Flash 接受五種輸入模態:文字、圖像、影片、檔案和音訊。文字輸入可以是純字串或結構化訊息;圖像可以透過 base64 編碼資料或 URL 傳遞,模型能夠解讀圖表、示意圖或照片等視覺內容;影片輸入支援以畫面序列或壓縮影片檔案的形式,使模型能夠分析動態與時間變化;檔案輸入涵蓋常見格式如 PDF、DOCX 或程式碼檔案,模型可從中提取並推論其內容;音訊輸入可以是原始或經壓縮的格式(例如 MP3、WAV),能進行語音轉錄與聲音分析。所有模態皆可合併於單一請求中,使 Gemini 3.5 Flash 成為處理多模態任務的通用工具。

如何使用OrcaRouter存取Gemini 3.5 Flash?

OrcaRouter 透過其相容 OpenAI 的 API 提供 Gemini 3.5 Flash 服務。基礎 URL 為 https://api.orcarouter.ai/v1,特定模型 ID 為 "google/gemini-3.5-flash"。您可以使用任何 OpenAI SDK 或直接發送 HTTP 請求來呼叫它,只需更改基礎 URL 和模型名稱即可。身分驗證透過 OrcaRouter 提供的 API 金鑰進行。該 API 支援標準的聊天完成端點、串流以及可選參數,例如 temperature、top_p 和 max_tokens。OrcaRouter 在供應商費率上不加任何溢價,因此您每 100 萬個輸入 tokens 支付 $1.50,每 100 萬個輸出 tokens 支付 $9.00,無需支付額外的網關費用。

程式碼範例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

價格

輸入 / 1M tokens$1.50
輸出 / 1M tokens$9.00
快取讀取 / 1M$0.150
快取寫入 / 1M$0.083
貨幣USD

效能

p50 首字節
10.00 s
輸出速度
10766 tok/s
p95 首字節
10.00 s
錯誤率
0.44%

公開基準測試

49.0
AA Coding
優於所參與比較模型中的 68%
47.0
AA Intelligence
優於所參與比較模型中的 58%
51.0
AA Math
優於所參與比較模型中的 27%
GPQA Diamond
45.0 index
MMLU-Pro
59.0 index
τ²-Bench
42.0 index
來源: artificialanalysis.ai

更多 google 模型

常見問題

Gemini 3.5 Flash 在 OrcaRouter 上的價格是多少?
輸入Token每100萬個1.50美元;輸出Token每100萬個9.00美元。OrcaRouter按供應商費率計費,零加成。無任何額外費用。
Gemini 3.5 Flash 的上下文窗口大小是多少?
它支援一個上下文視窗,大小為1,048,576個token(約100萬個token)。這包括輸入和輸出token的總和。
Gemini 3.5 Flash 的主要優勢是什麼?
此最佳化專注於低延遲、高吞吐量及成本效益。它支援多模態輸入(文字、圖片、影片、檔案、音訊)與大上下文視窗,非常適合即時應用與長文件處理。
Gemini 3.5 Flash 與 Gemini 3.5 Pro 相比如何?
Flash 更快且更便宜,但在複雜推理與數學任務上的基準測試表現較低。Pro 更精準,但速度較慢且成本更高。Flash 適合高流量、對延遲敏感的應用場景。
通過OrcaRouter使用Gemini 3.5 Flash時,數據如何被處理?
OrcaRouter 扮演代理角色,並不會儲存您的資料。然而,Google 的資料處理政策適用於底層模型。OrcaRouter 建議您查看 Google 關於資料保留與隱私的條款。
如何使用OpenAI-compatible API呼叫Gemini 3.5 Flash?
使用基礎 URL https://api.orcarouter.ai/v1,模型 ID "google/gemini-3.5-flash",並在 Authorization header 中傳遞 OrcaRouter API 金鑰。該 API 支援標準聊天完成和串流。
Gemini 3.5 Flash 可以生成多長的輸出?
它每次回應最多可生成65,536個標記。這遠大於許多模型,允許生成長篇內容、程式碼或擴展推理。
是否有針對重複或快取令牌的折扣?
根據所提供的事實,OrcaRouter 不提供快取或大量折扣。每個代碼都按標準費率計費,無論是否重複使用。

嵌入此徽章

Gemini 3.5 Flash$1.50/M in10000ms p50透過 OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash 於 OrcaRouter" /> </a>
Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)