Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

來自 google · 2026-05-23

Google 高效的多模態模型，擁有 1M 上下文、高輸出，並通過 OrcaRouter 提供具成本效益的定價。

端點:/v1/chat/completions /v1beta/models/{model}:generateContent

上下文1.05M tokens

輸入模態text + image + video + file + audio

輸出模態text

p50 首字節10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

輸入$1.50/ 百萬 tokens

輸出$9.00/ 百萬 tokens

p50 首字節10.00 s7 天

p95 首字節10.00 s7 天

流量4.5Mtokens / 7 天

取得 Gemini 3.5 Flash API →▶ 在 Playground 中試用 </> 透過 API 使用

什麼是Gemini 3.5 Flash？

Gemini 3.5 Flash 是由 Google 開發的大型語言模型，針對速度與效率進行了微調。它屬於 Gemini 系列，設計用於處理多模態輸入——文字、圖片、影片、檔案和音訊——同時提供快速回應。該模型支援 1,048,576 個 tokens 的上下文視窗，使其能夠處理非常長的序列，例如整本書籍、長達一小時的影片或大型程式碼儲存庫。其最大輸出長度為 65,536 個 tokens，可產生長篇內容，包括完整報告或延伸程式碼檔案。Gemini 3.5 Flash 透過 OrcaRouter 的 OpenAI 相容 API 存取，這意味著您只需極少的程式碼修改即可將其整合到現有應用程式中。

誰應該使用 Gemini 3.5 Flash？

Gemini 3.5 Flash 非常適合需要在高吞吐量、低延遲與成本之間取得平衡的開發者與組織。尤其適用於推論速度至關重要的生產環境，例如即時聊天機器人、內容審核管線或自動化客戶支援。其寬廣的上下文視窗對需要分析大型資料集、長篇文件或大量對話歷史（無需分段處理）的使用者特別有幫助。此外，建立多模態應用（如圖片說明生成、影片摘要或語音轉錄）的團隊，可善用其對多種輸入類型的原生支援。若您的工作負載需要極高推理能力或複雜數學運算，請考慮改用效能更強但速度較慢的模型。

Gemini 3.5 Flash 支援哪些輸入模態？

Gemini 3.5 Flash 接受五種輸入模態：文字、圖像、影片、檔案和音訊。文字輸入可以是純字串或結構化訊息；圖像可以透過 base64 編碼資料或 URL 傳遞，模型能夠解讀圖表、示意圖或照片等視覺內容；影片輸入支援以畫面序列或壓縮影片檔案的形式，使模型能夠分析動態與時間變化；檔案輸入涵蓋常見格式如 PDF、DOCX 或程式碼檔案，模型可從中提取並推論其內容；音訊輸入可以是原始或經壓縮的格式（例如 MP3、WAV），能進行語音轉錄與聲音分析。所有模態皆可合併於單一請求中，使 Gemini 3.5 Flash 成為處理多模態任務的通用工具。

如何使用OrcaRouter存取Gemini 3.5 Flash？

OrcaRouter 透過其相容 OpenAI 的 API 提供 Gemini 3.5 Flash 服務。基礎 URL 為 https://api.orcarouter.ai/v1，特定模型 ID 為 "google/gemini-3.5-flash"。您可以使用任何 OpenAI SDK 或直接發送 HTTP 請求來呼叫它，只需更改基礎 URL 和模型名稱即可。身分驗證透過 OrcaRouter 提供的 API 金鑰進行。該 API 支援標準的聊天完成端點、串流以及可選參數，例如 temperature、top_p 和 max_tokens。OrcaRouter 在供應商費率上不加任何溢價，因此您每 100 萬個輸入 tokens 支付 $1.50，每 100 萬個輸出 tokens 支付 $9.00，無需支付額外的網關費用。

程式碼範例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

價格

輸入 / 1M tokens	$1.50
輸出 / 1M tokens	$9.00
快取讀取 / 1M	$0.150
快取寫入 / 1M	$0.083
貨幣	USD

效能

公開基準測試

最近評估 2026-06-25

49.0

AA Coding

優於所參與比較模型中的 68%

47.0

AA Intelligence

優於所參與比較模型中的 58%

51.0

AA Math

優於所參與比較模型中的 27%

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

來源: artificialanalysis.ai

常見問題

Gemini 3.5 Flash 在 OrcaRouter 上的價格是多少？

輸入Token每100萬個1.50美元；輸出Token每100萬個9.00美元。OrcaRouter按供應商費率計費，零加成。無任何額外費用。

Gemini 3.5 Flash 的上下文窗口大小是多少？

它支援一個上下文視窗，大小為1,048,576個token（約100萬個token）。這包括輸入和輸出token的總和。

Gemini 3.5 Flash 的主要優勢是什麼？

此最佳化專注於低延遲、高吞吐量及成本效益。它支援多模態輸入（文字、圖片、影片、檔案、音訊）與大上下文視窗，非常適合即時應用與長文件處理。

Gemini 3.5 Flash 與 Gemini 3.5 Pro 相比如何？

Flash 更快且更便宜，但在複雜推理與數學任務上的基準測試表現較低。Pro 更精準，但速度較慢且成本更高。Flash 適合高流量、對延遲敏感的應用場景。

通過OrcaRouter使用Gemini 3.5 Flash時，數據如何被處理？

OrcaRouter 扮演代理角色，並不會儲存您的資料。然而，Google 的資料處理政策適用於底層模型。OrcaRouter 建議您查看 Google 關於資料保留與隱私的條款。

如何使用OpenAI-compatible API呼叫Gemini 3.5 Flash？

使用基礎 URL https://api.orcarouter.ai/v1，模型 ID "google/gemini-3.5-flash"，並在 Authorization header 中傳遞 OrcaRouter API 金鑰。該 API 支援標準聊天完成和串流。

Gemini 3.5 Flash 可以生成多長的輸出？

它每次回應最多可生成65,536個標記。這遠大於許多模型，允許生成長篇內容、程式碼或擴展推理。

是否有針對重複或快取令牌的折扣？

根據所提供的事實，OrcaRouter 不提供快取或大量折扣。每個代碼都按標準費率計費，無論是否重複使用。

嵌入此徽章

貼到您的部落格文章

Gemini 3.5 Flash•$1.50/M in•10000ms p50•透過 OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash 於 OrcaRouter" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

什麼是Gemini 3.5 Flash？

誰應該使用 Gemini 3.5 Flash？

Gemini 3.5 Flash 支援哪些輸入模態？

如何使用OrcaRouter存取Gemini 3.5 Flash？

Gemini 3.5 Flash 最適合執行哪些任務？

何時你該選擇更便宜的模型而非 Gemini 3.5 Flash？

Gemini 3.5 Flash 是否支援串流和即時互動？

使用Gemini 3.5 Flash的上下文視窗有哪些最佳實踐？

Gemini 3.5 Flash 有哪些已知的優勢？

與其他模型相比，延遲如何？

模型在程式碼和結構化資料上的輸出品質如何？

Gemini 3.5 Flash 在 OrcaRouter 上是如何定价的？

輸入和輸出代幣之間的成本權衡是什麼？

OrcaRouter 是否提供任何缓存或折扣功能？

OrcaRouter上的成本與其他型號相比如何？

如何透過 OrcaRouter 的 API 呼叫 Gemini 3.5 Flash？

Gemini 3.5 Flash 有哪些可用的參數？

我可以從 Google AI 或 Vertex AI API 遷移到 OrcaRouter 嗎？

使用 API 時，我應該預期哪些錯誤處理？

Gemini 3.5 Flash 與 Gemini 3.5 Pro 相比如何？

Gemini 3.5 Flash 與 GPT-4o Mini 相比如何？

Gemini 3.5 Flash 與 Claude 3 Haiku 相比如何？

Gemini 3.5 Flash 相對於開源模型的主要優勢是什麼？

程式碼範例

價格

效能

公開基準測試

更多 google 模型

常見問題

嵌入此徽章

Gemini 3.5 Flash

模型詳情

什麼是Gemini 3.5 Flash？

誰應該使用 Gemini 3.5 Flash？

Gemini 3.5 Flash 支援哪些輸入模態？

如何使用OrcaRouter存取Gemini 3.5 Flash？

Gemini 3.5 Flash 最適合執行哪些任務？

何時你該選擇更便宜的模型而非 Gemini 3.5 Flash？

Gemini 3.5 Flash 是否支援串流和即時互動？

使用Gemini 3.5 Flash的上下文視窗有哪些最佳實踐？

Gemini 3.5 Flash 有哪些已知的優勢？

與其他模型相比，延遲如何？

模型在程式碼和結構化資料上的輸出品質如何？

Gemini 3.5 Flash 在 OrcaRouter 上是如何定价的？

輸入和輸出代幣之間的成本權衡是什麼？

OrcaRouter 是否提供任何缓存或折扣功能？

OrcaRouter上的成本與其他型號相比如何？

如何透過 OrcaRouter 的 API 呼叫 Gemini 3.5 Flash？

Gemini 3.5 Flash 有哪些可用的參數？

我可以從 Google AI 或 Vertex AI API 遷移到 OrcaRouter 嗎？

使用 API 時，我應該預期哪些錯誤處理？

Gemini 3.5 Flash 與 Gemini 3.5 Pro 相比如何？

Gemini 3.5 Flash 與 GPT-4o Mini 相比如何？

Gemini 3.5 Flash 與 Claude 3 Haiku 相比如何？

Gemini 3.5 Flash 相對於開源模型的主要優勢是什麼？

程式碼範例

價格

效能

公開基準測試

更多 google 模型

常見問題

嵌入此徽章