Gemini 3.1 Pro Preview

Name: Google: Gemini 3.1 Pro Preview API
Brand: Google

google/gemini-3.1-pro-preview

旗艦精選

來自 Google · 2026-02-19

Google Gemini 3.1 Pro Preview：旗艦多模態模型，擁有1M上下文窗口和95.6 τ²-Bench評分，可通過OrcaRouter API存取。

端點:/v1/chat/completions /v1beta/models/{model}:generateContent

上下文1.05M tokens

輸入模態audio + file + image + text + video

輸出模態text

p50 首字節5.71 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

輸入$2.00/ 百萬 tokens

輸出$12.00/ 百萬 tokens

p50 首字節5.71 s7 天

p95 首字節10.00 s7 天

流量5.1Mtokens / 7 天

取得 Gemini 3.1 Pro Preview API →▶ 在 Playground 中試用 </> 透過 API 使用

什麼是 Google Gemini 3.1 Pro Preview？

Google Gemini 3.1 Pro Preview 是 Google 的旗艦模型，以預覽形式提供。這是一個多模態模型，能夠處理文字、圖片、影片、音訊及檔案輸入。該模型被歸類為旗艦級別，表示其專為需要高效能與容量的高需求、複雜應用而設計。作為預覽版本，與穩定版本相比，可能在穩定性或可用性上有限制。可透過 OrcaRouter API 進行存取。

誰應該使用這個模型？

此模型專為需要處理高達1,048,576個Token的大型上下文窗口並具備多模態理解能力的開發者和企業設計。使用案例包括長文檔分析、影片審核、具備完整對話記憶的高階聊天機器人，以及從混合媒體中進行複雜的資料萃取。預覽狀態使其適合實驗與早期整合，但生產部署應評估穩定性。此模型也非常適合已在使用OrcaRouter的OpenAI相容API、並希望測試Google最新旗艦功能的團隊。

主要規格是什麼？

該模型支援上下文視窗 1,048,576 個 token（輸入），最大輸出為 65,536 個 token。它接受多種模態的輸入：音訊、檔案（例如 PDF、程式碼檔案）、圖片、文字和影片。在 τ²-Bench（一項衡量任務完成表現的指標）上，頭條基準評分為 95.6。該模型被其提供者 Google 歸類為旗艦級別。可透過 OrcaRouter 的 API 存取，基礎 URL 為 https://api.orcarouter.ai/v1，模型 ID 為 "google/gemini-3.1-pro-preview"。

與其他 Gemini 預覽版本相比如何？

作為 Gemini 3.1 Pro 的預覽版本，這款模型在 Google 目前預覽版系列中位居頂尖。相較於先前的 Gemini 2.0 模型或 Gemini 3.0 預覽版，它提供更大的上下文視窗（100 萬個 Token）和更高的輸出限制（6.5 萬個 Token）。τ²-Bench 評分 95.6 為任務導向效能提供了量化基準。與 Google 其他預覽版模型相比，此版本專注於最嚴苛的使用情境，需要同時具備廣闊的上下文視野與深入的推理能力。

程式碼範例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

價格

階梯	輸入 / 1M tokens	輸出 / 1M tokens	快取讀取 / 1M	快取寫入 / 1M
≤ 200K	$2.00	$12.00	$0.200	$0.375
≤ ∞	$4.00	$18.00	$0.400	$0.375
階梯依每次請求的輸入 token 數確定

效能

公開基準測試

最近評估 2026-02-19

55.5

AA Coding

優於所參與比較模型中的 75%

57.2

AA Intelligence

優於所參與比較模型中的 80%

GPQA Diamond

94.1

Humanity's Last Exam

44.7

IFBench

77.1

Long-Context Recall

72.7

SciCode

58.9

TerminalBench Hard

53.8

τ²-Bench

95.6

來源: artificialanalysis.ai

常見問題

在 OrcaRouter 上使用 Gemini 3.1 Pro Preview 的成本是多少？

價格細節並未在現有資料中提供。作為旗艦模型，其每 Token 的定價通常高於較小模型。費用取決於輸入和輸出 Token 的使用量。請查看 OrcaRouter 的當前定價頁面以獲得準確費率。

上下文窗口有多大？

模型支援 1,048,576 個 token（輸入）的上下文視窗。這表示您可以在單一請求中提交非常長的文件、程式碼或對話歷史記錄。最大輸出為 65,536 個 token。

這個模型的主要優勢是什麼？

其主要優勢包括龐大的上下文視窗（1M tokens）、高輸出限制（65K tokens）、多模態輸入（音訊、檔案、圖片、文字、影片），以及強勁的τ²-Bench評分95.6，顯示其於代理任務上具有高準確度。

Gemini 3.1 Pro Preview 與 Gemini 2.0 模型相比如何？

它提供了更大的上下文窗口（1M vs. 最高32K）和更高的輸出限制（65K vs. 8K）。同時支援更多的輸入模態。然而，它屬於預覽版本，穩定性可能不如Gemini 2.0正式版本。

OrcaRouter是否處理請求的數據隱私？

所提供的資料中並未指定數據處理政策。用戶應查閱OrcaRouter的數據處理與隱私文件，以了解輸入和輸出數據的處理方式。

我如何透過OpenAI相容的API呼叫此模型？

使用基礎 URL https://api.orcarouter.ai/v1 並將模型 ID 設定為 "google/gemini-3.1-pro-preview"。此 API 遵循標準的 OpenAI chat completions 格式。驗證需要來自 OrcaRouter 的 API 金鑰。

什麼是τ²-Bench分數，為什麼它很重要？

該模型在 τ²-Bench 上獲得了 95.6 分，這是一個衡量任務完成表現的基準測試。這個量化指標反映了模型準確處理複雜多步任務的能力。

我可以將這個模型用於生產環境嗎？

作為預覽模型，它旨在用於測試和實驗。它可能具有較低的速率限制、較低的可靠性以及持續的變更。對於生產環境，請考慮使用穩定、非預覽的模型。

支援哪些輸入模態？

該模型支援音訊、檔案（例如PDF、程式碼檔案）、圖片、文字和影片輸入。所有這些都可以包含在單一請求中進行跨模態推理。

該模型是否可用於串流回應？

現有的事實未明確說明串流支援。OrcaRouter的API可能支援相容模型的串流，但針對此預覽版，請查閱文件以了解串流參數的可用性。

嵌入此徽章

貼到您的部落格文章

Google: Gemini 3.1 Pro Preview•$2.00/M in•5707ms p50•透過 OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview 於 OrcaRouter" /> </a>

Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)

Gemini 3.1 Pro Preview

什麼是 Google Gemini 3.1 Pro Preview？

誰應該使用這個模型？

主要規格是什麼？

與其他 Gemini 預覽版本相比如何？

它支援哪些輸入模式？

它提供多大的上下文窗口？

這個模型的最佳使用案例是什麼？

何時應改用較便宜的型號？

什麼是 τ²-Bench 分數，它是什麼意思？

關於速度與延遲，我們已知哪些資訊？

根據可用數據，該模型的優勢是什麼？

需要考慮的真實限制有哪些？

OrcaRouter上這個型號的定價結構是怎樣的？

使用者應考慮哪些成本取捨？

是否提供快取以降低成本？

與其他Google模型相比，可能的成本是多少？

我如何通过 OrcaRouter 的 API 调用模型？

我可以配置哪些參數？

如何從其他提供商遷移到 OrcaRouter？

使用 API 時，我應該了解哪些關於預覽狀態的事項？