Gemini 3.1 Pro Preview

google/gemini-3.1-pro-preview
旗舰精选
来自 Google · 2026-02-19

Google Gemini 3.1 Pro Preview:旗舰多模态模型,具有1M上下文窗口和95.6 τ²-Bench分数,通过OrcaRouter API访问。

上下文1.05M tokens
输入模态audio + file + image + text + video
输出模态text
p50 首字节5.71 s
输入$2.00/ 百万 tokens
输出$12.00/ 百万 tokens
p50 首字节5.71 s7 天
p95 首字节10.00 s7 天
流量5.1Mtokens / 7 天

模型详情

什么是 Google Gemini 3.1 Pro Preview?

Google Gemini 3.1 Pro Preview 是 Google 的旗舰模型,以预览形式提供。它是一个多模态模型,能够处理文本、图像、视频、音频和文件输入。该模型被归类为旗舰层级,表明它专为高需求、复杂应用而设计,在这些应用中性能和容量至关重要。作为预览版,与稳定版本相比,它在稳定性或可用性方面可能存在限制。访问通过 OrcaRouter API 提供。

谁应该使用这个模型?

此模型面向需要处理高达1,048,576个token的大上下文窗口并需要多模态理解的开发者和企业。用例包括长文档分析、视频审核、具备完整对话记忆的高级聊天机器人,以及从混合媒体中提取复杂数据。预览状态使其适合实验和早期集成,但生产部署应评估稳定性。对于已使用OrcaRouter兼容OpenAI的API并希望测试Google最新旗舰能力的团队而言,这也是理想选择。

关键规格是什么?

该模型支持1,048,576个token的上下文窗口(输入)和最多65,536个token的输出。它接受多种模态的输入:音频、文件(例如PDF、代码文件)、图像、文本和视频。在τ²-Bench(衡量任务完成性能的指标)上的基准得分为95.6。该模型被其提供商Google归类为旗舰层级,通过OrcaRouter的API接入,基础URL为https://api.orcarouter.ai/v1,模型ID为"google/gemini-3.1-pro-preview"。

它与其他Gemini预览版相比如何?

作为 Gemini 3.1 Pro 的预览版本,该模型在 Google 当前预览版发布序列中位居顶端。与早期的 Gemini 2.0 模型或 Gemini 3.0 预览版相比,它提供了更大的上下文窗口(100万token)和更高的输出限制(6.5万token)。95.6 的 τ²-Bench 分数为面向任务的性能提供了定量基准。与 Google 的其他预览模型相比,这款模型面向最苛刻的使用场景,此类场景既需要广泛的上下文,也需要深度的推理能力。

代码示例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

价格

阶梯输入 / 1M tokens输出 / 1M tokens缓存读取 / 1M缓存写入 / 1M
200K$2.00$12.00$0.200$0.375
$4.00$18.00$0.400$0.375
阶梯按每次请求的输入 token 数确定

性能

p50 首字节
5.71 s
输出速度
429 tok/s
p95 首字节
10.00 s
错误率
0%

公共基准测试

55.5
AA Coding
优于所参与对比模型中的 75%
57.2
AA Intelligence
优于所参与对比模型中的 80%
GPQA Diamond
94.1
Humanity's Last Exam
44.7
IFBench
77.1
Long-Context Recall
72.7
SciCode
58.9
TerminalBench Hard
53.8
τ²-Bench
95.6
来源: artificialanalysis.ai

更多 Google 模型

常见问题

在OrcaRouter上使用Gemini 3.1 Pro Preview的费用是多少?
现有信息未提供定价细节。作为旗舰模型,其每token的定价通常高于较小模型。费用取决于输入和输出的token使用量。请查看OrcaRouter当前定价页面以获取准确费率。
上下文窗口有多大?
该模型支持1,048,576个令牌(输入)的上下文窗口。这意味着您可以在单次请求中提交非常长的文档、代码或对话历史记录。最大输出为65,536个令牌。
这个模型的主要优势是什么?
其主要优势包括庞大的上下文窗口(1M tokens)、高输出限制(65K tokens)、多模态输入(音频、文件、图像、文本、视频)以及在τ²-Bench上高达95.6的分数,表明在智能体任务上具有高精度。
Gemini 3.1 Pro Preview 与 Gemini 2.0 模型相比如何?
它提供了更大的上下文窗口(1M对比最高32K)和更高的输出限制(65K对比8K)。它还支持更多的输入模态。然而,它是一个预览版本,稳定性可能不如Gemini 2.0稳定版。
OrcaRouter 是否处理请求的数据隐私?
所提供的资料中未指定数据处理政策。用户应查阅OrcaRouter的数据处理和隐私文档,以了解输入和输出数据是如何被处理的。
如何通过兼容OpenAI的API调用此模型?
使用基础URL https://api.orcarouter.ai/v1 并将模型ID设置为"google/gemini-3.1-pro-preview"。API遵循标准OpenAI聊天完成格式。身份验证需要来自OrcaRouter的API密钥。
τ²-Bench 分数是什么,为什么它很重要?
该模型在τ²-Bench上获得了95.6分,τ²-Bench是一个衡量任务完成性能的基准。这一量化指标反映了模型准确处理复杂多步任务的能力。
我可以在生产环境中使用这个模型吗?
作为预览模型,它专为测试和实验设计。可能具有较低的速率限制、较低的可靠性,并会持续变更。若用于生产环境,请考虑使用稳定、非预览的模型。
支持哪些输入模式?
模型支持音频、文件(例如PDF、代码文件)、图像、文本和视频输入。所有这些都可以包含在单个请求中,以实现跨模态推理。
模型是否支持流式响应?
现有事实未明确说明流式支持。OrcaRouter的API可能支持兼容模型的流式传输,但在此预览版本中,请查阅文档以了解流参数是否可用。

嵌入此徽章

Google: Gemini 3.1 Pro Preview$2.00/M in5707ms p50通过 OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview 在 OrcaRouter" /> </a>
Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)