Gemini 3.1 Pro Preview

Name: Google: Gemini 3.1 Pro Preview API
Brand: Google

google/gemini-3.1-pro-preview

旗舰精选

来自 Google · 2026-02-19

Google Gemini 3.1 Pro Preview：旗舰多模态模型，具有1M上下文窗口和95.6 τ²-Bench分数，通过OrcaRouter API访问。

端点:/v1/chat/completions /v1beta/models/{model}:generateContent

上下文1.05M tokens

输入模态audio + file + image + text + video

输出模态text

p50 首字节5.71 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

输入$2.00/ 百万 tokens

输出$12.00/ 百万 tokens

p50 首字节5.71 s7 天

p95 首字节10.00 s7 天

流量5.1Mtokens / 7 天

获取 Gemini 3.1 Pro Preview API →▶ 在 Playground 中试用 </> 通过 API 使用

什么是 Google Gemini 3.1 Pro Preview？

Google Gemini 3.1 Pro Preview 是 Google 的旗舰模型，以预览形式提供。它是一个多模态模型，能够处理文本、图像、视频、音频和文件输入。该模型被归类为旗舰层级，表明它专为高需求、复杂应用而设计，在这些应用中性能和容量至关重要。作为预览版，与稳定版本相比，它在稳定性或可用性方面可能存在限制。访问通过 OrcaRouter API 提供。

谁应该使用这个模型？

此模型面向需要处理高达1,048,576个token的大上下文窗口并需要多模态理解的开发者和企业。用例包括长文档分析、视频审核、具备完整对话记忆的高级聊天机器人，以及从混合媒体中提取复杂数据。预览状态使其适合实验和早期集成，但生产部署应评估稳定性。对于已使用OrcaRouter兼容OpenAI的API并希望测试Google最新旗舰能力的团队而言，这也是理想选择。

关键规格是什么？

该模型支持1,048,576个token的上下文窗口（输入）和最多65,536个token的输出。它接受多种模态的输入：音频、文件（例如PDF、代码文件）、图像、文本和视频。在τ²-Bench（衡量任务完成性能的指标）上的基准得分为95.6。该模型被其提供商Google归类为旗舰层级，通过OrcaRouter的API接入，基础URL为https://api.orcarouter.ai/v1，模型ID为"google/gemini-3.1-pro-preview"。

它与其他Gemini预览版相比如何？

作为 Gemini 3.1 Pro 的预览版本，该模型在 Google 当前预览版发布序列中位居顶端。与早期的 Gemini 2.0 模型或 Gemini 3.0 预览版相比，它提供了更大的上下文窗口（100万token）和更高的输出限制（6.5万token）。95.6 的 τ²-Bench 分数为面向任务的性能提供了定量基准。与 Google 的其他预览模型相比，这款模型面向最苛刻的使用场景，此类场景既需要广泛的上下文，也需要深度的推理能力。

代码示例

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

价格

阶梯	输入 / 1M tokens	输出 / 1M tokens	缓存读取 / 1M	缓存写入 / 1M
≤ 200K	$2.00	$12.00	$0.200	$0.375
≤ ∞	$4.00	$18.00	$0.400	$0.375
阶梯按每次请求的输入 token 数确定

性能

公共基准测试

最近评估 2026-02-19

55.5

AA Coding

优于所参与对比模型中的 75%

57.2

AA Intelligence

优于所参与对比模型中的 80%

GPQA Diamond

94.1

Humanity's Last Exam

44.7

IFBench

77.1

Long-Context Recall

72.7

SciCode

58.9

TerminalBench Hard

53.8

τ²-Bench

95.6

来源: artificialanalysis.ai

常见问题

在OrcaRouter上使用Gemini 3.1 Pro Preview的费用是多少？

现有信息未提供定价细节。作为旗舰模型，其每token的定价通常高于较小模型。费用取决于输入和输出的token使用量。请查看OrcaRouter当前定价页面以获取准确费率。

上下文窗口有多大？

该模型支持1,048,576个令牌（输入）的上下文窗口。这意味着您可以在单次请求中提交非常长的文档、代码或对话历史记录。最大输出为65,536个令牌。

这个模型的主要优势是什么？

其主要优势包括庞大的上下文窗口（1M tokens）、高输出限制（65K tokens）、多模态输入（音频、文件、图像、文本、视频）以及在τ²-Bench上高达95.6的分数，表明在智能体任务上具有高精度。

Gemini 3.1 Pro Preview 与 Gemini 2.0 模型相比如何？

它提供了更大的上下文窗口（1M对比最高32K）和更高的输出限制（65K对比8K）。它还支持更多的输入模态。然而，它是一个预览版本，稳定性可能不如Gemini 2.0稳定版。

OrcaRouter 是否处理请求的数据隐私？

所提供的资料中未指定数据处理政策。用户应查阅OrcaRouter的数据处理和隐私文档，以了解输入和输出数据是如何被处理的。

如何通过兼容OpenAI的API调用此模型？

使用基础URL https://api.orcarouter.ai/v1 并将模型ID设置为"google/gemini-3.1-pro-preview"。API遵循标准OpenAI聊天完成格式。身份验证需要来自OrcaRouter的API密钥。

τ²-Bench 分数是什么，为什么它很重要？

该模型在τ²-Bench上获得了95.6分，τ²-Bench是一个衡量任务完成性能的基准。这一量化指标反映了模型准确处理复杂多步任务的能力。

我可以在生产环境中使用这个模型吗？

作为预览模型，它专为测试和实验设计。可能具有较低的速率限制、较低的可靠性，并会持续变更。若用于生产环境，请考虑使用稳定、非预览的模型。

支持哪些输入模式？

模型支持音频、文件（例如PDF、代码文件）、图像、文本和视频输入。所有这些都可以包含在单个请求中，以实现跨模态推理。

模型是否支持流式响应？

现有事实未明确说明流式支持。OrcaRouter的API可能支持兼容模型的流式传输，但在此预览版本中，请查阅文档以了解流参数是否可用。

嵌入此徽章

粘贴到您的博客文章

Google: Gemini 3.1 Pro Preview•$2.00/M in•5707ms p50•通过 OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview 在 OrcaRouter" /> </a>

Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)

Gemini 3.1 Pro Preview

什么是 Google Gemini 3.1 Pro Preview？

谁应该使用这个模型？

关键规格是什么？

它与其他Gemini预览版相比如何？

它处理哪些输入模态？

它提供多大的上下文窗口？

这个模型的最佳使用场景是什么？

何时应该使用更便宜的模型？

什么是τ²-Bench分数，它的含义是什么？

关于速度和延迟，我们知道什么？

基于现有数据，该模型的优势是什么？

有哪些需要正视的限制？

这个模型在OrcaRouter上的定价结构是怎样的？

用户应考虑哪些成本权衡？

是否可以使用缓存来降低成本？

相对于其他谷歌模型，其成本大概是多少？

我如何通过OrcaRouter的API调用模型？

我可以配置哪些参数？

如何从其他提供商迁移到OrcaRouter？

使用API时，关于预览状态我应该了解什么？