Gemini 3.1 Pro Preview

google/gemini-3.1-pro-preview
Carro-chefeDestaque
por Google · 2026-02-19

Google Gemini 3.1 Pro Preview: modelo multimodal carro-chefe com janela de contexto de 1M e pontuação 95.6 τ²-Bench, acessado via OrcaRouter API.

ctx1.05M tokens
Entradaaudio + file + image + text + video
Saídatext
p50 TTFT5.71 s
ENTRADA$2.00/ 1M tokens
SAÍDA$12.00/ 1M tokens
p50 TTFT5.71 s7 d
p95 TTFT10.00 s7 d
TRÁFEGO5.1Mtokens / 7 d

Detalhes do modelo

O que é Google Gemini 3.1 Pro Preview?

O Google Gemini 3.1 Pro Preview é um modelo carro-chefe do Google, oferecido em forma de pré-visualização. É um modelo multimodal capaz de processar entradas de texto, imagem, vídeo, áudio e arquivos. O modelo é categorizado como nível carro-chefe, indicando que foi projetado para aplicações de alta demanda e complexas, onde desempenho e capacidade são críticos. Como pré-visualização, pode ter limitações em estabilidade ou disponibilidade em comparação com versões estáveis. O acesso é fornecido através da API OrcaRouter.

Quem deve usar este modelo?

Este modelo é destinado a desenvolvedores e empresas que precisam lidar com grandes janelas de contexto de até 1.048.576 tokens e exigem compreensão multimodal. Casos de uso incluem análise de documentos longos, moderação de vídeos, chatbots avançados com memória de conversas inteiras e extração complexa de dados de mídia mista. O status de pré-visualização o torna adequado para experimentação e integração inicial, mas implantações em produção devem avaliar a estabilidade. Também é ideal para equipes que já usam a API compatível com OpenAI da OrcaRouter e que desejam testar as principais capacidades do Google.

Quais são as principais especificações?

O modelo suporta uma janela de contexto de 1.048.576 tokens (entrada) e uma saída máxima de 65.536 tokens. Aceita entrada em múltiplas modalidades: áudio, arquivo (ex.: PDF, arquivos de código), imagem, texto e vídeo. A pontuação de referência principal é 95.6 no τ²-Bench, uma métrica que mede o desempenho na conclusão de tarefas. O modelo é classificado como flagship por seu provedor, Google. Ele é acessado via API da OrcaRouter na URL base https://api.orcarouter.ai/v1 com o ID do modelo "google/gemini-3.1-pro-preview".

Como isso se compara a outras prévias do Gemini?

Como uma versão de pré-visualização do Gemini 3.1 Pro, este modelo está no topo da linha atual da Google entre as versões de pré-visualização. Ele oferece uma janela de contexto significativamente maior (1M tokens) e limites de saída mais altos (65K tokens) em comparação com modelos anteriores do Gemini 2.0 ou pré-visualizações do Gemini 3.0. A pontuação τ²-Bench de 95,6 fornece um benchmark quantitativo para desempenho orientado a tarefas. Comparado a outros modelos de pré-visualização da Google, este visa os casos de uso mais exigentes, onde tanto a amplitude do contexto quanto a profundidade do raciocínio são necessárias.

Exemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preços

NívelEntrada / 1M tokensSaída / 1M tokensLeitura de cache / 1MEscrita de cache / 1M
200K$2.00$12.00$0.200$0.375
$4.00$18.00$0.400$0.375
Nível selecionado pela contagem de tokens de entrada de cada solicitação

Desempenho

p50 TTFT
5.71 s
Velocidade de saída
429 tok/s
p95 TTFT
10.00 s
Taxa de erro
0%

Benchmarks públicos

55.5
AA Coding
Melhor que 75% dos modelos comparados
57.2
AA Intelligence
Melhor que 80% dos modelos comparados
GPQA Diamond
94.1
Humanity's Last Exam
44.7
IFBench
77.1
Long-Context Recall
72.7
SciCode
58.9
TerminalBench Hard
53.8
τ²-Bench
95.6
Fonte: artificialanalysis.ai

FAQ

Qual é o custo de usar o Gemini 3.1 Pro Preview no OrcaRouter?
Os detalhes de preços não são fornecidos nos fatos disponíveis. Como um modelo principal, ele é normalmente precificado mais alto por token do que modelos menores. Os custos dependem do uso de tokens de entrada e saída. Consulte a página de preços atual do OrcaRouter para obter as taxas exatas.
Qual é o tamanho da janela de contexto?
O modelo suporta uma janela de contexto de 1.048.576 tokens (entrada). Isso significa que você pode enviar documentos muito longos, códigos ou histórico de conversas em uma única solicitação. A saída máxima é de 65.536 tokens.
Quais são os principais pontos fortes deste modelo?
Suas principais vantagens incluem uma janela de contexto massiva (1M tokens), alto limite de saída (65K tokens), entrada multimodal (áudio, arquivo, imagem, texto, vídeo) e uma forte pontuação τ²-Bench de 95.6, indicando alta precisão em tarefas agênticas.
Como o Gemini 3.1 Pro Preview se compara aos modelos Gemini 2.0?
Ela oferece uma janela de contexto muito maior (1M vs. até 32K) e um limite de saída mais alto (65K vs. 8K). Também suporta mais modalidades de entrada. No entanto, é uma versão de pré-visualização e pode ter menos estabilidade que as versões estáveis do Gemini 2.0.
O OrcaRouter lida com a privacidade de dados para solicitações?
As políticas de tratamento de dados não estão especificadas nos fatos fornecidos. Os usuários devem revisar a documentação de processamento de dados e privacidade da OrcaRouter para entender como os dados de entrada e saída são tratados.
Como faço para chamar este modelo por meio de uma API compatível com OpenAI?
Use a base URL https://api.orcarouter.ai/v1 e defina o ID do modelo como "google/gemini-3.1-pro-preview". A API segue o formato padrão de completações de chat da OpenAI. A autenticação requer uma chave de API da OrcaRouter.
Qual é a pontuação do τ²-Bench e por que ela é importante?
O modelo obteve 95.6 no τ²-Bench, um benchmark que mede o desempenho na conclusão de tarefas. Essa métrica quantitativa reflete a capacidade do modelo de lidar com tarefas complexas e de várias etapas com precisão.
Posso usar este modelo em produção?
Como um modelo de pré-visualização, ele é destinado a testes e experimentação. Pode ter limites de taxa mais baixos, menos confiabilidade e mudanças contínuas. Para produção, considere usar um modelo estável, não de pré-visualização.
Quais modalidades de entrada são suportadas?
O modelo suporta entradas de áudio, arquivos (por exemplo, PDFs, arquivos de código), imagem, texto e vídeo. Todos podem ser incluídos em uma única solicitação para raciocínio cross-modal.
O modelo está disponível para respostas em streaming?
Os fatos disponíveis não especificam suporte a streaming. A API do OrcaRouter provavelmente oferece suporte a streaming para modelos compatíveis, mas para esta prévia, verifique a documentação para a disponibilidade do parâmetro stream.

Incorporar este selo

Google: Gemini 3.1 Pro Preview$2.00/M in5707ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview no OrcaRouter" /> </a>
Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)