Gemini 3.1 Pro Preview Custom Tools

Name: Google: Gemini 3.1 Pro Preview Custom Tools API
Brand: Google

google/gemini-3.1-pro-preview-customtools

por Google · 2026-02-25

Google Gemini 3.1 Pro Preview Ferramentas Personalizadas – 1M contexto, 95.6 τ²-Bench, multimodal via OrcaRouter.

Endpoints:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M tokens

Entradatext + audio + image + video + file

Saídatext

p50 TTFT3.80 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

ENTRADA$4.00/ 1M tokens

SAÍDA$18.00/ 1M tokens

p50 TTFT3.80 s7 d

p95 TTFT5.68 s7 d

TRÁFEGO3.1Mtokens / 7 d

Obter a API Gemini 3.1 Pro Preview Custom Tools →▶ Testar no Playground </> Usar via API

O que é Google Gemini 3.1 Pro Preview Custom Tools?

Google Gemini 3.1 Pro Preview Custom Tools é um modelo de linguagem grande em fase de pré‑visualização desenvolvido pelo Google. Ele é projetado para tarefas que exigem raciocínio de longa duração, grandes janelas de contexto e integração com ferramentas externas. O modelo aceita entradas nos formatos de texto, áudio, imagem, vídeo e arquivo, tornando‑o uma solução multimodal tanto para compreensão quanto para geração de conteúdo. Através do OrcaRouter, você pode chamar o modelo usando uma API compatível com OpenAI na URL base https://api.orcarouter.ai/v1 com o ID do modelo "google/gemini-3.1-pro-preview-customtools". Essa compatibilidade simplifica a integração para equipes já familiarizadas com o SDK da OpenAI ou clientes similares. Como um modelo de pré‑visualização, pode ter limitações de disponibilidade ou desempenho em comparação com versões estáveis.

Para quem este modelo é destinado?

Este modelo é adequado para desenvolvedores, cientistas de dados e equipes empresariais que precisam processar documentos muito longos (até 1 milhão de tokens) ou combinar múltiplas modalidades de entrada (texto, áudio, imagem, vídeo, arquivos) em uma única etapa de raciocínio. É particularmente valioso para tarefas que envolvem uso de ferramentas personalizadas—onde o modelo deve decidir quando e como chamar funções ou APIs externas. Equipes que trabalham em pesquisa, análise jurídica, processamento de mídia ou automação avançada acharão útil o grande contexto e o forte desempenho em benchmarks. Por ser uma prévia, pode ser ideal para prototipagem e avaliação, em vez de sistemas de produção que exigem tempo de atividade ou latência garantidos.

Principais funcionalidades de relance

O modelo oferece uma janela de contexto de 1.048.576 tokens e uma saída máxima de 65.536 tokens. As modalidades de entrada abrangem texto, áudio, imagem, vídeo e upload de arquivos. A pontuação de referência principal é 95,6 no τ²-Bench, um teste de raciocínio com uso de ferramentas. O preço é de $4,00 por 1M de tokens de entrada e $18,00 por 1M de tokens de saída, sem margem adicional quando acessado via OrcaRouter. A API é compatível com OpenAI, e o ID do modelo é "google/gemini-3.1-pro-preview-customtools". Como pré-visualização, ele reflete as capacidades mais recentes, mas pode estar sujeito a alterações.

Exemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview-customtools",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preços

Entrada / 1M tokens	$4.00
Saída / 1M tokens	$18.00
Leitura de cache / 1M	$0.400
Moeda	USD

Desempenho

últimos 7 dias

p50 TTFT

3.80 s

Velocidade de saída

215 tok/s

p95 TTFT

5.68 s

Taxa de erro

Benchmarks públicos

Última avaliação 2026-02-19

55.5

AA Coding

Melhor que 75% dos modelos comparados

57.2

AA Intelligence

Melhor que 80% dos modelos comparados

GPQA Diamond

94.1

Humanity's Last Exam

44.7

IFBench

77.1

Long-Context Recall

72.7

SciCode

58.9

TerminalBench Hard

53.8

τ²-Bench

95.6

Fonte: artificialanalysis.ai

Mais de Google

Ver todos os modelos de google →

Gemini 3.1 Pro PreviewCarro-chefe

google/gemini-3.1-pro-preview

$2.00 entrada · $12.00 saída / 1M

1.05M ctx· qualidade 10/10

Gemini 3 Flash PreviewMais barato

google/gemini-3-flash-preview

$0.50 entrada · $3.00 saída / 1M

1.05M ctx· qualidade 9/10

Gemini 3.5 Flash

google/gemini-3.5-flash

$1.50 entrada · $9.00 saída / 1M

1.05M ctx· qualidade 9/10

FAQ

Qual é o custo para usar Google Gemini 3.1 Pro Preview Custom Tools?

O preço é de $4.00 por 1 milhão de tokens de entrada e $18.00 por 1 milhão de tokens de saída. Eles são cobrados à taxa do provedor com margem zero quando acessados através do OrcaRouter.

Qual é o tamanho da janela de contexto?

A janela de contexto é de 1,048,576 tokens (aproximadamente 1 milhão de tokens). A saída máxima é de 65,536 tokens por solicitação.

Quais são os principais pontos fortes do modelo?

Ele se destaca em tarefas que exigem uso de ferramentas (pontuação 95.6 no τ²-Bench), tem uma janela de contexto muito grande e aceita entrada multimodal (texto, áudio, imagem, vídeo, arquivo).

Como ele se compara ao Gemini 1.5 Pro?

Este modelo de pré-visualização tem uma pontuação mais alta no τ²-Bench e é otimizado para uso personalizado de ferramentas. É mais caro que o Gemini 1.5 Pro, que pode ser adequado se não precisar do desempenho mais recente no uso de ferramentas.

Como posso chamar este modelo via uma API compatível com OpenAI?

Defina a URL base para https://api.orcarouter.ai/v1, o ID do modelo para google/gemini-3.1-pro-preview-customtools e use sua chave de API do OrcaRouter. A API segue o formato de chat completions do OpenAI.

Quais modalidades de entrada ele suporta?

Ele suporta entradas de texto, áudio, imagem, vídeo e arquivo. Estas podem ser combinadas em uma única solicitação para raciocínio multimodal.

Como funciona o tratamento de dados?

Os fatos disponíveis não especificam políticas de retenção de dados ou privacidade. Você deve consultar os termos de serviço da OrcaRouter e as políticas de uso de dados do Google para obter detalhes sobre como seus dados são tratados.

Existe algum cache ou cache de prompt disponível?

Nenhuma informação sobre cache é fornecida nos dados disponíveis. Verifique a documentação do OrcaRouter para quaisquer recursos de cache que possam reduzir custos para entradas repetidas.

Qual é a latência esperada?

Os valores exatos de latência não são fornecidos. Em geral, modelos com grandes janelas de contexto podem ter maior latência devido ao tempo de processamento. Teste com suas próprias cargas de trabalho para determinar o desempenho.

Posso usar este modelo em produção?

É um modelo de pré-visualização, por isso pode ter menor confiabilidade ou garantias de tempo de atividade em comparação com versões estáveis. Use-o para prototipagem e avaliação; considere modelos estáveis para sistemas de produção.

Incorporar este selo

Cole no seu post do blog

Google: Gemini 3.1 Pro Preview Custom Tools•$4.00/M in•3800ms p50•via OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview-customtools" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview-customtools.svg" alt="Google: Gemini 3.1 Pro Preview Custom Tools no OrcaRouter" /> </a>

Markdown [![Google: Gemini 3.1 Pro Preview Custom Tools](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview-customtools.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview-customtools)

Gemini 3.1 Pro Preview Custom Tools

O que é Google Gemini 3.1 Pro Preview Custom Tools?

Para quem este modelo é destinado?

Principais funcionalidades de relance

Quais modalidades de entrada o modelo suporta?

Como funciona o uso de ferramenta personalizada?

Qual é o tamanho da janela de contexto e da saída máxima?

Quando você deve considerar um modelo mais barato?

Qual é a pontuação do τ²-Bench e o que ela mede?

Quais são os pontos fortes demonstrados do modelo?

Quais são as limitações do modelo?

Qual é a latência e a velocidade esperadas?

Quanto custa o modelo por token?

O que significa 'zero markup'?

Existem alguns trade-offs de custo a considerar?

Como faço para chamar o modelo via API do OrcaRouter?

Quais parâmetros são suportados?

Como posso migrar da API da OpenAI?

Qual autenticação o OrcaRouter requer?

Como este modelo se compara ao Gemini 1.5 Pro?

Como isso se compara ao GPT‑4o?

Como ele se compara ao Claude 3 Opus?

Exemplos de código

Preços

Desempenho

Benchmarks públicos

Mais de Google

FAQ

Incorporar este selo

Gemini 3.1 Pro Preview Custom Tools

Detalhes do modelo

O que é Google Gemini 3.1 Pro Preview Custom Tools?

Para quem este modelo é destinado?

Principais funcionalidades de relance

Quais modalidades de entrada o modelo suporta?

Como funciona o uso de ferramenta personalizada?

Qual é o tamanho da janela de contexto e da saída máxima?

Quando você deve considerar um modelo mais barato?

Qual é a pontuação do τ²-Bench e o que ela mede?

Quais são os pontos fortes demonstrados do modelo?

Quais são as limitações do modelo?

Qual é a latência e a velocidade esperadas?

Quanto custa o modelo por token?

O que significa 'zero markup'?

Existem alguns trade-offs de custo a considerar?

Como faço para chamar o modelo via API do OrcaRouter?

Quais parâmetros são suportados?

Como posso migrar da API da OpenAI?

Qual autenticação o OrcaRouter requer?

Como este modelo se compara ao Gemini 1.5 Pro?

Como isso se compara ao GPT‑4o?

Como ele se compara ao Claude 3 Opus?

Exemplos de código

Preços

Desempenho

Benchmarks públicos

Mais de Google

FAQ

Incorporar este selo