Gemini 3.1 Pro Preview

google/gemini-3.1-pro-preview
PhareEn vedette
par Google · 2026-02-19

Google Gemini 3.1 Pro Preview : modèle multimodal phare avec une fenêtre de contexte de 1M et un score τ²-Bench de 95.6, accessible via l'API OrcaRouter.

ctx1.05M tokens
Entréeaudio + file + image + text + video
Sortietext
p50 TTFT5.71 s
ENTRÉE$2.00/ 1M tokens
SORTIE$12.00/ 1M tokens
p50 TTFT5.71 s7 j
TTFT p9510.00 s7 j
TRAFIC5.1Mtokens / 7 j

Détails du modèle

Qu'est-ce que Google Gemini 3.1 Pro Preview ?

Google Gemini 3.1 Pro Preview est un modèle phare de Google, proposé sous forme d'aperçu. Il s'agit d'un modèle multimodal capable de traiter des entrées textuelles, images, vidéos, audio et fichiers. Le modèle est classé dans la catégorie phare, ce qui indique qu'il est conçu pour des applications exigeantes et complexes où les performances et la capacité sont essentielles. En tant qu'aperçu, il peut présenter des limitations en termes de stabilité ou de disponibilité par rapport aux versions stables. L'accès est fourni via l'API OrcaRouter.

Qui devrait utiliser ce modèle ?

Ce modèle est destiné aux développeurs et aux entreprises qui ont besoin de gérer de grandes fenêtres de contexte allant jusqu'à 1,048,576 tokens et requièrent une compréhension multimodale. Les cas d'usage incluent l'analyse de longs documents, la modération vidéo, les chatbots avancés avec mémoire de conversations entières, et l'extraction complexe de données à partir de médias mixtes. Le statut d'aperçu le rend adapté à l'expérimentation et à l'intégration précoce, mais les déploiements en production doivent évaluer la stabilité. Il est également idéal pour les équipes qui utilisent déjà l'API compatible OpenAI d'OrcaRouter et souhaitent tester les dernières capacités phares de Google.

Quelles sont les spécifications clés ?

Le modèle prend en charge une fenêtre de contexte de 1 048 576 tokens (entrée) et une sortie maximale de 65 536 tokens. Il accepte des entrées dans plusieurs modalités : audio, fichier (par exemple, PDF, fichiers de code), image, texte et vidéo. Le score de référence principal est de 95,6 sur τ²-Bench, une métrique qui mesure la performance d'exécution des tâches. Le modèle est classé comme niveau phare par son fournisseur, Google. Il est accessible via l'API d'OrcaRouter à l'URL de base https://api.orcarouter.ai/v1 avec l'identifiant de modèle "google/gemini-3.1-pro-preview".

Comment se compare-t-il aux autres aperçus Gemini ?

En tant que version preview de Gemini 3.1 Pro, ce modèle occupe le sommet de la gamme actuelle de Google parmi les versions preview. Il offre une fenêtre de contexte nettement plus grande (1M tokens) et des limites de sortie plus élevées (65K tokens) par rapport aux modèles précédents Gemini 2.0 ou aux previews de Gemini 3.0. Le score τ²-Bench de 95,6 fournit un repère quantitatif pour les performances orientées tâches. Comparé à d'autres modèles preview de Google, celui-ci cible les cas d'usage les plus exigeants, où la largeur du contexte et la profondeur du raisonnement sont toutes deux requises.

Exemples de code

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Tarifs

PalierEntrée / 1M tokensSortie / 1M tokensLecture cache / 1MÉcriture cache / 1M
200K$2.00$12.00$0.200$0.375
$4.00$18.00$0.400$0.375
Palier sélectionné selon le nombre de tokens d'entrée de chaque requête

Performances

p50 TTFT
5.71 s
Vitesse de sortie
429 tok/s
TTFT p95
10.00 s
Taux d'erreur
0%

Benchmarks publics

55.5
AA Coding
Meilleur que 75 % des modèles comparés
57.2
AA Intelligence
Meilleur que 80 % des modèles comparés
GPQA Diamond
94.1
Humanity's Last Exam
44.7
IFBench
77.1
Long-Context Recall
72.7
SciCode
58.9
TerminalBench Hard
53.8
τ²-Bench
95.6
Source: artificialanalysis.ai

FAQ

Quel est le coût d'utilisation de Gemini 3.1 Pro Preview sur OrcaRouter ?
Les détails de tarification ne sont pas fournis dans les faits disponibles. En tant que modèle phare, il est généralement facturé à un prix par jeton plus élevé que les modèles plus petits. Les coûts dépendent de l'utilisation des jetons en entrée et en sortie. Consultez la page de tarification actuelle d'OrcaRouter pour connaître les tarifs exacts.
Quelle est la taille de la fenêtre de contexte ?
Le modèle prend en charge une fenêtre de contexte de 1,048,576 tokens (entrée). Cela signifie que vous pouvez soumettre de très longs documents, du code ou un historique de conversation en une seule requête. La sortie maximale est de 65,536 tokens.
Quels sont les principaux atouts de ce modèle ?
Ses principaux atouts incluent une fenêtre de contexte massive (1M de tokens), une limite de sortie élevée (65K tokens), une entrée multimodale (audio, fichier, image, texte, vidéo) et un score τ²-Bench élevé de 95,6, indiquant une grande précision sur les tâches agentiques.
Comment Gemini 3.1 Pro Preview se compare-t-il aux modèles Gemini 2.0 ?
Il offre une fenêtre de contexte beaucoup plus large (1M contre jusqu'à 32K) et une limite de sortie plus élevée (65K contre 8K). Il prend également en charge davantage de modalités d'entrée. Cependant, il s'agit d'une version d'aperçu et peut être moins stable que les versions stables de Gemini 2.0.
Est-ce qu'OrcaRouter gère la confidentialité des données pour les requêtes ?
Les politiques de traitement des données ne sont pas spécifiées dans les faits fournis. Les utilisateurs devraient consulter la documentation sur le traitement des données et la confidentialité d'OrcaRouter pour comprendre comment les données d'entrée et de sortie sont traitées.
Comment puis-je appeler ce modèle via une API compatible OpenAI ?
Utilisez l'URL de base https://api.orcarouter.ai/v1 et définissez l'ID du modèle sur "google/gemini-3.1-pro-preview". L'API suit le format standard des complétions de chat OpenAI. L'authentification nécessite une clé API d'OrcaRouter.
Qu'est-ce que le score τ²-Bench et pourquoi est-il important ?
Le modèle a obtenu un score de 95,6 sur τ²-Bench, un benchmark qui mesure la performance d’achèvement de tâches. Cette métrique quantitative reflète la capacité du modèle à gérer avec précision des tâches complexes en plusieurs étapes.
Puis-je utiliser ce modèle en production ?
En tant que modèle d'aperçu, il est destiné aux tests et à l'expérimentation. Il peut avoir des limites de débit inférieures, une fiabilité moindre et des changements continus. Pour la production, envisagez d'utiliser un modèle stable et non d'aperçu.
Quelles modalités de saisie sont prises en charge ?
Le modèle prend en charge les entrées audio, fichier (par exemple, PDFs, fichiers de code), image, texte et vidéo. Toutes peuvent être incluses dans une seule requête pour un raisonnement intermodal.
Le modèle est-il disponible pour les réponses en streaming ?
Les faits disponibles ne précisent pas la prise en charge du streaming. L'API d'OrcaRouter prend probablement en charge le streaming pour les modèles compatibles, mais pour cet aperçu, consultez la documentation pour vérifier la disponibilité du paramètre stream.

Intégrer ce badge

Google: Gemini 3.1 Pro Preview$2.00/M in5707ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview sur OrcaRouter" /> </a>
Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)