Gemini 3 Flash Preview

google/gemini-3-flash-preview
par Google · 2025-12-17

Google Gemini 3 Flash Preview – Modèle multimodal avec un contexte de 1M tokens, 88.2 MMLU-Pro, accessible via OrcaRouter.

ctx1.05M tokens
Entréetext + image + file + audio + video
Sortietext
p50 TTFT3.81 s
ENTRÉE$0.50/ 1M tokens
SORTIE$3.00/ 1M tokens
p50 TTFT3.81 s7 j
TTFT p9510.00 s7 j
TRAFIC1.1Mtokens / 7 j

Détails du modèle

Qu'est-ce que Google Gemini 3 Flash Preview ?

Google Gemini 3 Flash Preview est un modèle multimodal développé par Google, optimisé pour la vitesse et le traitement de grands contextes. Il accepte des entrées au format texte, image, fichier, audio et vidéo, et peut générer jusqu'à 65 536 tokens de sortie. Le modèle dispose d'une fenêtre de contexte de 1 048 576 tokens, lui permettant de raisonner sur de très longues séquences. Il obtient un score de 88,2 au benchmark MMLU-Pro, ce qui indique de solides performances dans un large éventail de tâches académiques et de raisonnement. Cette version d'aperçu est disponible via l'API compatible OpenAI d'OrcaRouter sous l'ID de modèle google/gemini-3-flash-preview.

Qui est le public cible pour ce modèle ?

Gemini 3 Flash Preview cible les développeurs et les organisations qui construisent des applications nécessitant un raisonnement multimodal rapide avec un large contexte. Il est bien adapté à des cas d'utilisation comme l'analyse vidéo, le digest de longs documents et la compréhension audio-vidéo en temps réel. La tarification du modèle — 0,50 $ par million de tokens en entrée et 3,00 $ par million de tokens en sortie — le rend accessible aussi bien aux startups qu'aux grandes entreprises. Comme il s'agit d'un aperçu, les premiers adoptants peuvent évaluer ses capacités avant une version stable. OrcaRouter offre un accès transparent à ce modèle, y compris des points de terminaison compatibles OpenAI et aucune majoration sur les tarifs des fournisseurs.

Quelles entrées multimodales supporte-t-il ?

Gemini 3 Flash Preview prend en charge cinq modalités d’entrée : texte, image, fichier, audio et vidéo. Le texte peut être simple ou structuré ; les images peuvent inclure des photos, des diagrammes et des captures d’écran ; les fichiers couvrent des formats comme PDF et documents ; l’audio inclut la parole et la musique ; la vidéo peut être traitée avec des pistes visuelles et audio. Le modèle peut combiner plusieurs modalités dans une seule requête—par exemple, analyser une vidéo tout en lisant un PDF joint. Cette polyvalence lui permet de gérer des tâches complexes multimédia sans nécessiter de pipelines séparés. Les tokens d’entrée sont comptés selon les règles spécifiques de tokenisation de chaque modalité.

Quel est le statut de la prévisualisation et à quel point est-elle stable ?

Gemini 3 Flash Preview est une version préliminaire du modèle Flash de troisième génération de Google. En tant qu'aperçu, il peut subir des changements de comportement, de performance et de disponibilité. Google met généralement à jour les modèles d'aperçu en fonction des retours des utilisateurs, et ils peuvent éventuellement remplacer les points de terminaison d'aperçu par des versions stables. Bien que le modèle soit fonctionnel et adapté aux tests et au développement, les déploiements en production doivent surveiller les mises à jour. OrcaRouter reflète le point de terminaison du fournisseur, garantissant que tout changement de Google est reflété rapidement. L'ID du modèle google/gemini-3-flash-preview restera cohérent à moins que Google ne modifie son nom.

Exemples de code

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Tarifs

Entrée / 1M tokens$0.500
Sortie / 1M tokens$3.00
Lecture cache / 1M$0.050
DeviseUSD

Performances

p50 TTFT
3.81 s
Vitesse de sortie
851 tok/s
TTFT p95
10.00 s
Taux d'erreur
0%

Benchmarks publics

37.8
AA Coding
Meilleur que 47 % des modèles comparés
35.0
AA Intelligence
Meilleur que 35 % des modèles comparés
55.7
AA Math
Meilleur que 32 % des modèles comparés
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Source: artificialanalysis.ai

FAQ

Quel est le coût pour utiliser Gemini 3 Flash Preview ?
La tarification est de 0,50 $ par million de tokens d'entrée et de 3,00 $ par million de tokens de sortie, facturé au tarif du fournisseur sans aucune majoration ajoutée par OrcaRouter.
Quelle est la taille de la fenêtre de contexte ?
La fenêtre de contexte est de 1,048,576 tokens pour l'entrée et le modèle peut générer jusqu'à 65,536 tokens de sortie.
Quelles sont les modalités d'entrée prises en charge ?
Texte, image, fichier, audio et vidéo sont tous acceptés en entrée. La sortie est uniquement textuelle.
Comment se compare-t-il à Gemini 2 Flash ?
Gemini 3 Flash Preview dispose d'une fenêtre de contexte plus large (1M contre jusqu'à 1M mais souvent moins), d'un score MMLU-Pro plus élevé (88,2) et d'un support multimodal étendu incluant la vidéo. Il est plus rapide et plus performant pour les tâches complexes, mais Gemini 2 Flash est moins cher par jeton.
Comment OrcaRouter gère-t-il la confidentialité des données ?
OrcaRouter transmet vos demandes à l'API de Google. Le traitement des données suit la politique de confidentialité de Google. OrcaRouter ne consigne ni ne stocke votre contenu au-delà de ce qui est nécessaire pour traiter la demande. Consultez les politiques des deux fournisseurs pour plus de détails.
Puis-je appeler Gemini 3 Flash Preview en utilisant une API compatible OpenAI ?
Oui. Utilisez l'API d'OrcaRouter à l'adresse https://api.orcarouter.ai/v1 avec l'ID de modèle "google/gemini-3-flash-preview". L'authentification utilise une clé API OrcaRouter. Les formats de requête et de réponse suivent le schéma Chat Completions d'OpenAI.
Quelles sont les principales forces du modèle ?
Vitesse d'inférence élevée, grand contexte de 1M de tokens, entrée multimodale (texte, image, fichier, audio, vidéo), solide benchmark MMLU-Pro (88,2) et coût faible par rapport aux modèles plus grands.
Le Gemini 3 Flash Preview est-il disponible pour la production ?
Il s'agit d'une version préliminaire, ce qui signifie qu'elle peut comporter des modifications, une disponibilité intermittente ou un support limité. Elle est adaptée aux tests et au développement ; pour des charges de travail critiques en production, envisagez d'utiliser la version stable dès qu'elle sera disponible.
Comment estimer l'utilisation des tokens pour les entrées multimodales ?
Chaque modalité a sa propre tokenisation. Les images, l'audio et la vidéo sont divisés en tokens en fonction de la résolution et de la durée. OrcaRouter signale l'utilisation des tokens dans la réponse de l'API. Vous pouvez également consulter la documentation de Google pour les règles détaillées de comptage des tokens.
Que se passe-t-il si je dépasse la fenêtre de contexte ?
Les entrées dépassant 1 048 576 jetons seront tronquées à partir du contenu le plus ancien. Le modèle ignorera les jetons en excès. Assurez-vous que vos messages respectent la limite en surveillant le nombre total de jetons dans votre demande.

Intégrer ce badge

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview sur OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)