Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

par Google · 2025-12-17

Google Gemini 3 Flash Preview – Modèle multimodal avec un contexte de 1M tokens, 88.2 MMLU-Pro, accessible via OrcaRouter.

Points de terminaison:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M tokens

Entréetext + image + file + audio + video

Sortietext

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

ENTRÉE$0.50/ 1M tokens

SORTIE$3.00/ 1M tokens

p50 TTFT3.81 s7 j

TTFT p9510.00 s7 j

TRAFIC1.1Mtokens / 7 j

Obtenir l'API Gemini 3 Flash Preview →▶ Essayer dans le Playground </> Utiliser via API

Qu'est-ce que Google Gemini 3 Flash Preview ?

Google Gemini 3 Flash Preview est un modèle multimodal développé par Google, optimisé pour la vitesse et le traitement de grands contextes. Il accepte des entrées au format texte, image, fichier, audio et vidéo, et peut générer jusqu'à 65 536 tokens de sortie. Le modèle dispose d'une fenêtre de contexte de 1 048 576 tokens, lui permettant de raisonner sur de très longues séquences. Il obtient un score de 88,2 au benchmark MMLU-Pro, ce qui indique de solides performances dans un large éventail de tâches académiques et de raisonnement. Cette version d'aperçu est disponible via l'API compatible OpenAI d'OrcaRouter sous l'ID de modèle google/gemini-3-flash-preview.

Qui est le public cible pour ce modèle ?

Gemini 3 Flash Preview cible les développeurs et les organisations qui construisent des applications nécessitant un raisonnement multimodal rapide avec un large contexte. Il est bien adapté à des cas d'utilisation comme l'analyse vidéo, le digest de longs documents et la compréhension audio-vidéo en temps réel. La tarification du modèle — 0,50 $ par million de tokens en entrée et 3,00 $ par million de tokens en sortie — le rend accessible aussi bien aux startups qu'aux grandes entreprises. Comme il s'agit d'un aperçu, les premiers adoptants peuvent évaluer ses capacités avant une version stable. OrcaRouter offre un accès transparent à ce modèle, y compris des points de terminaison compatibles OpenAI et aucune majoration sur les tarifs des fournisseurs.

Quelles entrées multimodales supporte-t-il ?

Gemini 3 Flash Preview prend en charge cinq modalités d’entrée : texte, image, fichier, audio et vidéo. Le texte peut être simple ou structuré ; les images peuvent inclure des photos, des diagrammes et des captures d’écran ; les fichiers couvrent des formats comme PDF et documents ; l’audio inclut la parole et la musique ; la vidéo peut être traitée avec des pistes visuelles et audio. Le modèle peut combiner plusieurs modalités dans une seule requête—par exemple, analyser une vidéo tout en lisant un PDF joint. Cette polyvalence lui permet de gérer des tâches complexes multimédia sans nécessiter de pipelines séparés. Les tokens d’entrée sont comptés selon les règles spécifiques de tokenisation de chaque modalité.

Quel est le statut de la prévisualisation et à quel point est-elle stable ?

Gemini 3 Flash Preview est une version préliminaire du modèle Flash de troisième génération de Google. En tant qu'aperçu, il peut subir des changements de comportement, de performance et de disponibilité. Google met généralement à jour les modèles d'aperçu en fonction des retours des utilisateurs, et ils peuvent éventuellement remplacer les points de terminaison d'aperçu par des versions stables. Bien que le modèle soit fonctionnel et adapté aux tests et au développement, les déploiements en production doivent surveiller les mises à jour. OrcaRouter reflète le point de terminaison du fournisseur, garantissant que tout changement de Google est reflété rapidement. L'ID du modèle google/gemini-3-flash-preview restera cohérent à moins que Google ne modifie son nom.

Exemples de code

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Tarifs

Entrée / 1M tokens	$0.500
Sortie / 1M tokens	$3.00
Lecture cache / 1M	$0.050
Devise	USD

Performances

7 derniers jours

p50 TTFT

3.81 s

Vitesse de sortie

851 tok/s

TTFT p95

10.00 s

Taux d'erreur

Benchmarks publics

Dernière évaluation 2025-12-17

37.8

AA Coding

Meilleur que 47 % des modèles comparés

35.0

AA Intelligence

Meilleur que 35 % des modèles comparés

55.7

AA Math

Meilleur que 32 % des modèles comparés

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

Source: artificialanalysis.ai

Plus de Google

Voir tous les modèles de google →

Gemini 3.1 Pro PreviewPhare

google/gemini-3.1-pro-preview

$2.00 entrée · $12.00 sortie / 1M

1.05M ctx· qualité 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 entrée · $18.00 sortie / 1M

1.05M ctx· qualité 10/10

Gemini 3.5 FlashLe moins cher

google/gemini-3.5-flash

$1.50 entrée · $9.00 sortie / 1M

1.05M ctx· qualité 9/10

FAQ

Quel est le coût pour utiliser Gemini 3 Flash Preview ?

La tarification est de 0,50 $ par million de tokens d'entrée et de 3,00 $ par million de tokens de sortie, facturé au tarif du fournisseur sans aucune majoration ajoutée par OrcaRouter.

Quelle est la taille de la fenêtre de contexte ?

La fenêtre de contexte est de 1,048,576 tokens pour l'entrée et le modèle peut générer jusqu'à 65,536 tokens de sortie.

Quelles sont les modalités d'entrée prises en charge ?

Texte, image, fichier, audio et vidéo sont tous acceptés en entrée. La sortie est uniquement textuelle.

Comment se compare-t-il à Gemini 2 Flash ?

Gemini 3 Flash Preview dispose d'une fenêtre de contexte plus large (1M contre jusqu'à 1M mais souvent moins), d'un score MMLU-Pro plus élevé (88,2) et d'un support multimodal étendu incluant la vidéo. Il est plus rapide et plus performant pour les tâches complexes, mais Gemini 2 Flash est moins cher par jeton.

Comment OrcaRouter gère-t-il la confidentialité des données ?

OrcaRouter transmet vos demandes à l'API de Google. Le traitement des données suit la politique de confidentialité de Google. OrcaRouter ne consigne ni ne stocke votre contenu au-delà de ce qui est nécessaire pour traiter la demande. Consultez les politiques des deux fournisseurs pour plus de détails.

Puis-je appeler Gemini 3 Flash Preview en utilisant une API compatible OpenAI ?

Oui. Utilisez l'API d'OrcaRouter à l'adresse https://api.orcarouter.ai/v1 avec l'ID de modèle "google/gemini-3-flash-preview". L'authentification utilise une clé API OrcaRouter. Les formats de requête et de réponse suivent le schéma Chat Completions d'OpenAI.

Quelles sont les principales forces du modèle ?

Vitesse d'inférence élevée, grand contexte de 1M de tokens, entrée multimodale (texte, image, fichier, audio, vidéo), solide benchmark MMLU-Pro (88,2) et coût faible par rapport aux modèles plus grands.

Le Gemini 3 Flash Preview est-il disponible pour la production ?

Il s'agit d'une version préliminaire, ce qui signifie qu'elle peut comporter des modifications, une disponibilité intermittente ou un support limité. Elle est adaptée aux tests et au développement ; pour des charges de travail critiques en production, envisagez d'utiliser la version stable dès qu'elle sera disponible.

Comment estimer l'utilisation des tokens pour les entrées multimodales ?

Chaque modalité a sa propre tokenisation. Les images, l'audio et la vidéo sont divisés en tokens en fonction de la résolution et de la durée. OrcaRouter signale l'utilisation des tokens dans la réponse de l'API. Vous pouvez également consulter la documentation de Google pour les règles détaillées de comptage des tokens.

Que se passe-t-il si je dépasse la fenêtre de contexte ?

Les entrées dépassant 1 048 576 jetons seront tronquées à partir du contenu le plus ancien. Le modèle ignorera les jetons en excès. Assurez-vous que vos messages respectent la limite en surveillant le nombre total de jetons dans votre demande.

Intégrer ce badge

Coller dans votre article de blog

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•via OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview sur OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

Qu'est-ce que Google Gemini 3 Flash Preview ?

Qui est le public cible pour ce modèle ?

Quelles entrées multimodales supporte-t-il ?

Quel est le statut de la prévisualisation et à quel point est-elle stable ?

Que peut faire Gemini 3 Flash Preview avec du texte et des images ?

Comment gère-t-il l'audio et la vidéo ?

Quels sont les meilleurs cas d'utilisation pour ce modèle Flash ?

Quand pourriez-vous choisir un modèle moins cher ou plus puissant à la place ?

Que signifie le score MMLU-Pro de 88,2 ?

Quelle est la vitesse d'inférence de Gemini 3 Flash Preview ?

Quels sont les principaux points forts du modèle basés sur les benchmarks ?

Quelles sont les limitations honnêtes de Gemini 3 Flash Preview ?

Quelle est la structure tarifaire pour Gemini 3 Flash Preview ?

Comment le prix se compare-t-il aux autres modèles ?

Y a-t-il des réductions pour le caching ou des tarifs dégressifs ?

Comment puis-je appeler Gemini 3 Flash Preview via l'API d'OrcaRouter ?

Quels paramètres sont disponibles lors de l'appel du modèle ?

Comment migrer de l'API native de Google vers OrcaRouter ?

Y a-t-il une différence dans le format de réponse par rapport à OpenAI ?

Comment Gemini 3 Flash Preview se compare-t-il à Gemini 2 Flash ?

Comment se compare-t-il à GPT-4o?

Comment se compare-t-il aux autres modèles Google ?

Exemples de code

Tarifs

Performances

Benchmarks publics

Plus de Google

FAQ

Intégrer ce badge

Gemini 3 Flash Preview

Détails du modèle

Qu'est-ce que Google Gemini 3 Flash Preview ?

Qui est le public cible pour ce modèle ?

Quelles entrées multimodales supporte-t-il ?

Quel est le statut de la prévisualisation et à quel point est-elle stable ?

Que peut faire Gemini 3 Flash Preview avec du texte et des images ?

Comment gère-t-il l'audio et la vidéo ?

Quels sont les meilleurs cas d'utilisation pour ce modèle Flash ?

Quand pourriez-vous choisir un modèle moins cher ou plus puissant à la place ?

Que signifie le score MMLU-Pro de 88,2 ?

Quelle est la vitesse d'inférence de Gemini 3 Flash Preview ?

Quels sont les principaux points forts du modèle basés sur les benchmarks ?

Quelles sont les limitations honnêtes de Gemini 3 Flash Preview ?

Quelle est la structure tarifaire pour Gemini 3 Flash Preview ?

Comment le prix se compare-t-il aux autres modèles ?

Y a-t-il des réductions pour le caching ou des tarifs dégressifs ?

Comment puis-je appeler Gemini 3 Flash Preview via l'API d'OrcaRouter ?

Quels paramètres sont disponibles lors de l'appel du modèle ?

Comment migrer de l'API native de Google vers OrcaRouter ?

Y a-t-il une différence dans le format de réponse par rapport à OpenAI ?

Comment Gemini 3 Flash Preview se compare-t-il à Gemini 2 Flash ?

Comment se compare-t-il à GPT-4o?

Comment se compare-t-il aux autres modèles Google ?

Exemples de code

Tarifs

Performances

Benchmarks publics

Plus de Google

FAQ

Intégrer ce badge