Gemini 3 Flash Preview

google/gemini-3-flash-preview
di Google · 2025-12-17

Google Gemini 3 Flash Preview – Modello multimodale con contesto di 1M token, 88.2 MMLU-Pro, accessibile tramite OrcaRouter.

ctx1.05M token
Inputtext + image + file + audio + video
Outputtext
p50 TTFT3.81 s
INGRESSO$0.50/ 1M token
USCITA$3.00/ 1M token
p50 TTFT3.81 s7 g
p95 TTFT10.00 s7 g
TRAFFICO1.1Mtoken / 7 g

Dettagli del modello

Che cos'è Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview è un modello multimodale sviluppato da Google, ottimizzato per la velocità e l'elaborazione di contesti estesi. Accetta input in formato testo, immagine, file, audio e video e può generare fino a 65.536 token di output. Il modello ha una finestra di contesto di 1.048.576 token, che gli consente di ragionare su sequenze molto lunghe. Ottiene un punteggio di 88,2 sul benchmark MMLU-Pro, a indicare prestazioni solide in un'ampia gamma di compiti accademici e di ragionamento. Questa versione di anteprima è disponibile tramite l'API compatibile con OpenAI di OrcaRouter con l'ID modello google/gemini-3-flash-preview.

Chi è il pubblico di destinazione per questo modello?

Gemini 3 Flash Preview si rivolge a sviluppatori e organizzazioni che creano applicazioni che richiedono ragionamento multimodale rapido con contesto ampio. È particolarmente adatto per casi d'uso come l'analisi video, il riepilogo di documenti lunghi e la comprensione di audio e video in tempo reale. Il prezzo del modello—$0,50 per milione di token in input e $3,00 per milione di token in output—lo rende accessibile sia per startup che per aziende. Poiché si tratta di un'anteprima, i primi utilizzatori possono valutarne le capacità prima di un rilascio stabile. OrcaRouter offre un accesso senza soluzione di continuità a questo modello, inclusi endpoint compatibili con OpenAI e nessun margine sulle tariffe dei provider.

Quali input multimodali supporta?

Gemini 3 Flash Preview supporta cinque modalità di input: testo, immagine, file, audio e video. Il testo può essere semplice o strutturato; le immagini possono includere foto, diagrammi e screenshot; i file coprono formati come PDF e documenti; l'audio include parlato e musica; il video può essere elaborato con tracce sia visive che audio. Il modello può combinare più modalità in un unico prompt—ad esempio, analizzando un video mentre legge anche un PDF allegato. Questa versatilità consente di gestire compiti complessi e multimediali senza richiedere pipeline separate. I token di input vengono conteggiati in base alle regole specifiche del tokenizer di ciascuna modalità.

Qual è lo stato di anteprima e quanto è stabile?

Gemini 3 Flash Preview è una versione pre-release del modello Flash di terza generazione di Google. In quanto anteprima, potrebbe subire modifiche nel comportamento, nelle prestazioni e nella disponibilità. Google aggiorna tipicamente i modelli in anteprima in base al feedback degli utenti e potrebbe eventualmente sostituire gli endpoint di anteprima con versioni stabili. Sebbene il modello sia funzionale e adatto per test e sviluppo, le distribuzioni in produzione dovrebbero monitorare gli aggiornamenti. OrcaRouter rispecchia l'endpoint del fornitore, assicurando che eventuali modifiche da parte di Google vengano rispecchiate prontamente. L'ID del modello google/gemini-3-flash-preview rimarrà coerente a meno che Google non modifichi la sua denominazione.

Esempi di codice

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prezzi

Input / 1M token$0.500
Output / 1M token$3.00
Lettura cache / 1M$0.050
ValutaUSD

Prestazioni

p50 TTFT
3.81 s
Velocità di output
851 tok/s
p95 TTFT
10.00 s
Tasso di errore
0%

Benchmark pubblici

37.8
AA Coding
Migliore del 47% dei modelli confrontati
35.0
AA Intelligence
Migliore del 35% dei modelli confrontati
55.7
AA Math
Migliore del 32% dei modelli confrontati
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Fonte: artificialanalysis.ai

FAQ

Qual è il costo per utilizzare Gemini 3 Flash Preview?
Prezzo di $0.50 per milione di token di input e $3.00 per milione di token di output, fatturato al tasso del fornitore con zero ricarico aggiunto da OrcaRouter.
Qual è la dimensione della finestra di contesto?
Il contesto finestra è di 1.048.576 token per l'input e il modello può generare fino a 65.536 token di output.
Quali sono le modalità di input supportate?
Testo, immagine, file, audio e video sono tutti accettati come input. L'output è solo testo.
Come si confronta con Gemini 2 Flash?
Gemini 3 Flash Preview ha una finestra di contesto più grande (1M vs fino a 1M ma spesso più piccola), un punteggio MMLU-Pro più alto (88.2) e un supporto multimodale ampliato che include video. È più veloce e più capace per compiti complessi, ma Gemini 2 Flash è più economico per token.
Come gestisce OrcaRouter la privacy dei dati?
OrcaRouter inoltra le tue richieste all'API di Google. Il trattamento dei dati segue l'informativa sulla privacy di Google. OrcaRouter non registra né conserva i tuoi contenuti oltre quanto necessario per elaborare la richiesta. Consulta le politiche di entrambi i fornitori per i dettagli.
Posso chiamare Gemini 3 Flash Preview utilizzando un'API compatibile con OpenAI?
Sì. Usa l'API di OrcaRouter su https://api.orcarouter.ai/v1 con ID modello "google/gemini-3-flash-preview". L'autenticazione utilizza una chiave API OrcaRouter. I formati di richiesta e risposta seguono lo schema Chat Completions di OpenAI.
Quali sono i principali punti di forza del modello?
Velocità di inferenza elevata, contesto ampio di 1 milione di token, input multimodale (testo, immagine, file, audio, video), solido benchmark MMLU-Pro (88,2) e costo basso rispetto a modelli più grandi.
Gemini 3 Flash Preview è disponibile per la produzione?
È una versione di anteprima, il che significa che potrebbe subire modifiche, disponibilità intermittente o supporto limitato. È adatta per test e sviluppo; per carichi di lavoro critici in produzione, considera di utilizzare la versione stabile una volta disponibile.
Come posso stimare l'utilizzo dei token per input multimodali?
Ogni modalità ha la propria tokenizzazione. Immagini, audio e video vengono suddivisi in token in base a risoluzione e durata. OrcaRouter segnala l'utilizzo dei token nella risposta API. Puoi anche consultare la documentazione di Google per le regole dettagliate di conteggio dei token.
Cosa succede se supero la finestra di contesto?
Input superiori a 1.048.576 token verranno troncati a partire dal contenuto più vecchio. Il modello ignorerà i token in eccesso. Assicurati che i tuoi messaggi rientrino nel limite monitorando il totale dei token nella tua richiesta.

Incorpora questo badge

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50tramite OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview su OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)