Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

di Google · 2025-12-17

Google Gemini 3 Flash Preview – Modello multimodale con contesto di 1M token, 88.2 MMLU-Pro, accessibile tramite OrcaRouter.

Endpoint:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M token

Inputtext + image + file + audio + video

Outputtext

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

INGRESSO$0.50/ 1M token

USCITA$3.00/ 1M token

p50 TTFT3.81 s7 g

p95 TTFT10.00 s7 g

TRAFFICO1.1Mtoken / 7 g

Ottieni l'API Gemini 3 Flash Preview →▶ Prova nel Playground </> Usa tramite API

Che cos'è Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview è un modello multimodale sviluppato da Google, ottimizzato per la velocità e l'elaborazione di contesti estesi. Accetta input in formato testo, immagine, file, audio e video e può generare fino a 65.536 token di output. Il modello ha una finestra di contesto di 1.048.576 token, che gli consente di ragionare su sequenze molto lunghe. Ottiene un punteggio di 88,2 sul benchmark MMLU-Pro, a indicare prestazioni solide in un'ampia gamma di compiti accademici e di ragionamento. Questa versione di anteprima è disponibile tramite l'API compatibile con OpenAI di OrcaRouter con l'ID modello google/gemini-3-flash-preview.

Chi è il pubblico di destinazione per questo modello?

Gemini 3 Flash Preview si rivolge a sviluppatori e organizzazioni che creano applicazioni che richiedono ragionamento multimodale rapido con contesto ampio. È particolarmente adatto per casi d'uso come l'analisi video, il riepilogo di documenti lunghi e la comprensione di audio e video in tempo reale. Il prezzo del modello—$0,50 per milione di token in input e $3,00 per milione di token in output—lo rende accessibile sia per startup che per aziende. Poiché si tratta di un'anteprima, i primi utilizzatori possono valutarne le capacità prima di un rilascio stabile. OrcaRouter offre un accesso senza soluzione di continuità a questo modello, inclusi endpoint compatibili con OpenAI e nessun margine sulle tariffe dei provider.

Quali input multimodali supporta?

Gemini 3 Flash Preview supporta cinque modalità di input: testo, immagine, file, audio e video. Il testo può essere semplice o strutturato; le immagini possono includere foto, diagrammi e screenshot; i file coprono formati come PDF e documenti; l'audio include parlato e musica; il video può essere elaborato con tracce sia visive che audio. Il modello può combinare più modalità in un unico prompt—ad esempio, analizzando un video mentre legge anche un PDF allegato. Questa versatilità consente di gestire compiti complessi e multimediali senza richiedere pipeline separate. I token di input vengono conteggiati in base alle regole specifiche del tokenizer di ciascuna modalità.

Qual è lo stato di anteprima e quanto è stabile?

Gemini 3 Flash Preview è una versione pre-release del modello Flash di terza generazione di Google. In quanto anteprima, potrebbe subire modifiche nel comportamento, nelle prestazioni e nella disponibilità. Google aggiorna tipicamente i modelli in anteprima in base al feedback degli utenti e potrebbe eventualmente sostituire gli endpoint di anteprima con versioni stabili. Sebbene il modello sia funzionale e adatto per test e sviluppo, le distribuzioni in produzione dovrebbero monitorare gli aggiornamenti. OrcaRouter rispecchia l'endpoint del fornitore, assicurando che eventuali modifiche da parte di Google vengano rispecchiate prontamente. L'ID del modello google/gemini-3-flash-preview rimarrà coerente a meno che Google non modifichi la sua denominazione.

Esempi di codice

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prezzi

Input / 1M token	$0.500
Output / 1M token	$3.00
Lettura cache / 1M	$0.050
Valuta	USD

Prestazioni

ultimi 7 giorni

p50 TTFT

3.81 s

Velocità di output

851 tok/s

p95 TTFT

10.00 s

Tasso di errore

Benchmark pubblici

Ultima valutazione 2025-12-17

37.8

AA Coding

Migliore del 47% dei modelli confrontati

35.0

AA Intelligence

Migliore del 35% dei modelli confrontati

55.7

AA Math

Migliore del 32% dei modelli confrontati

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

Fonte: artificialanalysis.ai

Altri da Google

Vedi tutti i modelli di google →

Gemini 3.1 Pro PreviewAmmiraglia

google/gemini-3.1-pro-preview

$2.00 ingresso · $12.00 uscita / 1M

1.05M ctx· qualità 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 ingresso · $18.00 uscita / 1M

1.05M ctx· qualità 10/10

Gemini 3.5 FlashIl più economico

google/gemini-3.5-flash

$1.50 ingresso · $9.00 uscita / 1M

1.05M ctx· qualità 9/10

FAQ

Qual è il costo per utilizzare Gemini 3 Flash Preview?

Prezzo di $0.50 per milione di token di input e $3.00 per milione di token di output, fatturato al tasso del fornitore con zero ricarico aggiunto da OrcaRouter.

Qual è la dimensione della finestra di contesto?

Il contesto finestra è di 1.048.576 token per l'input e il modello può generare fino a 65.536 token di output.

Quali sono le modalità di input supportate?

Testo, immagine, file, audio e video sono tutti accettati come input. L'output è solo testo.

Come si confronta con Gemini 2 Flash?

Gemini 3 Flash Preview ha una finestra di contesto più grande (1M vs fino a 1M ma spesso più piccola), un punteggio MMLU-Pro più alto (88.2) e un supporto multimodale ampliato che include video. È più veloce e più capace per compiti complessi, ma Gemini 2 Flash è più economico per token.

Come gestisce OrcaRouter la privacy dei dati?

OrcaRouter inoltra le tue richieste all'API di Google. Il trattamento dei dati segue l'informativa sulla privacy di Google. OrcaRouter non registra né conserva i tuoi contenuti oltre quanto necessario per elaborare la richiesta. Consulta le politiche di entrambi i fornitori per i dettagli.

Posso chiamare Gemini 3 Flash Preview utilizzando un'API compatibile con OpenAI?

Sì. Usa l'API di OrcaRouter su https://api.orcarouter.ai/v1 con ID modello "google/gemini-3-flash-preview". L'autenticazione utilizza una chiave API OrcaRouter. I formati di richiesta e risposta seguono lo schema Chat Completions di OpenAI.

Quali sono i principali punti di forza del modello?

Velocità di inferenza elevata, contesto ampio di 1 milione di token, input multimodale (testo, immagine, file, audio, video), solido benchmark MMLU-Pro (88,2) e costo basso rispetto a modelli più grandi.

Gemini 3 Flash Preview è disponibile per la produzione?

È una versione di anteprima, il che significa che potrebbe subire modifiche, disponibilità intermittente o supporto limitato. È adatta per test e sviluppo; per carichi di lavoro critici in produzione, considera di utilizzare la versione stabile una volta disponibile.

Come posso stimare l'utilizzo dei token per input multimodali?

Ogni modalità ha la propria tokenizzazione. Immagini, audio e video vengono suddivisi in token in base a risoluzione e durata. OrcaRouter segnala l'utilizzo dei token nella risposta API. Puoi anche consultare la documentazione di Google per le regole dettagliate di conteggio dei token.

Cosa succede se supero la finestra di contesto?

Input superiori a 1.048.576 token verranno troncati a partire dal contenuto più vecchio. Il modello ignorerà i token in eccesso. Assicurati che i tuoi messaggi rientrino nel limite monitorando il totale dei token nella tua richiesta.

Incorpora questo badge

Incolla nel tuo post del blog

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•tramite OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview su OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

Che cos'è Google Gemini 3 Flash Preview?

Chi è il pubblico di destinazione per questo modello?

Quali input multimodali supporta?

Qual è lo stato di anteprima e quanto è stabile?

Cosa può fare Gemini 3 Flash Preview con testo e immagini?

Come gestisce l'audio e il video?

Quali sono i migliori casi d'uso per questo modello Flash?

Quando potresti scegliere invece un modello più economico o più potente?

Cosa significa il punteggio MMLU-Pro di 88.2?

Quanto è veloce Gemini 3 Flash Preview per l'inferenza?

Quali sono i punti di forza chiave del modello basati sui benchmark?

Quali sono le limitazioni oneste di Gemini 3 Flash Preview?

Qual è la struttura dei prezzi per Gemini 3 Flash Preview?

Come si confronta il prezzo con altri modelli?

Ci sono sconti per caching o prezzi per volume?

Come faccio a chiamare Gemini 3 Flash Preview tramite l'API di OrcaRouter?

Quali parametri sono disponibili quando si chiama il modello?

Come migrare dall'API nativa di Google a OrcaRouter?

C'è qualche differenza nel formato della risposta rispetto a OpenAI?

Come si confronta Gemini 3 Flash Preview con Gemini 2 Flash?

Come si confronta con GPT-4o?

Come si confronta con altri modelli Google?

Esempi di codice

Prezzi

Prestazioni

Benchmark pubblici

Altri da Google

FAQ

Incorpora questo badge

Gemini 3 Flash Preview

Dettagli del modello

Che cos'è Google Gemini 3 Flash Preview?

Chi è il pubblico di destinazione per questo modello?

Quali input multimodali supporta?

Qual è lo stato di anteprima e quanto è stabile?

Cosa può fare Gemini 3 Flash Preview con testo e immagini?

Come gestisce l'audio e il video?

Quali sono i migliori casi d'uso per questo modello Flash?

Quando potresti scegliere invece un modello più economico o più potente?

Cosa significa il punteggio MMLU-Pro di 88.2?

Quanto è veloce Gemini 3 Flash Preview per l'inferenza?

Quali sono i punti di forza chiave del modello basati sui benchmark?

Quali sono le limitazioni oneste di Gemini 3 Flash Preview?

Qual è la struttura dei prezzi per Gemini 3 Flash Preview?

Come si confronta il prezzo con altri modelli?

Ci sono sconti per caching o prezzi per volume?

Come faccio a chiamare Gemini 3 Flash Preview tramite l'API di OrcaRouter?

Quali parametri sono disponibili quando si chiama il modello?

Come migrare dall'API nativa di Google a OrcaRouter?

C'è qualche differenza nel formato della risposta rispetto a OpenAI?

Come si confronta Gemini 3 Flash Preview con Gemini 2 Flash?

Come si confronta con GPT-4o?

Come si confronta con altri modelli Google?

Esempi di codice

Prezzi

Prestazioni

Benchmark pubblici

Altri da Google

FAQ

Incorpora questo badge