Gemini 3.5 Flash

google/gemini-3.5-flash
di google · 2026-05-23

Il modello multimodale efficiente di Google con contesto da 1M, elevata resa e prezzi convenienti tramite OrcaRouter.

ctx1.05M token
Inputtext + image + video + file + audio
Outputtext
p50 TTFT10.00 s
INGRESSO$1.50/ 1M token
USCITA$9.00/ 1M token
p50 TTFT10.00 s7 g
p95 TTFT10.00 s7 g
TRAFFICO4.5Mtoken / 7 g

Dettagli del modello

Cos'è Gemini 3.5 Flash?

Gemini 3.5 Flash è un modello linguistico di grandi dimensioni sviluppato da Google, ottimizzato per velocità ed efficienza. Appartiene alla famiglia Gemini ed è progettato per gestire input multimodali — testo, immagini, video, file e audio — fornendo risposte rapide. Il modello supporta una finestra di contesto di 1.048.576 token, consentendogli di elaborare sequenze molto lunghe, come interi libri, video di un'ora o repository di codice estesi. La sua lunghezza massima di output di 65.536 token permette generazioni prolungate, inclusi report completi o file di codice estesi. Gemini 3.5 Flash è accessibile tramite l'API compatibile con OpenAI di OrcaRouter, il che significa che puoi integrarlo in applicazioni esistenti con modifiche minime al codice.

Chi dovrebbe usare Gemini 3.5 Flash?

Gemini 3.5 Flash è ideale per sviluppatori e organizzazioni che necessitano di un equilibrio tra alta produttività, bassa latenza e costo. È particolarmente adatto per ambienti di produzione in cui la velocità di inferenza è importante, come chatbot in tempo reale, pipeline di moderazione dei contenuti o assistenza clienti automatizzata. La generosa finestra di contesto avvantaggia gli utenti che devono analizzare grandi set di dati, documenti lunghi o estese cronologie di conversazioni senza doverli suddividere. Inoltre, i team che sviluppano applicazioni multimodali—come didascalie di immagini, riepiloghi video o trascrizioni audio—possono sfruttare il supporto nativo per più tipi di input. Se il tuo carico di lavoro richiede capacità di ragionamento estremamente elevate o matematica complessa, considera invece un modello più potente e lento.

Quali modalità di input supporta Gemini 3.5 Flash?

Gemini 3.5 Flash accetta cinque modalità di input: testo, immagine, video, file e audio. Gli input testuali possono essere stringhe semplici o messaggi strutturati. Le immagini possono essere passate come dati codificati in base64 o URL; il modello può interpretare contenuti visivi come grafici, diagrammi o fotografie. Gli input video sono supportati come sequenze di fotogrammi o file video compressi, consentendo al modello di analizzare movimento e variazioni temporali. Gli input di file coprono formati comuni come PDF, DOCX o file di codice; il modello può estrarre e ragionare sul loro contenuto. Gli input audio possono essere grezzi o compressi (ad esempio MP3, WAV), consentendo la trascrizione vocale e l'analisi del suono. Tutte le modalità possono essere combinate in una singola richiesta, rendendo Gemini 3.5 Flash uno strumento versatile per attività multimodali.

Come si accede a Gemini 3.5 Flash tramite OrcaRouter?

OrcaRouter espone Gemini 3.5 Flash tramite la sua API compatibile con OpenAI. L'URL di base è https://api.orcarouter.ai/v1 e l'ID specifico del modello è "google/gemini-3.5-flash". Puoi chiamarlo usando qualsiasi SDK di OpenAI o richieste HTTP dirette, semplicemente cambiando l'URL di base e il nome del modello. L'autenticazione è gestita tramite una chiave API fornita da OrcaRouter. L'API supporta endpoint standard di completamento chat, streaming e parametri opzionali come temperature, top_p e max_tokens. OrcaRouter non applica alcun markup alla tariffa del fornitore, quindi paghi esattamente $1.50 per 1M di token in input e $9.00 per 1M di token in output. Nessuna commissione aggiuntiva per il gateway viene applicata.

Esempi di codice

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prezzi

Input / 1M token$1.50
Output / 1M token$9.00
Lettura cache / 1M$0.150
Scrittura cache / 1M$0.083
ValutaUSD

Prestazioni

p50 TTFT
10.00 s
Velocità di output
10766 tok/s
p95 TTFT
10.00 s
Tasso di errore
0.44%

Benchmark pubblici

49.0
AA Coding
Migliore del 68% dei modelli confrontati
47.0
AA Intelligence
Migliore del 58% dei modelli confrontati
51.0
AA Math
Migliore del 27% dei modelli confrontati
GPQA Diamond
45.0 index
MMLU-Pro
59.0 index
τ²-Bench
42.0 index
Fonte: artificialanalysis.ai

FAQ

Quanto costa Gemini 3.5 Flash su OrcaRouter?
I token di input costano $1.50 per 1 milione di token; i token di output costano $9.00 per 1 milione di token. OrcaRouter fattura alla tariffa del provider senza alcun ricarico. Non ci sono commissioni aggiuntive.
Qual è la dimensione della finestra di contesto di Gemini 3.5 Flash?
Supporta una finestra di contesto di 1,048,576 token (circa 1 milione di token). Questo include sia i token di input che quelli di output combinati.
Quali sono i principali punti di forza di Gemini 3.5 Flash?
È ottimizzato per bassa latenza, elevato throughput ed efficienza dei costi. Supporta input multimodali (testo, immagine, video, file, audio) e un'ampia finestra di contesto, rendendolo ideale per applicazioni in tempo reale ed elaborazione di documenti lunghi.
Come si confronta Gemini 3.5 Flash con Gemini 3.5 Pro?
Flash è più veloce ed economico, ma ha prestazioni inferiori nei benchmark per compiti di ragionamento complesso e matematici. Pro è più accurato, ma più lento e costoso. Flash è migliore per applicazioni ad alto volume e sensibili alla latenza.
Come vengono gestiti i dati quando si utilizza Gemini 3.5 Flash tramite OrcaRouter?
OrcaRouter agisce come proxy e non memorizza i tuoi dati. Tuttavia, le politiche di gestione dei dati di Google si applicano al modello sottostante. OrcaRouter consiglia di rivedere i termini di Google per la conservazione dei dati e la privacy.
Come posso chiamare Gemini 3.5 Flash usando un'API compatibile con OpenAI?
Usa l'URL di base https://api.orcarouter.ai/v1, l'ID del modello "google/gemini-3.5-flash", e passa una chiave API di OrcaRouter nell'intestazione Authorization. L'API supporta chat completions standard e streaming.
Quale lunghezza di output può generare Gemini 3.5 Flash?
Può generare fino a 65,536 token per risposta. Questo è significativamente più grande di molti modelli, consentendo contenuti di lunga forma, codice o ragionamento esteso.
Esiste uno sconto per token ripetuti o memorizzati nella cache?
Basandosi sui fatti forniti, OrcaRouter non offre memorizzazione nella cache né sconti sul volume. Ogni token viene fatturato alla tariffa standard indipendentemente dal riutilizzo.

Incorpora questo badge

Gemini 3.5 Flash$1.50/M in10000ms p50tramite OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash su OrcaRouter" /> </a>
Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)