Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

di google · 2026-05-23

Il modello multimodale efficiente di Google con contesto da 1M, elevata resa e prezzi convenienti tramite OrcaRouter.

Endpoint:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M token

Inputtext + image + video + file + audio

Outputtext

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

INGRESSO$1.50/ 1M token

USCITA$9.00/ 1M token

p50 TTFT10.00 s7 g

p95 TTFT10.00 s7 g

TRAFFICO4.5Mtoken / 7 g

Ottieni l'API Gemini 3.5 Flash →▶ Prova nel Playground </> Usa tramite API

Cos'è Gemini 3.5 Flash?

Gemini 3.5 Flash è un modello linguistico di grandi dimensioni sviluppato da Google, ottimizzato per velocità ed efficienza. Appartiene alla famiglia Gemini ed è progettato per gestire input multimodali — testo, immagini, video, file e audio — fornendo risposte rapide. Il modello supporta una finestra di contesto di 1.048.576 token, consentendogli di elaborare sequenze molto lunghe, come interi libri, video di un'ora o repository di codice estesi. La sua lunghezza massima di output di 65.536 token permette generazioni prolungate, inclusi report completi o file di codice estesi. Gemini 3.5 Flash è accessibile tramite l'API compatibile con OpenAI di OrcaRouter, il che significa che puoi integrarlo in applicazioni esistenti con modifiche minime al codice.

Chi dovrebbe usare Gemini 3.5 Flash?

Gemini 3.5 Flash è ideale per sviluppatori e organizzazioni che necessitano di un equilibrio tra alta produttività, bassa latenza e costo. È particolarmente adatto per ambienti di produzione in cui la velocità di inferenza è importante, come chatbot in tempo reale, pipeline di moderazione dei contenuti o assistenza clienti automatizzata. La generosa finestra di contesto avvantaggia gli utenti che devono analizzare grandi set di dati, documenti lunghi o estese cronologie di conversazioni senza doverli suddividere. Inoltre, i team che sviluppano applicazioni multimodali—come didascalie di immagini, riepiloghi video o trascrizioni audio—possono sfruttare il supporto nativo per più tipi di input. Se il tuo carico di lavoro richiede capacità di ragionamento estremamente elevate o matematica complessa, considera invece un modello più potente e lento.

Quali modalità di input supporta Gemini 3.5 Flash?

Gemini 3.5 Flash accetta cinque modalità di input: testo, immagine, video, file e audio. Gli input testuali possono essere stringhe semplici o messaggi strutturati. Le immagini possono essere passate come dati codificati in base64 o URL; il modello può interpretare contenuti visivi come grafici, diagrammi o fotografie. Gli input video sono supportati come sequenze di fotogrammi o file video compressi, consentendo al modello di analizzare movimento e variazioni temporali. Gli input di file coprono formati comuni come PDF, DOCX o file di codice; il modello può estrarre e ragionare sul loro contenuto. Gli input audio possono essere grezzi o compressi (ad esempio MP3, WAV), consentendo la trascrizione vocale e l'analisi del suono. Tutte le modalità possono essere combinate in una singola richiesta, rendendo Gemini 3.5 Flash uno strumento versatile per attività multimodali.

Come si accede a Gemini 3.5 Flash tramite OrcaRouter?

OrcaRouter espone Gemini 3.5 Flash tramite la sua API compatibile con OpenAI. L'URL di base è https://api.orcarouter.ai/v1 e l'ID specifico del modello è "google/gemini-3.5-flash". Puoi chiamarlo usando qualsiasi SDK di OpenAI o richieste HTTP dirette, semplicemente cambiando l'URL di base e il nome del modello. L'autenticazione è gestita tramite una chiave API fornita da OrcaRouter. L'API supporta endpoint standard di completamento chat, streaming e parametri opzionali come temperature, top_p e max_tokens. OrcaRouter non applica alcun markup alla tariffa del fornitore, quindi paghi esattamente $1.50 per 1M di token in input e $9.00 per 1M di token in output. Nessuna commissione aggiuntiva per il gateway viene applicata.

Esempi di codice

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prezzi

Input / 1M token	$1.50
Output / 1M token	$9.00
Lettura cache / 1M	$0.150
Scrittura cache / 1M	$0.083
Valuta	USD

Prestazioni

ultimi 7 giorni

p50 TTFT

10.00 s

Velocità di output

10766 tok/s

p95 TTFT

10.00 s

Tasso di errore

0.44%

Benchmark pubblici

Ultima valutazione 2026-06-25

49.0

AA Coding

Migliore del 68% dei modelli confrontati

47.0

AA Intelligence

Migliore del 58% dei modelli confrontati

51.0

AA Math

Migliore del 27% dei modelli confrontati

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

Fonte: artificialanalysis.ai

Altri da google

Vedi tutti i modelli di google →

Gemini 3.1 Pro PreviewAmmiraglia

google/gemini-3.1-pro-preview

$2.00 ingresso · $12.00 uscita / 1M

1.05M ctx· qualità 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 ingresso · $18.00 uscita / 1M

1.05M ctx· qualità 10/10

Gemini 3 Flash PreviewIl più economico

google/gemini-3-flash-preview

$0.50 ingresso · $3.00 uscita / 1M

1.05M ctx· qualità 9/10

FAQ

Quanto costa Gemini 3.5 Flash su OrcaRouter?

I token di input costano $1.50 per 1 milione di token; i token di output costano $9.00 per 1 milione di token. OrcaRouter fattura alla tariffa del provider senza alcun ricarico. Non ci sono commissioni aggiuntive.

Qual è la dimensione della finestra di contesto di Gemini 3.5 Flash?

Supporta una finestra di contesto di 1,048,576 token (circa 1 milione di token). Questo include sia i token di input che quelli di output combinati.

Quali sono i principali punti di forza di Gemini 3.5 Flash?

È ottimizzato per bassa latenza, elevato throughput ed efficienza dei costi. Supporta input multimodali (testo, immagine, video, file, audio) e un'ampia finestra di contesto, rendendolo ideale per applicazioni in tempo reale ed elaborazione di documenti lunghi.

Come si confronta Gemini 3.5 Flash con Gemini 3.5 Pro?

Flash è più veloce ed economico, ma ha prestazioni inferiori nei benchmark per compiti di ragionamento complesso e matematici. Pro è più accurato, ma più lento e costoso. Flash è migliore per applicazioni ad alto volume e sensibili alla latenza.

Come vengono gestiti i dati quando si utilizza Gemini 3.5 Flash tramite OrcaRouter?

OrcaRouter agisce come proxy e non memorizza i tuoi dati. Tuttavia, le politiche di gestione dei dati di Google si applicano al modello sottostante. OrcaRouter consiglia di rivedere i termini di Google per la conservazione dei dati e la privacy.

Come posso chiamare Gemini 3.5 Flash usando un'API compatibile con OpenAI?

Usa l'URL di base https://api.orcarouter.ai/v1, l'ID del modello "google/gemini-3.5-flash", e passa una chiave API di OrcaRouter nell'intestazione Authorization. L'API supporta chat completions standard e streaming.

Quale lunghezza di output può generare Gemini 3.5 Flash?

Può generare fino a 65,536 token per risposta. Questo è significativamente più grande di molti modelli, consentendo contenuti di lunga forma, codice o ragionamento esteso.

Esiste uno sconto per token ripetuti o memorizzati nella cache?

Basandosi sui fatti forniti, OrcaRouter non offre memorizzazione nella cache né sconti sul volume. Ogni token viene fatturato alla tariffa standard indipendentemente dal riutilizzo.

Incorpora questo badge

Incolla nel tuo post del blog

Gemini 3.5 Flash•$1.50/M in•10000ms p50•tramite OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash su OrcaRouter" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

Cos'è Gemini 3.5 Flash?

Chi dovrebbe usare Gemini 3.5 Flash?

Quali modalità di input supporta Gemini 3.5 Flash?

Come si accede a Gemini 3.5 Flash tramite OrcaRouter?

Quali attività sono più adatte per Gemini 3.5 Flash?

Quando dovresti scegliere un modello più economico rispetto a Gemini 3.5 Flash?

Gemini 3.5 Flash può gestire lo streaming e le interazioni in tempo reale?

Quali sono le migliori pratiche per utilizzare la finestra di contesto di Gemini 3.5 Flash?

Quali sono i punti di forza noti di Gemini 3.5 Flash?

Quali sono le oneste limitazioni di Gemini 3.5 Flash?

Come si confronta la latenza con altri modelli?

Qual è la qualità dell'output del modello per codice e dati strutturati?

Come viene prezzato Gemini 3.5 Flash su OrcaRouter?

Quali sono i compromessi di costo tra i token di input e output?

OrcaRouter offre funzionalità di caching o sconto?

Come si confrontano i costi con altri modelli su OrcaRouter?

Come faccio a chiamare Gemini 3.5 Flash tramite OrcaRouter's API?

Quali parametri sono disponibili per Gemini 3.5 Flash?

Posso migrare dall'API Google AI o Vertex AI a OrcaRouter?

Che gestione degli errori dovrei aspettarmi quando utilizzo l'API?

Come si confronta Gemini 3.5 Flash con Gemini 3.5 Pro?

Come si confronta Gemini 3.5 Flash con GPT-4o Mini?

Come si confronta Gemini 3.5 Flash con Claude 3 Haiku?

Qual è il principale vantaggio di Gemini 3.5 Flash rispetto ai modelli open-source?

Esempi di codice

Prezzi

Prestazioni

Benchmark pubblici

Altri da google

FAQ

Incorpora questo badge

Gemini 3.5 Flash

Dettagli del modello

Cos'è Gemini 3.5 Flash?

Chi dovrebbe usare Gemini 3.5 Flash?

Quali modalità di input supporta Gemini 3.5 Flash?

Come si accede a Gemini 3.5 Flash tramite OrcaRouter?

Quali attività sono più adatte per Gemini 3.5 Flash?

Quando dovresti scegliere un modello più economico rispetto a Gemini 3.5 Flash?

Gemini 3.5 Flash può gestire lo streaming e le interazioni in tempo reale?

Quali sono le migliori pratiche per utilizzare la finestra di contesto di Gemini 3.5 Flash?

Quali sono i punti di forza noti di Gemini 3.5 Flash?

Quali sono le oneste limitazioni di Gemini 3.5 Flash?

Come si confronta la latenza con altri modelli?

Qual è la qualità dell'output del modello per codice e dati strutturati?

Come viene prezzato Gemini 3.5 Flash su OrcaRouter?

Quali sono i compromessi di costo tra i token di input e output?

OrcaRouter offre funzionalità di caching o sconto?

Come si confrontano i costi con altri modelli su OrcaRouter?

Come faccio a chiamare Gemini 3.5 Flash tramite OrcaRouter's API?

Quali parametri sono disponibili per Gemini 3.5 Flash?

Posso migrare dall'API Google AI o Vertex AI a OrcaRouter?

Che gestione degli errori dovrei aspettarmi quando utilizzo l'API?

Come si confronta Gemini 3.5 Flash con Gemini 3.5 Pro?

Come si confronta Gemini 3.5 Flash con GPT-4o Mini?

Come si confronta Gemini 3.5 Flash con Claude 3 Haiku?

Qual è il principale vantaggio di Gemini 3.5 Flash rispetto ai modelli open-source?

Esempi di codice

Prezzi

Prestazioni

Benchmark pubblici

Altri da google

FAQ

Incorpora questo badge