Gemini 3.5 Flash

google/gemini-3.5-flash
door google · 2026-05-23

Google's efficiënte multimodale model met 1M context, hoge output en kosteneffectieve prijsstelling via OrcaRouter.

ctx1.05M tokens
Invoertext + image + video + file + audio
Uitvoertext
p50 TTFT10.00 s
INPUT$1.50/ 1M tokens
OUTPUT$9.00/ 1M tokens
p50 TTFT10.00 s7d
p95 TTFT10.00 s7d
VERKEER4.5Mtokens / 7d

Modeldetails

Wat is Gemini 3.5 Flash?

Gemini 3.5 Flash is een groot taalmodel ontwikkeld door Google, geoptimaliseerd voor snelheid en efficiëntie. Het behoort tot de Gemini-familie en is ontworpen om multimodale inputs—tekst, afbeelding, video, bestand en audio—te verwerken, terwijl het snelle antwoorden levert. Het model ondersteunt een contextvenster van 1.048.576 tokens, waardoor het zeer lange sequenties kan verwerken, zoals hele boeken, uur-lange video's of uitgebreide coderepository's. De maximale uitvoerlengte van 65.536 tokens maakt lange generaties mogelijk, inclusief volledige rapporten of uitgebreide codebestanden. Gemini 3.5 Flash wordt benaderd via OrcaRouter's OpenAI-compatibele API, wat betekent dat je het kunt integreren in bestaande applicaties met minimale codeaanpassingen.

Wie zou Gemini 3.5 Flash moeten gebruiken?

Gemini 3.5 Flash is ideaal voor ontwikkelaars en organisaties die een balans nodig hebben tussen hoge doorvoer, lage latentie en kosten. Het is met name geschikt voor productieomgevingen waar inferentiesnelheid belangrijk is, zoals realtime chatbots, contentmoderatiepijplijnen of geautomatiseerde klantenservice. Het royale contextvenster is gunstig voor gebruikers die grote datasets, lange documenten of uitgebreide gespreksgeschiedenissen moeten analyseren zonder deze te hoeven opdelen. Daarnaast kunnen teams die multimodale toepassingen bouwen—zoals het genereren van bijschriften bij afbeeldingen, videosamenvattingen of audiotranscriptie—profiteren van de native ondersteuning voor meerdere invoertypen. Als uw workload extreem hoge redeneercapaciteiten of complexe wiskunde vereist, overweeg dan in plaats daarvan een krachtiger, langzamer model.

Welke invoermodaliteiten ondersteunt Gemini 3.5 Flash?

Gemini 3.5 Flash accepteert vijf invoermodaliteiten: tekst, afbeelding, video, bestand en audio. Tekstinvoer kan bestaan uit gewone strings of gestructureerde berichten. Afbeeldingen kunnen worden doorgegeven als base64-gecodeerde data of URL's; het model kan visuele inhoud zoals grafieken, diagrammen of foto's interpreteren. Video-invoer wordt ondersteund als reeksen frames of gecomprimeerde videobestanden, waardoor het model beweging en temporele veranderingen kan analyseren. Bestandsinvoer omvat gangbare formaten zoals PDF, DOCX of codebestanden; het model kan de inhoud extraheren en erover redeneren. Audio-invoer kan ongecomprimeerd of gecomprimeerd zijn (bijv. MP3, WAV), wat spraaktranscriptie en geluidsanalyse mogelijk maakt. Alle modaliteiten kunnen worden gecombineerd in één enkele aanvraag, waardoor Gemini 3.5 Flash een veelzijdig hulpmiddel is voor multimodale taken.

Hoe wordt Gemini 3.5 Flash benaderd via OrcaRouter?

OrcaRouter stelt Gemini 3.5 Flash beschikbaar via zijn OpenAI-compatibele API. De basis-URL is https://api.orcarouter.ai/v1 en de specifieke model-ID is "google/gemini-3.5-flash". Je kunt het aanroepen met elke OpenAI SDK of directe HTTP-verzoeken, simpelweg door de basis-URL en modelnaam te wijzigen. Authenticatie gebeurt via een API-sleutel die door OrcaRouter wordt verstrekt. De API ondersteunt standaard chatcompletions-eindpunten, streaming en optionele parameters zoals temperature, top_p en max_tokens. OrcaRouter voegt geen markup toe aan het provider-tarief, dus je betaalt precies $1,50 per 1M invoertokens en $9,00 per 1M uitvoertokens. Er worden geen extra gateway-kosten in rekening gebracht.

Codevoorbeelden

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prijzen

Invoer / 1M tokens$1.50
Uitvoer / 1M tokens$9.00
Cache lezen / 1M$0.150
Cache schrijven / 1M$0.083
ValutaUSD

Prestaties

p50 TTFT
10.00 s
Outputsnelheid
10766 tok/s
p95 TTFT
10.00 s
Foutpercentage
0.44%

Openbare benchmarks

49.0
AA Coding
Beter dan 68% van de vergeleken modellen
47.0
AA Intelligence
Beter dan 58% van de vergeleken modellen
51.0
AA Math
Beter dan 27% van de vergeleken modellen
GPQA Diamond
45.0 index
MMLU-Pro
59.0 index
τ²-Bench
42.0 index
Bron: artificialanalysis.ai

FAQ

Hoeveel kost Gemini 3.5 Flash op OrcaRouter?
Invoertokens zijn $1.50 per 1 miljoen tokens; uitvoertokens zijn $9.00 per 1 miljoen tokens. OrcaRouter factureert tegen het tarief van de provider met nul opslag. Er zijn geen extra kosten.
Wat is de contextvenstergrootte van Gemini 3.5 Flash?
Het ondersteunt een contextvenster van 1.048.576 tokens (ongeveer 1 miljoen tokens). Dit omvat zowel input- als outputtokens samen.
Wat zijn de belangrijkste sterke punten van Gemini 3.5 Flash?
Het is geoptimaliseerd voor lage latentie, hoge doorvoer en kostenefficiëntie. Het ondersteunt multimodale inputs (tekst, afbeelding, video, bestand, audio) en een groot contextvenster, waardoor het ideaal is voor real-time toepassingen en verwerking van lange documenten.
Hoe verhoudt Gemini 3.5 Flash zich tot Gemini 3.5 Pro?
Flash is sneller en goedkoper, maar presteert lager op benchmarks voor complex redeneren en wiskundige taken. Pro is nauwkeuriger maar langzamer en duurder. Flash is beter voor toepassingen met een hoog volume die gevoelig zijn voor latentie.
Hoe worden gegevens verwerkt bij gebruik van Gemini 3.5 Flash via OrcaRouter?
OrcaRouter fungeert als een proxy en slaat uw gegevens niet op. Echter, het gegevensverwerkingsbeleid van Google is van toepassing op het onderliggende model. OrcaRouter adviseert u de voorwaarden van Google te bekijken met betrekking tot gegevensbewaring en privacy.
Hoe roep ik Gemini 3.5 Flash aan met een OpenAI-compatibele API?
Gebruik basis-URL https://api.orcarouter.ai/v1, model-ID "google/gemini-3.5-flash", en geef een OrcaRouter API-sleutel door in de Authorization-header. De API ondersteunt standaard chatvoltooiingen en streaming.
Welke outputlengte kan Gemini 3.5 Flash genereren?
Het kan maximaal 65,536 tokens per antwoord genereren. Dit is aanzienlijk groter dan veel modellen, waardoor het mogelijk is om lange inhoud, code of uitgebreide redeneringen te produceren.
Is er een korting voor herhaalde of gecachte tokens?
Op basis van de verstrekte feiten biedt OrcaRouter geen caching of volumekortingen. Elke token wordt gefactureerd tegen het standaardtarief, ongeacht hergebruik.

Sluit deze badge in

Gemini 3.5 Flash$1.50/M in10000ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash op OrcaRouter" /> </a>
Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)