Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

door google · 2026-05-23

Google's efficiënte multimodale model met 1M context, hoge output en kosteneffectieve prijsstelling via OrcaRouter.

Eindpunten:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M tokens

Invoertext + image + video + file + audio

Uitvoertext

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

INPUT$1.50/ 1M tokens

OUTPUT$9.00/ 1M tokens

p50 TTFT10.00 s7d

p95 TTFT10.00 s7d

VERKEER4.5Mtokens / 7d

Haal de Gemini 3.5 Flash-API op →▶ Uitproberen in playground </> Gebruik via API

Wat is Gemini 3.5 Flash?

Gemini 3.5 Flash is een groot taalmodel ontwikkeld door Google, geoptimaliseerd voor snelheid en efficiëntie. Het behoort tot de Gemini-familie en is ontworpen om multimodale inputs—tekst, afbeelding, video, bestand en audio—te verwerken, terwijl het snelle antwoorden levert. Het model ondersteunt een contextvenster van 1.048.576 tokens, waardoor het zeer lange sequenties kan verwerken, zoals hele boeken, uur-lange video's of uitgebreide coderepository's. De maximale uitvoerlengte van 65.536 tokens maakt lange generaties mogelijk, inclusief volledige rapporten of uitgebreide codebestanden. Gemini 3.5 Flash wordt benaderd via OrcaRouter's OpenAI-compatibele API, wat betekent dat je het kunt integreren in bestaande applicaties met minimale codeaanpassingen.

Wie zou Gemini 3.5 Flash moeten gebruiken?

Gemini 3.5 Flash is ideaal voor ontwikkelaars en organisaties die een balans nodig hebben tussen hoge doorvoer, lage latentie en kosten. Het is met name geschikt voor productieomgevingen waar inferentiesnelheid belangrijk is, zoals realtime chatbots, contentmoderatiepijplijnen of geautomatiseerde klantenservice. Het royale contextvenster is gunstig voor gebruikers die grote datasets, lange documenten of uitgebreide gespreksgeschiedenissen moeten analyseren zonder deze te hoeven opdelen. Daarnaast kunnen teams die multimodale toepassingen bouwen—zoals het genereren van bijschriften bij afbeeldingen, videosamenvattingen of audiotranscriptie—profiteren van de native ondersteuning voor meerdere invoertypen. Als uw workload extreem hoge redeneercapaciteiten of complexe wiskunde vereist, overweeg dan in plaats daarvan een krachtiger, langzamer model.

Welke invoermodaliteiten ondersteunt Gemini 3.5 Flash?

Gemini 3.5 Flash accepteert vijf invoermodaliteiten: tekst, afbeelding, video, bestand en audio. Tekstinvoer kan bestaan uit gewone strings of gestructureerde berichten. Afbeeldingen kunnen worden doorgegeven als base64-gecodeerde data of URL's; het model kan visuele inhoud zoals grafieken, diagrammen of foto's interpreteren. Video-invoer wordt ondersteund als reeksen frames of gecomprimeerde videobestanden, waardoor het model beweging en temporele veranderingen kan analyseren. Bestandsinvoer omvat gangbare formaten zoals PDF, DOCX of codebestanden; het model kan de inhoud extraheren en erover redeneren. Audio-invoer kan ongecomprimeerd of gecomprimeerd zijn (bijv. MP3, WAV), wat spraaktranscriptie en geluidsanalyse mogelijk maakt. Alle modaliteiten kunnen worden gecombineerd in één enkele aanvraag, waardoor Gemini 3.5 Flash een veelzijdig hulpmiddel is voor multimodale taken.

Hoe wordt Gemini 3.5 Flash benaderd via OrcaRouter?

OrcaRouter stelt Gemini 3.5 Flash beschikbaar via zijn OpenAI-compatibele API. De basis-URL is https://api.orcarouter.ai/v1 en de specifieke model-ID is "google/gemini-3.5-flash". Je kunt het aanroepen met elke OpenAI SDK of directe HTTP-verzoeken, simpelweg door de basis-URL en modelnaam te wijzigen. Authenticatie gebeurt via een API-sleutel die door OrcaRouter wordt verstrekt. De API ondersteunt standaard chatcompletions-eindpunten, streaming en optionele parameters zoals temperature, top_p en max_tokens. OrcaRouter voegt geen markup toe aan het provider-tarief, dus je betaalt precies $1,50 per 1M invoertokens en $9,00 per 1M uitvoertokens. Er worden geen extra gateway-kosten in rekening gebracht.

Codevoorbeelden

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prijzen

Invoer / 1M tokens	$1.50
Uitvoer / 1M tokens	$9.00
Cache lezen / 1M	$0.150
Cache schrijven / 1M	$0.083
Valuta	USD

Prestaties

laatste 7 dagen

p50 TTFT

10.00 s

Outputsnelheid

10766 tok/s

p95 TTFT

10.00 s

Foutpercentage

0.44%

Openbare benchmarks

Laatst geëvalueerd 2026-06-25

49.0

AA Coding

Beter dan 68% van de vergeleken modellen

47.0

AA Intelligence

Beter dan 58% van de vergeleken modellen

51.0

AA Math

Beter dan 27% van de vergeleken modellen

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

Bron: artificialanalysis.ai

Meer van google

Alle modellen van google bekijken →

Gemini 3.1 Pro PreviewVlaggenschip

google/gemini-3.1-pro-preview

$2.00 in · $12.00 uit / 1M

1.05M ctx· kwaliteit 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 in · $18.00 uit / 1M

1.05M ctx· kwaliteit 10/10

Gemini 3 Flash PreviewGoedkoopste

google/gemini-3-flash-preview

$0.50 in · $3.00 uit / 1M

1.05M ctx· kwaliteit 9/10

FAQ

Hoeveel kost Gemini 3.5 Flash op OrcaRouter?

Invoertokens zijn $1.50 per 1 miljoen tokens; uitvoertokens zijn $9.00 per 1 miljoen tokens. OrcaRouter factureert tegen het tarief van de provider met nul opslag. Er zijn geen extra kosten.

Wat is de contextvenstergrootte van Gemini 3.5 Flash?

Het ondersteunt een contextvenster van 1.048.576 tokens (ongeveer 1 miljoen tokens). Dit omvat zowel input- als outputtokens samen.

Wat zijn de belangrijkste sterke punten van Gemini 3.5 Flash?

Het is geoptimaliseerd voor lage latentie, hoge doorvoer en kostenefficiëntie. Het ondersteunt multimodale inputs (tekst, afbeelding, video, bestand, audio) en een groot contextvenster, waardoor het ideaal is voor real-time toepassingen en verwerking van lange documenten.

Hoe verhoudt Gemini 3.5 Flash zich tot Gemini 3.5 Pro?

Flash is sneller en goedkoper, maar presteert lager op benchmarks voor complex redeneren en wiskundige taken. Pro is nauwkeuriger maar langzamer en duurder. Flash is beter voor toepassingen met een hoog volume die gevoelig zijn voor latentie.

Hoe worden gegevens verwerkt bij gebruik van Gemini 3.5 Flash via OrcaRouter?

OrcaRouter fungeert als een proxy en slaat uw gegevens niet op. Echter, het gegevensverwerkingsbeleid van Google is van toepassing op het onderliggende model. OrcaRouter adviseert u de voorwaarden van Google te bekijken met betrekking tot gegevensbewaring en privacy.

Hoe roep ik Gemini 3.5 Flash aan met een OpenAI-compatibele API?

Gebruik basis-URL https://api.orcarouter.ai/v1, model-ID "google/gemini-3.5-flash", en geef een OrcaRouter API-sleutel door in de Authorization-header. De API ondersteunt standaard chatvoltooiingen en streaming.

Welke outputlengte kan Gemini 3.5 Flash genereren?

Het kan maximaal 65,536 tokens per antwoord genereren. Dit is aanzienlijk groter dan veel modellen, waardoor het mogelijk is om lange inhoud, code of uitgebreide redeneringen te produceren.

Is er een korting voor herhaalde of gecachte tokens?

Op basis van de verstrekte feiten biedt OrcaRouter geen caching of volumekortingen. Elke token wordt gefactureerd tegen het standaardtarief, ongeacht hergebruik.

Sluit deze badge in

Plak in je blogbericht

Gemini 3.5 Flash•$1.50/M in•10000ms p50•via OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash op OrcaRouter" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

Wat is Gemini 3.5 Flash?

Wie zou Gemini 3.5 Flash moeten gebruiken?

Welke invoermodaliteiten ondersteunt Gemini 3.5 Flash?

Hoe wordt Gemini 3.5 Flash benaderd via OrcaRouter?

Voor welke taken is Gemini 3.5 Flash het meest geschikt?

Wanneer zou je een goedkoper model moeten verkiezen boven Gemini 3.5 Flash?

Kan Gemini 3.5 Flash streaming en realtime-interacties aan?

Wat zijn de beste praktijken voor het gebruik van het contextvenster van Gemini 3.5 Flash?

Wat zijn de bekende sterke punten van Gemini 3.5 Flash?

Wat zijn de eerlijke beperkingen van Gemini 3.5 Flash?

Hoe verhoudt de latentie zich tot andere modellen?

Wat is de uitvoerkwaliteit van het model voor code en gestructureerde gegevens?

Hoe wordt Gemini 3.5 Flash geprijsd op OrcaRouter?

Wat zijn de kostenafwegingen tussen invoer- en uitvoertokens?

Biedt OrcaRouter caching- of kortingsfuncties?

Hoe verhouden de kosten zich tot andere modellen op OrcaRouter?

Hoe roep ik Gemini 3.5 Flash aan via de API van OrcaRouter?

Welke parameters zijn beschikbaar voor Gemini 3.5 Flash?

Kan ik migreren van de Google AI of Vertex AI API naar OrcaRouter?

Welke foutafhandeling kan ik verwachten bij gebruik van de API?

Hoe verhoudt Gemini 3.5 Flash zich tot Gemini 3.5 Pro?

Hoe verhoudt Gemini 3.5 Flash zich tot GPT-4o Mini?

Hoe verhoudt Gemini 3.5 Flash zich tot Claude 3 Haiku?

Wat is het belangrijkste voordeel van Gemini 3.5 Flash ten opzichte van opensource modellen?

Codevoorbeelden

Prijzen

Prestaties

Openbare benchmarks

Meer van google

FAQ

Sluit deze badge in

Gemini 3.5 Flash

Modeldetails

Wat is Gemini 3.5 Flash?

Wie zou Gemini 3.5 Flash moeten gebruiken?

Welke invoermodaliteiten ondersteunt Gemini 3.5 Flash?

Hoe wordt Gemini 3.5 Flash benaderd via OrcaRouter?

Voor welke taken is Gemini 3.5 Flash het meest geschikt?

Wanneer zou je een goedkoper model moeten verkiezen boven Gemini 3.5 Flash?

Kan Gemini 3.5 Flash streaming en realtime-interacties aan?

Wat zijn de beste praktijken voor het gebruik van het contextvenster van Gemini 3.5 Flash?

Wat zijn de bekende sterke punten van Gemini 3.5 Flash?

Wat zijn de eerlijke beperkingen van Gemini 3.5 Flash?

Hoe verhoudt de latentie zich tot andere modellen?

Wat is de uitvoerkwaliteit van het model voor code en gestructureerde gegevens?

Hoe wordt Gemini 3.5 Flash geprijsd op OrcaRouter?

Wat zijn de kostenafwegingen tussen invoer- en uitvoertokens?

Biedt OrcaRouter caching- of kortingsfuncties?

Hoe verhouden de kosten zich tot andere modellen op OrcaRouter?

Hoe roep ik Gemini 3.5 Flash aan via de API van OrcaRouter?

Welke parameters zijn beschikbaar voor Gemini 3.5 Flash?

Kan ik migreren van de Google AI of Vertex AI API naar OrcaRouter?

Welke foutafhandeling kan ik verwachten bij gebruik van de API?

Hoe verhoudt Gemini 3.5 Flash zich tot Gemini 3.5 Pro?

Hoe verhoudt Gemini 3.5 Flash zich tot GPT-4o Mini?

Hoe verhoudt Gemini 3.5 Flash zich tot Claude 3 Haiku?

Wat is het belangrijkste voordeel van Gemini 3.5 Flash ten opzichte van opensource modellen?

Codevoorbeelden

Prijzen

Prestaties

Openbare benchmarks

Meer van google

FAQ

Sluit deze badge in