Gemini 3 Flash Preview

google/gemini-3-flash-preview
door Google · 2025-12-17

Google Gemini 3 Flash Preview – Multimodaal model met 1M token context, 88.2 MMLU-Pro, toegankelijk via OrcaRouter.

ctx1.05M tokens
Invoertext + image + file + audio + video
Uitvoertext
p50 TTFT3.81 s
INPUT$0.50/ 1M tokens
OUTPUT$3.00/ 1M tokens
p50 TTFT3.81 s7d
p95 TTFT10.00 s7d
VERKEER1.1Mtokens / 7d

Modeldetails

Wat is Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview is een multimodaal model ontwikkeld door Google, geoptimaliseerd voor snelheid en verwerking van grote contexten. Het accepteert invoer in tekst-, afbeelding-, bestand-, audio- en videoformaten, en kan tot 65,536 tokens aan uitvoer genereren. Het model heeft een contextvenster van 1,048,576 tokens, waardoor het over zeer lange sequenties kan redeneren. Het scoort 88.2 op de MMLU-Pro-benchmark, wat wijst op sterke prestaties op een breed scala aan academische en redeneertaken. Deze preview-versie is beschikbaar via de OpenAI-compatibele API van OrcaRouter onder de model-ID google/gemini-3-flash-preview.

Wie is de doelgroep voor dit model?

Gemini 3 Flash Preview richt zich op ontwikkelaars en organisaties die toepassingen bouwen die snelle, multimodale redenering met grote context vereisen. Het is zeer geschikt voor gebruiksscenario's zoals video-analyse, samenvatting van lange documenten en real-time audio-video begrip. De prijs van het model—$0.50 per miljoen invoertokens en $3.00 per miljoen uitvoertokens—maakt het toegankelijk voor zowel startups als grote ondernemingen. Omdat het een preview is, kunnen vroege gebruikers de mogelijkheden evalueren vóór een stabiele release. OrcaRouter biedt naadloze toegang tot dit model, inclusief OpenAI-compatibele eindpunten en geen opslag op provider-tarieven.

Welke multimodale inputs ondersteunt het?

Gemini 3 Flash Preview ondersteunt vijf invoermodaliteiten: tekst, afbeelding, bestand, audio en video. Tekst kan plat of gestructureerd zijn; afbeeldingen kunnen foto's, diagrammen en schermafbeeldingen omvatten; bestanden omvatten formaten zoals PDF's en documenten; audio omvat spraak en muziek; video kan worden verwerkt met zowel visuele als audiosporen. Het model kan meerdere modaliteiten combineren in één prompt — bijvoorbeeld het analyseren van een video terwijl het ook een bijgevoegd PDF-bestand leest. Deze veelzijdigheid stelt het in staat om complexe, gemengde-media taken uit te voeren zonder aparte pijplijnen. Invoertokens worden geteld op basis van de specifieke tokenizerregels van elke modaliteit.

Wat is de previewstatus en hoe stabiel is het?

Gemini 3 Flash Preview is een pre-releaseversie van Google's derde generatie Flash-model. Als preview kan het veranderingen ondergaan in gedrag, prestaties en beschikbaarheid. Google werkt previewmodellen doorgaans bij op basis van gebruikersfeedback en kan preview-eindpunten uiteindelijk vervangen door stabiele releases. Hoewel het model functioneel en geschikt is voor testen en ontwikkeling, moeten productie-implementaties updates in de gaten houden. OrcaRouter spiegelt het eindpunt van de provider en zorgt ervoor dat eventuele wijzigingen van Google snel worden doorgevoerd. De model-ID google/gemini-3-flash-preview blijft consistent, tenzij Google de naamgeving aanpast.

Codevoorbeelden

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Prijzen

Invoer / 1M tokens$0.500
Uitvoer / 1M tokens$3.00
Cache lezen / 1M$0.050
ValutaUSD

Prestaties

p50 TTFT
3.81 s
Outputsnelheid
851 tok/s
p95 TTFT
10.00 s
Foutpercentage
0%

Openbare benchmarks

37.8
AA Coding
Beter dan 47% van de vergeleken modellen
35.0
AA Intelligence
Beter dan 35% van de vergeleken modellen
55.7
AA Math
Beter dan 32% van de vergeleken modellen
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Bron: artificialanalysis.ai

FAQ

Wat zijn de kosten om Gemini 3 Flash Preview te gebruiken?
Prijzen zijn $0,50 per miljoen invoertokens en $3,00 per miljoen uitvoertokens, gefactureerd tegen het provider-tarief zonder enige opslag door OrcaRouter.
Wat is de grootte van het contextvenster?
Het contextvenster is 1.048.576 tokens voor invoer en het model kan maximaal 65.536 uitvoertokens genereren.
Wat zijn de ondersteunde invoermodaliteiten?
Tekst, afbeelding, bestand, audio en video worden allemaal als invoer geaccepteerd. Uitvoer is alleen tekst.
Hoe verhoudt het zich tot Gemini 2 Flash?
Gemini 3 Flash Preview heeft een groter contextvenster (1M vs tot 1M maar vaak kleiner), een hogere MMLU-Pro score (88.2), en uitgebreide multimodale ondersteuning inclusief video. Het is sneller en capabeler voor complexe taken, maar Gemini 2 Flash is goedkoper per token.
Hoe gaat OrcaRouter om met gegevensprivacy?
OrcaRouter stuurt uw verzoeken door naar de API van Google. Gegevensverwerking volgt het privacybeleid van Google. OrcaRouter registreert of bewaart uw inhoud niet, behalve wat nodig is om het verzoek te verwerken. Raadpleeg het beleid van beide providers voor details.
Kan ik Gemini 3 Flash Preview aanroepen met een OpenAI-compatibele API?
Ja. Gebruik de API van OrcaRouter op https://api.orcarouter.ai/v1 met model-ID "google/gemini-3-flash-preview". Authenticatie gebruikt een OrcaRouter API-sleutel. De verzoek- en antwoordformaten volgen het schema van OpenAI's Chat Completions.
Wat zijn de belangrijkste sterke punten van het model?
Hoge inferentiesnelheid, grote 1M-token context, multimodale invoer (tekst, afbeelding, bestand, audio, video), sterke MMLU-Pro benchmark (88.2) en lage kosten in vergelijking met grotere modellen.
Is Gemini 3 Flash Preview beschikbaar voor productie?
Het is een previewversie, wat betekent dat het wijzigingen, wisselende beschikbaarheid of beperkte ondersteuning kan hebben. Het is geschikt voor testen en ontwikkeling; voor kritieke productieworkloads overweeg de stabiele release te gebruiken zodra deze beschikbaar is.
Hoe schat ik het tokenverbruik voor multimodale inputs?
Elke modaliteit heeft zijn eigen tokenization. Afbeeldingen, audio en video worden opgesplitst in tokens op basis van resolutie en duur. OrcaRouter rapporteert het tokenverbruik in het API-antwoord. U kunt ook de documentatie van Google raadplegen voor gedetailleerde regels voor het tellen van tokens.
Wat gebeurt er als ik het contextvenster overschrijd?
Invoer van meer dan 1.048.576 tokens wordt afgebroken van de oudste inhoud. Het model negeert de overtollige tokens. Zorg ervoor dat uw berichten binnen de limiet vallen door het totale aantal tokens in uw verzoek te controleren.

Sluit deze badge in

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview op OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)