Gemini 3 Flash Preview

google/gemini-3-flash-preview
von Google · 2025-12-17

Google Gemini 3 Flash Preview – Multimodales Modell mit 1M Token-Kontext, 88.2 MMLU-Pro, zugänglich über OrcaRouter.

Ktx1.05M Tokens
Eingabetext + image + file + audio + video
Ausgabetext
p50 TTFT3.81 s
EINGABE$0.50/ 1M Tokens
AUSGABE$3.00/ 1M Tokens
p50 TTFT3.81 s7 T
p95 TTFT10.00 s7 T
DATENVERKEHR1.1MTokens / 7 T

Modelldetails

Was ist Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview ist ein multimodales Modell, das von Google entwickelt wurde und für hohe Geschwindigkeit sowie die Verarbeitung großer Kontexte optimiert ist. Es akzeptiert Eingaben in Text-, Bild-, Datei-, Audio- und Videoformaten und kann bis zu 65.536 Token Ausgabe generieren. Das Modell verfügt über ein Kontextfenster von 1.048.576 Token, sodass es über sehr lange Sequenzen hinweg Schlussfolgerungen ziehen kann. Es erreicht 88,2 im MMLU-Pro-Benchmark, was auf eine starke Leistung bei einer Vielzahl akademischer und logischer Aufgaben hindeutet. Diese Vorschauversion ist über die OpenAI-kompatible API von OrcaRouter unter der Modell-ID google/gemini-3-flash-preview verfügbar.

Wer ist die Zielgruppe für dieses Modell?

Gemini 3 Flash Preview richtet sich an Entwickler und Organisationen, die Anwendungen erstellen, die schnelles multimodales Reasoning mit großem Kontext erfordern. Es eignet sich gut für Anwendungsfälle wie Videoanalyse, Zusammenfassung langer Dokumente und Echtzeit-Audio-Video-Verständnis. Die Preisgestaltung des Modells – $0,50 pro Million Eingabe-Token und $3,00 pro Million Ausgabe-Token – macht es sowohl für Startups als auch für Unternehmen zugänglich. Da es sich um eine Vorschau handelt, können Early Adopter die Fähigkeiten vor einer stabilen Veröffentlichung bewerten. OrcaRouter bietet nahtlosen Zugriff auf dieses Modell, einschließlich OpenAI-kompatiblen Endpunkten und null Aufschlag auf die Anbieterpreise.

Welche multimodalen Eingaben unterstützt es?

Gemini 3 Flash Preview unterstützt fünf Eingabemodalitäten: Text, Bild, Datei, Audio und Video. Text kann klar oder strukturiert sein; Bilder können Fotos, Diagramme und Screenshots umfassen; Dateien decken Formate wie PDFs und Dokumente ab; Audio umfasst Sprache und Musik; Video kann sowohl mit visuellen als auch mit Audiospuren verarbeitet werden. Das Modell kann mehrere Modalitäten in einer einzigen Eingabeaufforderung kombinieren – zum Beispiel die Analyse eines Videos bei gleichzeitigem Lesen einer angehängten PDF. Diese Vielseitigkeit ermöglicht es ihm, komplexe Mixed-Media-Aufgaben ohne separate Pipelines zu bewältigen. Eingabetoken werden auf der Grundlage der jeweiligen modalitätsspezifischen Tokenizer-Regeln gezählt.

Wie ist der Vorschaustatus und wie stabil ist er?

Gemini 3 Flash Preview ist eine Vorabversion von Googles dritter Generation des Flash-Modells. Als Vorschau kann es Änderungen im Verhalten, der Leistung und der Verfügbarkeit unterliegen. Google aktualisiert Vorschaumodelle in der Regel basierend auf Benutzerfeedback und kann schließlich Vorschau-Endpunkte durch stabile Versionen ersetzen. Während das Modell funktionsfähig und für Tests und Entwicklung geeignet ist, sollten Produktionsbereitstellungen auf Aktualisierungen achten. OrcaRouter spiegelt den Endpunkt des Anbieters wider und stellt sicher, dass Änderungen von Google zeitnah übernommen werden. Die Modell-ID google/gemini-3-flash-preview bleibt konsistent, sofern Google seine Benennung nicht ändert.

Code-Beispiele

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preise

Eingabe / 1M Tokens$0.500
Ausgabe / 1M Tokens$3.00
Cache-Lesen / 1M$0.050
WährungUSD

Leistung

p50 TTFT
3.81 s
Ausgabegeschwindigkeit
851 tok/s
p95 TTFT
10.00 s
Fehlerquote
0%

Öffentliche Benchmarks

37.8
AA Coding
Besser als 47 % der verglichenen Modelle
35.0
AA Intelligence
Besser als 35 % der verglichenen Modelle
55.7
AA Math
Besser als 32 % der verglichenen Modelle
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Quelle: artificialanalysis.ai

FAQ

Was sind die Kosten für die Nutzung von Gemini 3 Flash Preview?
Die Preisgestaltung beträgt 0,50 $ pro Million Eingabetokens und 3,00 $ pro Million Ausgabetokens, abgerechnet zum Anbieterpreis ohne Aufschlag durch OrcaRouter.
Wie groß ist das Kontextfenster?
Das Kontextfenster ist 1,048,576 Tokens für die Eingabe und das Modell kann bis zu 65,536 Ausgabetokens generieren.
Welche Eingabemodalitäten werden unterstützt?
Text, Bild, Datei, Audio und Video werden alle als Eingabe akzeptiert. Die Ausgabe erfolgt ausschließlich als Text.
Wie schneidet es im Vergleich zu Gemini 2 Flash ab?
Gemini 3 Flash Preview hat ein größeres Kontextfenster (1M vs. bis zu 1M, aber oft kleiner), einen höheren MMLU-Pro-Wert (88.2) und erweiterte multimodale Unterstützung einschließlich Video. Es ist schneller und leistungsfähiger für komplexe Aufgaben, aber Gemini 2 Flash ist günstiger pro Token.
Wie geht OrcaRouter mit Datenschutz um?
OrcaRouter leitet Ihre Anfragen an die Google-API weiter. Die Datenverarbeitung erfolgt gemäß der Datenschutzrichtlinie von Google. OrcaRouter protokolliert oder speichert Ihre Inhalte nicht über das zur Bearbeitung der Anfrage Notwendige hinaus. Lesen Sie die Richtlinien beider Anbieter für Details.
Kann ich Gemini 3 Flash Preview über eine OpenAI-kompatible API aufrufen?
Ja. Verwenden Sie die OrcaRouter-API unter https://api.orcarouter.ai/v1 mit der Modell-ID "google/gemini-3-flash-preview". Die Authentifizierung verwendet einen OrcaRouter-API-Schlüssel. Das Anfrage- und Antwortformat folgt dem Schema der OpenAI Chat Completions.
Was sind die Hauptstärken des Modells?
Hohe Inferenzgeschwindigkeit, großer 1M-Token-Kontext, multimodale Eingabe (Text, Bild, Datei, Audio, Video), starke MMLU-Pro-Benchmark (88.2) und niedrige Kosten im Vergleich zu größeren Modellen.
Ist Gemini 3 Flash Preview für die Produktion verfügbar?
Es handelt sich um eine Vorschauversion, was bedeutet, dass sie Änderungen, zeitweise Verfügbarkeit oder eingeschränkten Support haben kann. Sie ist für Tests und Entwicklung geeignet; für kritische Produktionsumgebungen sollten Sie die stabile Version verwenden, sobald diese verfügbar ist.
Wie schätze ich die Token-Nutzung für multimodale Eingaben?
Jede Modalität hat ihre eigene Tokenisierung. Bilder, Audio und Video werden basierend auf Auflösung und Dauer in Tokens aufgeteilt. OrcaRouter meldet die Token-Nutzung in der API-Antwort. Sie können auch die Google-Dokumentation für detaillierte Token-Zählungsregeln konsultieren.
Was passiert, wenn ich das Kontextfenster überschreite?
Eingaben, die 1.048.576 Token überschreiten, werden ab dem ältesten Inhalt abgeschnitten. Das Modell ignoriert die überschüssigen Token. Stellen Sie sicher, dass Ihre Nachrichten innerhalb des Limits bleiben, indem Sie die Gesamtzahl der Token in Ihrer Anfrage überwachen.

Dieses Abzeichen einbetten

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview auf OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)