Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

von Google · 2025-12-17

Google Gemini 3 Flash Preview – Multimodales Modell mit 1M Token-Kontext, 88.2 MMLU-Pro, zugänglich über OrcaRouter.

Endpunkte:/v1/chat/completions /v1beta/models/{model}:generateContent

Ktx1.05M Tokens

Eingabetext + image + file + audio + video

Ausgabetext

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

EINGABE$0.50/ 1M Tokens

AUSGABE$3.00/ 1M Tokens

p50 TTFT3.81 s7 T

p95 TTFT10.00 s7 T

DATENVERKEHR1.1MTokens / 7 T

Gemini 3 Flash Preview API holen →▶ Im Playground testen </> Über API nutzen

Was ist Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview ist ein multimodales Modell, das von Google entwickelt wurde und für hohe Geschwindigkeit sowie die Verarbeitung großer Kontexte optimiert ist. Es akzeptiert Eingaben in Text-, Bild-, Datei-, Audio- und Videoformaten und kann bis zu 65.536 Token Ausgabe generieren. Das Modell verfügt über ein Kontextfenster von 1.048.576 Token, sodass es über sehr lange Sequenzen hinweg Schlussfolgerungen ziehen kann. Es erreicht 88,2 im MMLU-Pro-Benchmark, was auf eine starke Leistung bei einer Vielzahl akademischer und logischer Aufgaben hindeutet. Diese Vorschauversion ist über die OpenAI-kompatible API von OrcaRouter unter der Modell-ID google/gemini-3-flash-preview verfügbar.

Wer ist die Zielgruppe für dieses Modell?

Gemini 3 Flash Preview richtet sich an Entwickler und Organisationen, die Anwendungen erstellen, die schnelles multimodales Reasoning mit großem Kontext erfordern. Es eignet sich gut für Anwendungsfälle wie Videoanalyse, Zusammenfassung langer Dokumente und Echtzeit-Audio-Video-Verständnis. Die Preisgestaltung des Modells – $0,50 pro Million Eingabe-Token und $3,00 pro Million Ausgabe-Token – macht es sowohl für Startups als auch für Unternehmen zugänglich. Da es sich um eine Vorschau handelt, können Early Adopter die Fähigkeiten vor einer stabilen Veröffentlichung bewerten. OrcaRouter bietet nahtlosen Zugriff auf dieses Modell, einschließlich OpenAI-kompatiblen Endpunkten und null Aufschlag auf die Anbieterpreise.

Welche multimodalen Eingaben unterstützt es?

Gemini 3 Flash Preview unterstützt fünf Eingabemodalitäten: Text, Bild, Datei, Audio und Video. Text kann klar oder strukturiert sein; Bilder können Fotos, Diagramme und Screenshots umfassen; Dateien decken Formate wie PDFs und Dokumente ab; Audio umfasst Sprache und Musik; Video kann sowohl mit visuellen als auch mit Audiospuren verarbeitet werden. Das Modell kann mehrere Modalitäten in einer einzigen Eingabeaufforderung kombinieren – zum Beispiel die Analyse eines Videos bei gleichzeitigem Lesen einer angehängten PDF. Diese Vielseitigkeit ermöglicht es ihm, komplexe Mixed-Media-Aufgaben ohne separate Pipelines zu bewältigen. Eingabetoken werden auf der Grundlage der jeweiligen modalitätsspezifischen Tokenizer-Regeln gezählt.

Wie ist der Vorschaustatus und wie stabil ist er?

Gemini 3 Flash Preview ist eine Vorabversion von Googles dritter Generation des Flash-Modells. Als Vorschau kann es Änderungen im Verhalten, der Leistung und der Verfügbarkeit unterliegen. Google aktualisiert Vorschaumodelle in der Regel basierend auf Benutzerfeedback und kann schließlich Vorschau-Endpunkte durch stabile Versionen ersetzen. Während das Modell funktionsfähig und für Tests und Entwicklung geeignet ist, sollten Produktionsbereitstellungen auf Aktualisierungen achten. OrcaRouter spiegelt den Endpunkt des Anbieters wider und stellt sicher, dass Änderungen von Google zeitnah übernommen werden. Die Modell-ID google/gemini-3-flash-preview bleibt konsistent, sofern Google seine Benennung nicht ändert.

Code-Beispiele

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Preise

Eingabe / 1M Tokens	$0.500
Ausgabe / 1M Tokens	$3.00
Cache-Lesen / 1M	$0.050
Währung	USD

Leistung

letzte 7 Tage

p50 TTFT

3.81 s

Ausgabegeschwindigkeit

851 tok/s

p95 TTFT

10.00 s

Fehlerquote

Öffentliche Benchmarks

Zuletzt bewertet 2025-12-17

37.8

AA Coding

Besser als 47 % der verglichenen Modelle

35.0

AA Intelligence

Besser als 35 % der verglichenen Modelle

55.7

AA Math

Besser als 32 % der verglichenen Modelle

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

Quelle: artificialanalysis.ai

Weitere von Google

Alle Modelle von google ansehen →

Gemini 3.1 Pro PreviewFlaggschiff

google/gemini-3.1-pro-preview

$2.00 Eingabe · $12.00 Ausgabe / 1M

1.05M Ktx· Qualität 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 Eingabe · $18.00 Ausgabe / 1M

1.05M Ktx· Qualität 10/10

Gemini 3.5 FlashGünstigste

google/gemini-3.5-flash

$1.50 Eingabe · $9.00 Ausgabe / 1M

1.05M Ktx· Qualität 9/10

FAQ

Was sind die Kosten für die Nutzung von Gemini 3 Flash Preview?

Die Preisgestaltung beträgt 0,50 $ pro Million Eingabetokens und 3,00 $ pro Million Ausgabetokens, abgerechnet zum Anbieterpreis ohne Aufschlag durch OrcaRouter.

Wie groß ist das Kontextfenster?

Das Kontextfenster ist 1,048,576 Tokens für die Eingabe und das Modell kann bis zu 65,536 Ausgabetokens generieren.

Welche Eingabemodalitäten werden unterstützt?

Text, Bild, Datei, Audio und Video werden alle als Eingabe akzeptiert. Die Ausgabe erfolgt ausschließlich als Text.

Wie schneidet es im Vergleich zu Gemini 2 Flash ab?

Gemini 3 Flash Preview hat ein größeres Kontextfenster (1M vs. bis zu 1M, aber oft kleiner), einen höheren MMLU-Pro-Wert (88.2) und erweiterte multimodale Unterstützung einschließlich Video. Es ist schneller und leistungsfähiger für komplexe Aufgaben, aber Gemini 2 Flash ist günstiger pro Token.

Wie geht OrcaRouter mit Datenschutz um?

OrcaRouter leitet Ihre Anfragen an die Google-API weiter. Die Datenverarbeitung erfolgt gemäß der Datenschutzrichtlinie von Google. OrcaRouter protokolliert oder speichert Ihre Inhalte nicht über das zur Bearbeitung der Anfrage Notwendige hinaus. Lesen Sie die Richtlinien beider Anbieter für Details.

Kann ich Gemini 3 Flash Preview über eine OpenAI-kompatible API aufrufen?

Ja. Verwenden Sie die OrcaRouter-API unter https://api.orcarouter.ai/v1 mit der Modell-ID "google/gemini-3-flash-preview". Die Authentifizierung verwendet einen OrcaRouter-API-Schlüssel. Das Anfrage- und Antwortformat folgt dem Schema der OpenAI Chat Completions.

Was sind die Hauptstärken des Modells?

Hohe Inferenzgeschwindigkeit, großer 1M-Token-Kontext, multimodale Eingabe (Text, Bild, Datei, Audio, Video), starke MMLU-Pro-Benchmark (88.2) und niedrige Kosten im Vergleich zu größeren Modellen.

Ist Gemini 3 Flash Preview für die Produktion verfügbar?

Es handelt sich um eine Vorschauversion, was bedeutet, dass sie Änderungen, zeitweise Verfügbarkeit oder eingeschränkten Support haben kann. Sie ist für Tests und Entwicklung geeignet; für kritische Produktionsumgebungen sollten Sie die stabile Version verwenden, sobald diese verfügbar ist.

Wie schätze ich die Token-Nutzung für multimodale Eingaben?

Jede Modalität hat ihre eigene Tokenisierung. Bilder, Audio und Video werden basierend auf Auflösung und Dauer in Tokens aufgeteilt. OrcaRouter meldet die Token-Nutzung in der API-Antwort. Sie können auch die Google-Dokumentation für detaillierte Token-Zählungsregeln konsultieren.

Was passiert, wenn ich das Kontextfenster überschreite?

Eingaben, die 1.048.576 Token überschreiten, werden ab dem ältesten Inhalt abgeschnitten. Das Modell ignoriert die überschüssigen Token. Stellen Sie sicher, dass Ihre Nachrichten innerhalb des Limits bleiben, indem Sie die Gesamtzahl der Token in Ihrer Anfrage überwachen.

Dieses Abzeichen einbetten

In Blogartikel einfügen

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•via OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview auf OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

Was ist Google Gemini 3 Flash Preview?

Wer ist die Zielgruppe für dieses Modell?

Welche multimodalen Eingaben unterstützt es?

Wie ist der Vorschaustatus und wie stabil ist er?

Was kann Gemini 3 Flash Preview mit Text und Bildern tun?

Wie handhabt es Audio und Video?

Was sind die besten Anwendungsfälle für dieses Flash-Modell?

Wann würdest du stattdessen ein günstigeres oder leistungsstärkeres Modell wählen?

Was bedeutet der MMLU-Pro-Wert von 88,2?

Wie schnell ist Gemini 3 Flash Preview für die Inferenz?

Was sind die Hauptstärken des Modells laut Benchmarks?

Was sind die ehrlichen Einschränkungen von Gemini 3 Flash Preview?

Wie ist die Preisstruktur für Gemini 3 Flash Preview?

Wie vergleicht sich die Preisgestaltung mit anderen Modellen?

Gibt es Rabatte für Caching oder Mengenrabatte?

Wie rufe ich Gemini 3 Flash Preview über die OrcaRouter-API auf?

Welche Parameter stehen beim Aufruf des Modells zur Verfügung?

Wie migriere ich von Googles native API zu OrcaRouter?

Gibt es einen Unterschied im Antwortformat im Vergleich zu OpenAI?

Wie schneidet Gemini 3 Flash Preview im Vergleich zu Gemini 2 Flash ab?

Wie schneidet es im Vergleich zu GPT-4o ab?

Wie schneidet es im Vergleich zu anderen Google-Modellen ab?

Code-Beispiele

Preise

Leistung

Öffentliche Benchmarks

Weitere von Google

FAQ

Dieses Abzeichen einbetten

Gemini 3 Flash Preview

Modelldetails

Was ist Google Gemini 3 Flash Preview?

Wer ist die Zielgruppe für dieses Modell?

Welche multimodalen Eingaben unterstützt es?

Wie ist der Vorschaustatus und wie stabil ist er?

Was kann Gemini 3 Flash Preview mit Text und Bildern tun?

Wie handhabt es Audio und Video?

Was sind die besten Anwendungsfälle für dieses Flash-Modell?

Wann würdest du stattdessen ein günstigeres oder leistungsstärkeres Modell wählen?

Was bedeutet der MMLU-Pro-Wert von 88,2?

Wie schnell ist Gemini 3 Flash Preview für die Inferenz?

Was sind die Hauptstärken des Modells laut Benchmarks?

Was sind die ehrlichen Einschränkungen von Gemini 3 Flash Preview?

Wie ist die Preisstruktur für Gemini 3 Flash Preview?

Wie vergleicht sich die Preisgestaltung mit anderen Modellen?

Gibt es Rabatte für Caching oder Mengenrabatte?

Wie rufe ich Gemini 3 Flash Preview über die OrcaRouter-API auf?

Welche Parameter stehen beim Aufruf des Modells zur Verfügung?

Wie migriere ich von Googles native API zu OrcaRouter?

Gibt es einen Unterschied im Antwortformat im Vergleich zu OpenAI?

Wie schneidet Gemini 3 Flash Preview im Vergleich zu Gemini 2 Flash ab?

Wie schneidet es im Vergleich zu GPT-4o ab?

Wie schneidet es im Vergleich zu anderen Google-Modellen ab?

Code-Beispiele

Preise

Leistung

Öffentliche Benchmarks

Weitere von Google

FAQ

Dieses Abzeichen einbetten