Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

przez Google · 2025-12-17

Google Gemini 3 Flash Preview – Model multimodalny z kontekstem 1M tokenów, 88,2 MMLU-Pro, dostępny przez OrcaRouter.

Punkty końcowe:/v1/chat/completions /v1beta/models/{model}:generateContent

kont.1.05M tokenów

Wejścietext + image + file + audio + video

Wyjścietext

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

WEJŚCIE$0.50/ 1M tokenów

WYJŚCIE$3.00/ 1M tokenów

p50 TTFT3.81 s7 d

p95 TTFT10.00 s7 d

RUCH1.1Mtokenów / 7 d

Uzyskaj API Gemini 3 Flash Preview →▶ Wypróbuj w Playground </> Użyj przez API

Czym jest Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview to model multimodalny opracowany przez Google, zoptymalizowany pod kątem szybkości i przetwarzania dużych kontekstów. Przyjmuje dane wejściowe w formacie tekstu, obrazu, pliku, audio i wideo, a także może generować do 65 536 tokenów wyjściowych. Model posiada okno kontekstowe o pojemności 1 048 576 tokenów, co pozwala mu na wnioskowanie w bardzo długich sekwencjach. Osiąga wynik 88,2 w benchmarku MMLU-Pro, co wskazuje na silną wydajność w szerokim zakresie zadań akademickich i wymagających rozumowania. Ta wersja zapoznawcza jest dostępna za pośrednictwem zgodnego z OpenAI interfejsu API OrcaRouter pod identyfikatorem modelu google/gemini-3-flash-preview.

Do kogo skierowany jest ten model?

Gemini 3 Flash Preview jest skierowany do programistów i organizacji tworzących aplikacje wymagające szybkiego, multimodalnego wnioskowania z dużym kontekstem. Doskonale nadaje się do zastosowań takich jak analiza wideo, digest długich dokumentów oraz rozumienie audio-wideo w czasie rzeczywistym. Ceny modelu – 0,50 USD za milion tokenów wejściowych i 3,00 USD za milion tokenów wyjściowych – czynią go dostępnym zarówno dla startupów, jak i dużych przedsiębiorstw. Ponieważ jest to wersja podglądowa, pierwsi użytkownicy mogą ocenić jego możliwości przed stabilnym wydaniem. OrcaRouter zapewnia bezproblemowy dostęp do tego modelu, w tym punkty końcowe zgodne z OpenAI oraz zerową marżę na stawkach dostawcy.

Jakie multimodalne wejścia obsługuje?

Gemini 3 Flash Preview obsługuje pięć modalności wejściowych: tekst, obraz, plik, audio i wideo. Tekst może być zwykły lub strukturalny; obrazy mogą obejmować zdjęcia, diagramy i zrzuty ekranu; pliki obejmują formaty takie jak PDF i dokumenty; audio obejmuje mowę i muzykę; wideo może być przetwarzane z obydwoma ścieżkami: wizualną i dźwiękową. Model może łączyć wiele modalności w jednym zapytaniu — na przykład analizując wideo, jednocześnie czytając załączony plik PDF. Ta wszechstronność pozwala mu radzić sobie ze złożonymi zadaniami z mediami mieszanymi bez konieczności korzystania z oddzielnych potoków. Tokeny wejściowe są liczone na podstawie zasad tokenizatora specyficznych dla każdej modalności.

Jaki jest status wersji zapoznawczej i jak stabilna jest?

Gemini 3 Flash Preview to przedpremierowa wersja trzeciej generacji modelu Flash od Google. Jako wersja przedpremierowa może ulegać zmianom w zakresie zachowania, wydajności i dostępności. Google zazwyczaj aktualizuje modele przedpremierowe na podstawie opinii użytkowników, a z czasem może zastąpić punkty końcowe wersji przedpremierowych stabilnymi wydaniami. Mimo że model jest funkcjonalny i nadaje się do testowania i rozwoju, wdrożenia produkcyjne powinny monitorować aktualizacje. OrcaRouter odzwierciedla punkt końcowy dostawcy, zapewniając szybkie odzwierciedlenie wszelkich zmian wprowadzanych przez Google. Identyfikator modelu google/gemini-3-flash-preview pozostanie spójny, chyba że Google zmieni jego nazewnictwo.

Przykłady kodu

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Cennik

Wejście / 1M tokenów	$0.500
Wyjście / 1M tokenów	$3.00
Odczyt cache / 1M	$0.050
Waluta	USD

Wydajność

ostatnie 7 dni

p50 TTFT

3.81 s

Prędkość wyjścia

851 tok/s

p95 TTFT

10.00 s

Wskaźnik błędów

Publiczne benchmarki

Ostatnia ocena 2025-12-17

37.8

AA Coding

Lepszy niż 47% porównywanych modeli

35.0

AA Intelligence

Lepszy niż 35% porównywanych modeli

55.7

AA Math

Lepszy niż 32% porównywanych modeli

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

Źródło: artificialanalysis.ai

Więcej od Google

Zobacz wszystkie modele google →

Gemini 3.1 Pro PreviewFlagowy

google/gemini-3.1-pro-preview

$2.00 wejście · $12.00 wyjście / 1M

1.05M kont.· jakość 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 wejście · $18.00 wyjście / 1M

1.05M kont.· jakość 10/10

Gemini 3.5 FlashNajtańszy

google/gemini-3.5-flash

$1.50 wejście · $9.00 wyjście / 1M

1.05M kont.· jakość 9/10

FAQ

Jaki jest koszt korzystania z Gemini 3 Flash Preview?

Cennik wynosi $0.50 za milion tokenów wejściowych i $3.00 za milion tokenów wyjściowych, rozliczane według stawki dostawcy bez żadnej marży dodawanej przez OrcaRouter.

Jaki jest rozmiar okna kontekstu?

Okno kontekstu wynosi 1 048 576 tokenów dla wejścia, a model może wygenerować do 65 536 tokenów wyjściowych.

Jakie są obsługiwane modalności wejścia?

Tekst, obraz, plik, dźwięk i wideo są akceptowane jako wejście. Wyjście jest tylko tekstem.

Jak to się ma do Gemini 2 Flash?

Gemini 3 Flash Preview ma większe okno kontekstowe (1M w porównaniu do do 1M, ale często mniejsze), wyższy wynik MMLU-Pro (88,2) oraz rozszerzone wsparcie multimodalne obejmujące wideo. Jest szybszy i bardziej wydajny w przypadku złożonych zadań, ale Gemini 2 Flash jest tańszy za token.

Jak OrcaRouter radzi sobie z prywatnością danych?

OrcaRouter przekazuje Twoje żądania do API Google. Przetwarzanie danych odbywa się zgodnie z polityką prywatności Google. OrcaRouter nie rejestruje ani nie przechowuje Twoich treści dłużej niż jest to konieczne do przetworzenia żądania. Sprawdź polityki obu dostawców, aby uzyskać szczegóły.

Czy mogę wywołać Gemini 3 Flash Preview przy użyciu API kompatybilnego z OpenAI?

Tak. Użyj API OrcaRouter pod adresem https://api.orcarouter.ai/v1 z identyfikatorem modelu "google/gemini-3-flash-preview". Uwierzytelnianie wykorzystuje klucz API OrcaRouter. Format żądań i odpowiedzi jest zgodny ze schematem Chat Completions OpenAI.

Jakie są główne zalety modelu?

Wysoka szybkość wnioskowania, duży kontekst o długości 1M tokenów, wejście multimodalne (tekst, obraz, plik, audio, wideo), mocny benchmark MMLU-Pro (88,2) i niski koszt w porównaniu do większych modeli.

Czy Gemini 3 Flash Preview jest dostępny do produkcji?

Jest to wersja zapoznawcza, co oznacza, że może ulegać zmianom, mieć przerywaną dostępność lub ograniczone wsparcie. Nadaje się do testowania i rozwoju; w przypadku krytycznych obciążeń produkcyjnych rozważ użycie stabilnej wersji, gdy będzie dostępna.

Jak oszacować zużycie tokenów dla multimodalnych danych wejściowych?

Każda modalność ma swoją własną tokenizację. Obrazy, audio i wideo są dzielone na tokeny na podstawie rozdzielczości i czasu trwania. OrcaRouter raportuje użycie tokenów w odpowiedzi API. Możesz również skonsultować się z dokumentacją Google, aby poznać szczegółowe zasady liczenia tokenów.

Co się stanie, jeśli przekroczę okno kontekstu?

Dane wejściowe przekraczające 1 048 576 tokenów zostaną obcięte od najstarszej treści. Model zignoruje nadmiarowe tokeny. Upewnij się, że Twoje wiadomości mieszczą się w limicie, monitorując całkowitą liczbę tokenów w swoim żądaniu.

Osadź tę odznakę

Wklej do swojego bloga

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•przez OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview w OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

Czym jest Google Gemini 3 Flash Preview?

Do kogo skierowany jest ten model?

Jakie multimodalne wejścia obsługuje?

Jaki jest status wersji zapoznawczej i jak stabilna jest?

Co może zrobić Gemini 3 Flash Preview z tekstem i obrazami?

Jak radzi sobie z dźwiękiem i wideo?

Jakie są najlepsze przypadki użycia dla tego modelu Flash?

Kiedy można zamiast tego wybrać tańszy lub mocniejszy model?

Co oznacza wynik MMLU-Pro wynoszący 88.2?

Jak szybki jest Gemini 3 Flash Preview w wnioskowaniu?

Jakie są kluczowe mocne strony modelu na podstawie benchmarków?

Jakie są rzetelne ograniczenia Gemini 3 Flash Preview?

Jaka jest struktura cenowa Gemini 3 Flash Preview?

Jak cena wypada w porównaniu z innymi modelami?

Czy są jakieś rabaty za buforowanie lub ceny hurtowe?

Jak wywołać Gemini 3 Flash Preview przez API OrcaRoutera?

Jakie parametry są dostępne podczas wywoływania modelu?

Jak migrować z natywnego API Google do OrcaRouter?

Czy istnieje jakaś różnica w formacie odpowiedzi w porównaniu do OpenAI?

Jak Gemini 3 Flash Preview wypada w porównaniu z Gemini 2 Flash?

Jak wypada w porównaniu z GPT-4o?

Jak wypada w porównaniu z innymi modelami Google?

Przykłady kodu

Cennik

Wydajność

Publiczne benchmarki

Więcej od Google

FAQ

Osadź tę odznakę

Gemini 3 Flash Preview

Szczegóły modelu

Czym jest Google Gemini 3 Flash Preview?

Do kogo skierowany jest ten model?

Jakie multimodalne wejścia obsługuje?

Jaki jest status wersji zapoznawczej i jak stabilna jest?

Co może zrobić Gemini 3 Flash Preview z tekstem i obrazami?

Jak radzi sobie z dźwiękiem i wideo?

Jakie są najlepsze przypadki użycia dla tego modelu Flash?

Kiedy można zamiast tego wybrać tańszy lub mocniejszy model?

Co oznacza wynik MMLU-Pro wynoszący 88.2?

Jak szybki jest Gemini 3 Flash Preview w wnioskowaniu?

Jakie są kluczowe mocne strony modelu na podstawie benchmarków?

Jakie są rzetelne ograniczenia Gemini 3 Flash Preview?

Jaka jest struktura cenowa Gemini 3 Flash Preview?

Jak cena wypada w porównaniu z innymi modelami?

Czy są jakieś rabaty za buforowanie lub ceny hurtowe?

Jak wywołać Gemini 3 Flash Preview przez API OrcaRoutera?

Jakie parametry są dostępne podczas wywoływania modelu?

Jak migrować z natywnego API Google do OrcaRouter?

Czy istnieje jakaś różnica w formacie odpowiedzi w porównaniu do OpenAI?

Jak Gemini 3 Flash Preview wypada w porównaniu z Gemini 2 Flash?

Jak wypada w porównaniu z GPT-4o?

Jak wypada w porównaniu z innymi modelami Google?

Przykłady kodu

Cennik

Wydajność

Publiczne benchmarki

Więcej od Google

FAQ

Osadź tę odznakę