Gemini 3 Flash Preview

google/gemini-3-flash-preview
przez Google · 2025-12-17

Google Gemini 3 Flash Preview – Model multimodalny z kontekstem 1M tokenów, 88,2 MMLU-Pro, dostępny przez OrcaRouter.

kont.1.05M tokenów
Wejścietext + image + file + audio + video
Wyjścietext
p50 TTFT3.81 s
WEJŚCIE$0.50/ 1M tokenów
WYJŚCIE$3.00/ 1M tokenów
p50 TTFT3.81 s7 d
p95 TTFT10.00 s7 d
RUCH1.1Mtokenów / 7 d

Szczegóły modelu

Czym jest Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview to model multimodalny opracowany przez Google, zoptymalizowany pod kątem szybkości i przetwarzania dużych kontekstów. Przyjmuje dane wejściowe w formacie tekstu, obrazu, pliku, audio i wideo, a także może generować do 65 536 tokenów wyjściowych. Model posiada okno kontekstowe o pojemności 1 048 576 tokenów, co pozwala mu na wnioskowanie w bardzo długich sekwencjach. Osiąga wynik 88,2 w benchmarku MMLU-Pro, co wskazuje na silną wydajność w szerokim zakresie zadań akademickich i wymagających rozumowania. Ta wersja zapoznawcza jest dostępna za pośrednictwem zgodnego z OpenAI interfejsu API OrcaRouter pod identyfikatorem modelu google/gemini-3-flash-preview.

Do kogo skierowany jest ten model?

Gemini 3 Flash Preview jest skierowany do programistów i organizacji tworzących aplikacje wymagające szybkiego, multimodalnego wnioskowania z dużym kontekstem. Doskonale nadaje się do zastosowań takich jak analiza wideo, digest długich dokumentów oraz rozumienie audio-wideo w czasie rzeczywistym. Ceny modelu – 0,50 USD za milion tokenów wejściowych i 3,00 USD za milion tokenów wyjściowych – czynią go dostępnym zarówno dla startupów, jak i dużych przedsiębiorstw. Ponieważ jest to wersja podglądowa, pierwsi użytkownicy mogą ocenić jego możliwości przed stabilnym wydaniem. OrcaRouter zapewnia bezproblemowy dostęp do tego modelu, w tym punkty końcowe zgodne z OpenAI oraz zerową marżę na stawkach dostawcy.

Jakie multimodalne wejścia obsługuje?

Gemini 3 Flash Preview obsługuje pięć modalności wejściowych: tekst, obraz, plik, audio i wideo. Tekst może być zwykły lub strukturalny; obrazy mogą obejmować zdjęcia, diagramy i zrzuty ekranu; pliki obejmują formaty takie jak PDF i dokumenty; audio obejmuje mowę i muzykę; wideo może być przetwarzane z obydwoma ścieżkami: wizualną i dźwiękową. Model może łączyć wiele modalności w jednym zapytaniu — na przykład analizując wideo, jednocześnie czytając załączony plik PDF. Ta wszechstronność pozwala mu radzić sobie ze złożonymi zadaniami z mediami mieszanymi bez konieczności korzystania z oddzielnych potoków. Tokeny wejściowe są liczone na podstawie zasad tokenizatora specyficznych dla każdej modalności.

Jaki jest status wersji zapoznawczej i jak stabilna jest?

Gemini 3 Flash Preview to przedpremierowa wersja trzeciej generacji modelu Flash od Google. Jako wersja przedpremierowa może ulegać zmianom w zakresie zachowania, wydajności i dostępności. Google zazwyczaj aktualizuje modele przedpremierowe na podstawie opinii użytkowników, a z czasem może zastąpić punkty końcowe wersji przedpremierowych stabilnymi wydaniami. Mimo że model jest funkcjonalny i nadaje się do testowania i rozwoju, wdrożenia produkcyjne powinny monitorować aktualizacje. OrcaRouter odzwierciedla punkt końcowy dostawcy, zapewniając szybkie odzwierciedlenie wszelkich zmian wprowadzanych przez Google. Identyfikator modelu google/gemini-3-flash-preview pozostanie spójny, chyba że Google zmieni jego nazewnictwo.

Przykłady kodu

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Cennik

Wejście / 1M tokenów$0.500
Wyjście / 1M tokenów$3.00
Odczyt cache / 1M$0.050
WalutaUSD

Wydajność

p50 TTFT
3.81 s
Prędkość wyjścia
851 tok/s
p95 TTFT
10.00 s
Wskaźnik błędów
0%

Publiczne benchmarki

37.8
AA Coding
Lepszy niż 47% porównywanych modeli
35.0
AA Intelligence
Lepszy niż 35% porównywanych modeli
55.7
AA Math
Lepszy niż 32% porównywanych modeli
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Źródło: artificialanalysis.ai

FAQ

Jaki jest koszt korzystania z Gemini 3 Flash Preview?
Cennik wynosi $0.50 za milion tokenów wejściowych i $3.00 za milion tokenów wyjściowych, rozliczane według stawki dostawcy bez żadnej marży dodawanej przez OrcaRouter.
Jaki jest rozmiar okna kontekstu?
Okno kontekstu wynosi 1 048 576 tokenów dla wejścia, a model może wygenerować do 65 536 tokenów wyjściowych.
Jakie są obsługiwane modalności wejścia?
Tekst, obraz, plik, dźwięk i wideo są akceptowane jako wejście. Wyjście jest tylko tekstem.
Jak to się ma do Gemini 2 Flash?
Gemini 3 Flash Preview ma większe okno kontekstowe (1M w porównaniu do do 1M, ale często mniejsze), wyższy wynik MMLU-Pro (88,2) oraz rozszerzone wsparcie multimodalne obejmujące wideo. Jest szybszy i bardziej wydajny w przypadku złożonych zadań, ale Gemini 2 Flash jest tańszy za token.
Jak OrcaRouter radzi sobie z prywatnością danych?
OrcaRouter przekazuje Twoje żądania do API Google. Przetwarzanie danych odbywa się zgodnie z polityką prywatności Google. OrcaRouter nie rejestruje ani nie przechowuje Twoich treści dłużej niż jest to konieczne do przetworzenia żądania. Sprawdź polityki obu dostawców, aby uzyskać szczegóły.
Czy mogę wywołać Gemini 3 Flash Preview przy użyciu API kompatybilnego z OpenAI?
Tak. Użyj API OrcaRouter pod adresem https://api.orcarouter.ai/v1 z identyfikatorem modelu "google/gemini-3-flash-preview". Uwierzytelnianie wykorzystuje klucz API OrcaRouter. Format żądań i odpowiedzi jest zgodny ze schematem Chat Completions OpenAI.
Jakie są główne zalety modelu?
Wysoka szybkość wnioskowania, duży kontekst o długości 1M tokenów, wejście multimodalne (tekst, obraz, plik, audio, wideo), mocny benchmark MMLU-Pro (88,2) i niski koszt w porównaniu do większych modeli.
Czy Gemini 3 Flash Preview jest dostępny do produkcji?
Jest to wersja zapoznawcza, co oznacza, że może ulegać zmianom, mieć przerywaną dostępność lub ograniczone wsparcie. Nadaje się do testowania i rozwoju; w przypadku krytycznych obciążeń produkcyjnych rozważ użycie stabilnej wersji, gdy będzie dostępna.
Jak oszacować zużycie tokenów dla multimodalnych danych wejściowych?
Każda modalność ma swoją własną tokenizację. Obrazy, audio i wideo są dzielone na tokeny na podstawie rozdzielczości i czasu trwania. OrcaRouter raportuje użycie tokenów w odpowiedzi API. Możesz również skonsultować się z dokumentacją Google, aby poznać szczegółowe zasady liczenia tokenów.
Co się stanie, jeśli przekroczę okno kontekstu?
Dane wejściowe przekraczające 1 048 576 tokenów zostaną obcięte od najstarszej treści. Model zignoruje nadmiarowe tokeny. Upewnij się, że Twoje wiadomości mieszczą się w limicie, monitorując całkowitą liczbę tokenów w swoim żądaniu.

Osadź tę odznakę

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50przez OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview w OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)