Gemini 3.5 Flash

google/gemini-3.5-flash
przez google · 2026-05-23

Wydajny model multimodalny Google z kontekstem 1M, wysoką wydajnością i opłacalnymi cenami za pośrednictwem OrcaRouter.

kont.1.05M tokenów
Wejścietext + image + video + file + audio
Wyjścietext
p50 TTFT10.00 s
WEJŚCIE$1.50/ 1M tokenów
WYJŚCIE$9.00/ 1M tokenów
p50 TTFT10.00 s7 d
p95 TTFT10.00 s7 d
RUCH4.5Mtokenów / 7 d

Szczegóły modelu

Czym jest Gemini 3.5 Flash?

Gemini 3.5 Flash to duży model językowy opracowany przez Google, dostrojony pod kątem szybkości i wydajności. Należy do rodziny Gemini i jest zaprojektowany do obsługi multimodalnych danych wejściowych – tekstu, obrazu, wideo, plików i audio – przy jednoczesnym dostarczaniu szybkich odpowiedzi. Model obsługuje okno kontekstowe o pojemności 1 048 576 tokenów, co pozwala mu przetwarzać bardzo długie sekwencje, takie jak całe książki, godzinne filmy wideo czy rozległe repozytoria kodu. Maksymalna długość odpowiedzi wynosząca 65 536 tokenów umożliwia generowanie długich treści, w tym pełnych raportów lub rozbudowanych plików kodu. Gemini 3.5 Flash jest dostępny za pośrednictwem zgodnego z OpenAI API OrcaRouter, co oznacza, że można zintegrować go z istniejącymi aplikacjami przy minimalnych zmianach w kodzie.

Kto powinien używać Gemini 3.5 Flash?

Gemini 3.5 Flash jest idealny dla programistów i organizacji, które potrzebują równowagi między wysoką przepustowością, niskim opóźnieniem i kosztami. Szczególnie dobrze sprawdza się w środowiskach produkcyjnych, gdzie szybkość wnioskowania ma znaczenie, takich jak chatboty czasu rzeczywistego, potoki moderowania treści czy zautomatyzowana obsługa klienta. Rozbudowane okno kontekstowe pomaga użytkownikom, którzy muszą analizować duże zbiory danych, długie dokumenty lub obszerne historie rozmów bez konieczności dzielenia ich na fragmenty. Ponadto zespoły tworzące aplikacje multimodalne – takie jak opisywanie obrazów, podsumowywanie wideo czy transkrypcja audio – mogą skorzystać z natywnej obsługi wielu typów danych wejściowych. Jeśli Twoje zadanie wymaga niezwykle wysokich zdolności rozumowania lub złożonej matematyki, rozważ użycie wydajniejszego, ale wolniejszego modelu.

Jakie modalności wejściowe obsługuje Gemini 3.5 Flash?

Gemini 3.5 Flash akceptuje pięć modalności wejściowych: tekst, obraz, wideo, plik i dźwięk. Wejścia tekstowe mogą być zwykłymi ciągami znaków lub ustrukturyzowanymi wiadomościami. Obrazy mogą być przekazywane jako dane zakodowane w base64 lub adresy URL; model może interpretować treści wizualne, takie jak wykresy, diagramy czy fotografie. Wejścia wideo są obsługiwane jako sekwencje klatek lub skompresowane pliki wideo, co pozwala modelowi analizować ruch i zmiany czasowe. Wejścia plikowe obejmują popularne formaty, takie jak PDF, DOCX lub pliki z kodem; model może wyodrębnić i analizować ich zawartość. Wejścia dźwiękowe mogą być surowe lub skompresowane (np. MP3, WAV), umożliwiając transkrypcję mowy i analizę dźwięku. Wszystkie modalności mogą być łączone w jednym żądaniu, co czyni Gemini 3.5 Flash wszechstronnym narzędziem do zadań multimodalnych.

Jak uzyskać dostęp do Gemini 3.5 Flash przez OrcaRouter?

OrcaRouter udostępnia Gemini 3.5 Flash poprzez swoje API kompatybilne z OpenAI. Podstawowy URL to https://api.orcarouter.ai/v1, a identyfikator modelu to "google/gemini-3.5-flash". Możesz go wywoływać za pomocą dowolnego SDK OpenAI lub bezpośrednich żądań HTTP, po prostu zmieniając podstawowy URL i nazwę modelu. Uwierzytelnianie odbywa się za pomocą klucza API dostarczanego przez OrcaRouter. API obsługuje standardowe endpointy do uzupełniania czatów, strumieniowanie oraz opcjonalne parametry, takie jak temperature, top_p i max_tokens. OrcaRouter nie dolicza żadnej marży do stawki dostawcy, więc płacisz dokładnie 1,50 USD za 1M tokenów wejściowych i 9,00 USD za 1M tokenów wyjściowych. Nie są naliczane żadne dodatkowe opłaty za bramkę.

Przykłady kodu

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Cennik

Wejście / 1M tokenów$1.50
Wyjście / 1M tokenów$9.00
Odczyt cache / 1M$0.150
Zapis cache / 1M$0.083
WalutaUSD

Wydajność

p50 TTFT
10.00 s
Prędkość wyjścia
10766 tok/s
p95 TTFT
10.00 s
Wskaźnik błędów
0.44%

Publiczne benchmarki

49.0
AA Coding
Lepszy niż 68% porównywanych modeli
47.0
AA Intelligence
Lepszy niż 58% porównywanych modeli
51.0
AA Math
Lepszy niż 27% porównywanych modeli
GPQA Diamond
45.0 index
MMLU-Pro
59.0 index
τ²-Bench
42.0 index
Źródło: artificialanalysis.ai

FAQ

Ile kosztuje Gemini 3.5 Flash na OrcaRouter?
Tokeny wejściowe kosztują 1,50 USD za 1 milion tokenów; tokeny wyjściowe kosztują 9,00 USD za 1 milion tokenów. OrcaRouter nalicza opłaty według stawki dostawcy z zerową marżą. Nie ma dodatkowych opłat.
Jaki jest rozmiar okna kontekstu modelu Gemini 3.5 Flash?
Obsługuje okno kontekstu o wielkości 1,048,576 tokenów (około 1 miliona tokenów). Obejmuje to zarówno tokeny wejściowe, jak i wyjściowe łącznie.
Jakie są główne zalety Gemini 3.5 Flash?
Jest zoptymalizowany pod kątem niskiego opóźnienia, wysokiej przepustowości i efektywności kosztowej. Obsługuje multimodalne dane wejściowe (tekst, obraz, wideo, plik, audio) oraz duże okno kontekstowe, co czyni go idealnym do zastosowań czasu rzeczywistego i przetwarzania długich dokumentów.
Jak Gemini 3.5 Flash wypada w porównaniu z Gemini 3.5 Pro?
Flash jest szybszy i tańszy, ale ma niższą wydajność w testach porównawczych w przypadku złożonych zadań wymagających rozumowania i matematyki. Pro jest dokładniejszy, ale wolniejszy i droższy. Flash jest lepszy do zastosowań o dużym natężeniu ruchu i wrażliwych na opóźnienia.
Jak przetwarzane są dane podczas korzystania z Gemini 3.5 Flash za pośrednictwem OrcaRouter?
OrcaRouter działa jako proxy i nie przechowuje twoich danych. Jednakże polityka Google dotycząca przetwarzania danych ma zastosowanie do bazowego modelu. OrcaRouter zaleca zapoznanie się z warunkami Google dotyczącymi przechowywania danych i prywatności.
Jak wywołać Gemini 3.5 Flash za pomocą kompatybilnego z OpenAI API?
Użyj bazowego URL https://api.orcarouter.ai/v1, modelu ID "google/gemini-3.5-flash", i przekaż klucz API OrcaRouter w nagłówku Authorization. API obsługuje standardowe odpowiedzi czatu i strumieniowanie.
Jaką długość wyjścia może generować Gemini 3.5 Flash?
Może wygenerować do 65 536 tokenów na odpowiedź. To znacznie więcej niż w przypadku wielu modeli, co pozwala na tworzenie długich treści, kodu lub rozszerzonego rozumowania.
Czy jest jakaś zniżka za powtarzające się lub buforowane tokeny?
Na podstawie przedstawionych faktów, OrcaRouter nie oferuje buforowania ani rabatów ilościowych. Każdy token jest rozliczany według standardowej stawki, niezależnie od ponownego użycia.

Osadź tę odznakę

Gemini 3.5 Flash$1.50/M in10000ms p50przez OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash w OrcaRouter" /> </a>
Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)