Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

przez google · 2026-05-23

Wydajny model multimodalny Google z kontekstem 1M, wysoką wydajnością i opłacalnymi cenami za pośrednictwem OrcaRouter.

Punkty końcowe:/v1/chat/completions /v1beta/models/{model}:generateContent

kont.1.05M tokenów

Wejścietext + image + video + file + audio

Wyjścietext

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

WEJŚCIE$1.50/ 1M tokenów

WYJŚCIE$9.00/ 1M tokenów

p50 TTFT10.00 s7 d

p95 TTFT10.00 s7 d

RUCH4.5Mtokenów / 7 d

Uzyskaj API Gemini 3.5 Flash →▶ Wypróbuj w Playground </> Użyj przez API

Czym jest Gemini 3.5 Flash?

Gemini 3.5 Flash to duży model językowy opracowany przez Google, dostrojony pod kątem szybkości i wydajności. Należy do rodziny Gemini i jest zaprojektowany do obsługi multimodalnych danych wejściowych – tekstu, obrazu, wideo, plików i audio – przy jednoczesnym dostarczaniu szybkich odpowiedzi. Model obsługuje okno kontekstowe o pojemności 1 048 576 tokenów, co pozwala mu przetwarzać bardzo długie sekwencje, takie jak całe książki, godzinne filmy wideo czy rozległe repozytoria kodu. Maksymalna długość odpowiedzi wynosząca 65 536 tokenów umożliwia generowanie długich treści, w tym pełnych raportów lub rozbudowanych plików kodu. Gemini 3.5 Flash jest dostępny za pośrednictwem zgodnego z OpenAI API OrcaRouter, co oznacza, że można zintegrować go z istniejącymi aplikacjami przy minimalnych zmianach w kodzie.

Kto powinien używać Gemini 3.5 Flash?

Gemini 3.5 Flash jest idealny dla programistów i organizacji, które potrzebują równowagi między wysoką przepustowością, niskim opóźnieniem i kosztami. Szczególnie dobrze sprawdza się w środowiskach produkcyjnych, gdzie szybkość wnioskowania ma znaczenie, takich jak chatboty czasu rzeczywistego, potoki moderowania treści czy zautomatyzowana obsługa klienta. Rozbudowane okno kontekstowe pomaga użytkownikom, którzy muszą analizować duże zbiory danych, długie dokumenty lub obszerne historie rozmów bez konieczności dzielenia ich na fragmenty. Ponadto zespoły tworzące aplikacje multimodalne – takie jak opisywanie obrazów, podsumowywanie wideo czy transkrypcja audio – mogą skorzystać z natywnej obsługi wielu typów danych wejściowych. Jeśli Twoje zadanie wymaga niezwykle wysokich zdolności rozumowania lub złożonej matematyki, rozważ użycie wydajniejszego, ale wolniejszego modelu.

Jakie modalności wejściowe obsługuje Gemini 3.5 Flash?

Gemini 3.5 Flash akceptuje pięć modalności wejściowych: tekst, obraz, wideo, plik i dźwięk. Wejścia tekstowe mogą być zwykłymi ciągami znaków lub ustrukturyzowanymi wiadomościami. Obrazy mogą być przekazywane jako dane zakodowane w base64 lub adresy URL; model może interpretować treści wizualne, takie jak wykresy, diagramy czy fotografie. Wejścia wideo są obsługiwane jako sekwencje klatek lub skompresowane pliki wideo, co pozwala modelowi analizować ruch i zmiany czasowe. Wejścia plikowe obejmują popularne formaty, takie jak PDF, DOCX lub pliki z kodem; model może wyodrębnić i analizować ich zawartość. Wejścia dźwiękowe mogą być surowe lub skompresowane (np. MP3, WAV), umożliwiając transkrypcję mowy i analizę dźwięku. Wszystkie modalności mogą być łączone w jednym żądaniu, co czyni Gemini 3.5 Flash wszechstronnym narzędziem do zadań multimodalnych.

Jak uzyskać dostęp do Gemini 3.5 Flash przez OrcaRouter?

OrcaRouter udostępnia Gemini 3.5 Flash poprzez swoje API kompatybilne z OpenAI. Podstawowy URL to https://api.orcarouter.ai/v1, a identyfikator modelu to "google/gemini-3.5-flash". Możesz go wywoływać za pomocą dowolnego SDK OpenAI lub bezpośrednich żądań HTTP, po prostu zmieniając podstawowy URL i nazwę modelu. Uwierzytelnianie odbywa się za pomocą klucza API dostarczanego przez OrcaRouter. API obsługuje standardowe endpointy do uzupełniania czatów, strumieniowanie oraz opcjonalne parametry, takie jak temperature, top_p i max_tokens. OrcaRouter nie dolicza żadnej marży do stawki dostawcy, więc płacisz dokładnie 1,50 USD za 1M tokenów wejściowych i 9,00 USD za 1M tokenów wyjściowych. Nie są naliczane żadne dodatkowe opłaty za bramkę.

Przykłady kodu

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Cennik

Wejście / 1M tokenów	$1.50
Wyjście / 1M tokenów	$9.00
Odczyt cache / 1M	$0.150
Zapis cache / 1M	$0.083
Waluta	USD

Wydajność

ostatnie 7 dni

p50 TTFT

10.00 s

Prędkość wyjścia

10766 tok/s

p95 TTFT

10.00 s

Wskaźnik błędów

0.44%

Publiczne benchmarki

Ostatnia ocena 2026-06-25

49.0

AA Coding

Lepszy niż 68% porównywanych modeli

47.0

AA Intelligence

Lepszy niż 58% porównywanych modeli

51.0

AA Math

Lepszy niż 27% porównywanych modeli

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

Źródło: artificialanalysis.ai

Więcej od google

Zobacz wszystkie modele google →

Gemini 3.1 Pro PreviewFlagowy

google/gemini-3.1-pro-preview

$2.00 wejście · $12.00 wyjście / 1M

1.05M kont.· jakość 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 wejście · $18.00 wyjście / 1M

1.05M kont.· jakość 10/10

Gemini 3 Flash PreviewNajtańszy

google/gemini-3-flash-preview

$0.50 wejście · $3.00 wyjście / 1M

1.05M kont.· jakość 9/10

FAQ

Ile kosztuje Gemini 3.5 Flash na OrcaRouter?

Tokeny wejściowe kosztują 1,50 USD za 1 milion tokenów; tokeny wyjściowe kosztują 9,00 USD za 1 milion tokenów. OrcaRouter nalicza opłaty według stawki dostawcy z zerową marżą. Nie ma dodatkowych opłat.

Jaki jest rozmiar okna kontekstu modelu Gemini 3.5 Flash?

Obsługuje okno kontekstu o wielkości 1,048,576 tokenów (około 1 miliona tokenów). Obejmuje to zarówno tokeny wejściowe, jak i wyjściowe łącznie.

Jakie są główne zalety Gemini 3.5 Flash?

Jest zoptymalizowany pod kątem niskiego opóźnienia, wysokiej przepustowości i efektywności kosztowej. Obsługuje multimodalne dane wejściowe (tekst, obraz, wideo, plik, audio) oraz duże okno kontekstowe, co czyni go idealnym do zastosowań czasu rzeczywistego i przetwarzania długich dokumentów.

Jak Gemini 3.5 Flash wypada w porównaniu z Gemini 3.5 Pro?

Flash jest szybszy i tańszy, ale ma niższą wydajność w testach porównawczych w przypadku złożonych zadań wymagających rozumowania i matematyki. Pro jest dokładniejszy, ale wolniejszy i droższy. Flash jest lepszy do zastosowań o dużym natężeniu ruchu i wrażliwych na opóźnienia.

Jak przetwarzane są dane podczas korzystania z Gemini 3.5 Flash za pośrednictwem OrcaRouter?

OrcaRouter działa jako proxy i nie przechowuje twoich danych. Jednakże polityka Google dotycząca przetwarzania danych ma zastosowanie do bazowego modelu. OrcaRouter zaleca zapoznanie się z warunkami Google dotyczącymi przechowywania danych i prywatności.

Jak wywołać Gemini 3.5 Flash za pomocą kompatybilnego z OpenAI API?

Użyj bazowego URL https://api.orcarouter.ai/v1, modelu ID "google/gemini-3.5-flash", i przekaż klucz API OrcaRouter w nagłówku Authorization. API obsługuje standardowe odpowiedzi czatu i strumieniowanie.

Jaką długość wyjścia może generować Gemini 3.5 Flash?

Może wygenerować do 65 536 tokenów na odpowiedź. To znacznie więcej niż w przypadku wielu modeli, co pozwala na tworzenie długich treści, kodu lub rozszerzonego rozumowania.

Czy jest jakaś zniżka za powtarzające się lub buforowane tokeny?

Na podstawie przedstawionych faktów, OrcaRouter nie oferuje buforowania ani rabatów ilościowych. Każdy token jest rozliczany według standardowej stawki, niezależnie od ponownego użycia.

Osadź tę odznakę

Wklej do swojego bloga

Gemini 3.5 Flash•$1.50/M in•10000ms p50•przez OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash w OrcaRouter" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

Czym jest Gemini 3.5 Flash?

Kto powinien używać Gemini 3.5 Flash?

Jakie modalności wejściowe obsługuje Gemini 3.5 Flash?

Jak uzyskać dostęp do Gemini 3.5 Flash przez OrcaRouter?

Do jakich zadań najlepiej nadaje się Gemini 3.5 Flash?

Kiedy powinieneś wybrać tańszy model zamiast Gemini 3.5 Flash?

Tak, Gemini 3.5 Flash obsługuje przesyłanie strumieniowe i interakcje w czasie rzeczywistym.

Jakie są najlepsze praktyki korzystania z okna kontekstowego Gemini 3.5 Flash?

Jakie są znane mocne strony Gemini 3.5 Flash?

Jakie są szczere ograniczenia Gemini 3.5 Flash?

Jak opóźnienie wypada w porównaniu z innymi modelami?

Jaka jest jakość wyników modelu dla kodu i danych strukturalnych?

Jak jest wyceniany Gemini 3.5 Flash na OrcaRouter?

Jakie są kompromisy kosztowe pomiędzy tokenami wejściowymi a wyjściowymi?

Czy OrcaRouter oferuje jakieś funkcje buforowania lub zniżek?

Jak koszty mają się do innych modeli na OrcaRouter?

Jak wywołać Gemini 3.5 Flash przez API OrcaRoutera?

Jakie parametry są dostępne dla Gemini 3.5 Flash?

Czy mogę migrować z Google AI lub Vertex AI API do OrcaRouter?

Jakiego obsługiwania błędów powinienem się spodziewać, korzystając z API?

Jak Gemini 3.5 Flash wypada w porównaniu z Gemini 3.5 Pro?

Jak Gemini 3.5 Flash wypada w porównaniu z GPT-4o Mini?

Jak Gemini 3.5 Flash wypada w porównaniu z Claude 3 Haiku?

Jaka jest główna zaleta Gemini 3.5 Flash w porównaniu z modelami open-source?

Przykłady kodu

Cennik

Wydajność

Publiczne benchmarki

Więcej od google

FAQ

Osadź tę odznakę

Gemini 3.5 Flash

Szczegóły modelu

Czym jest Gemini 3.5 Flash?

Kto powinien używać Gemini 3.5 Flash?

Jakie modalności wejściowe obsługuje Gemini 3.5 Flash?

Jak uzyskać dostęp do Gemini 3.5 Flash przez OrcaRouter?

Do jakich zadań najlepiej nadaje się Gemini 3.5 Flash?

Kiedy powinieneś wybrać tańszy model zamiast Gemini 3.5 Flash?

Tak, Gemini 3.5 Flash obsługuje przesyłanie strumieniowe i interakcje w czasie rzeczywistym.

Jakie są najlepsze praktyki korzystania z okna kontekstowego Gemini 3.5 Flash?

Jakie są znane mocne strony Gemini 3.5 Flash?

Jakie są szczere ograniczenia Gemini 3.5 Flash?

Jak opóźnienie wypada w porównaniu z innymi modelami?

Jaka jest jakość wyników modelu dla kodu i danych strukturalnych?

Jak jest wyceniany Gemini 3.5 Flash na OrcaRouter?

Jakie są kompromisy kosztowe pomiędzy tokenami wejściowymi a wyjściowymi?

Czy OrcaRouter oferuje jakieś funkcje buforowania lub zniżek?

Jak koszty mają się do innych modeli na OrcaRouter?

Jak wywołać Gemini 3.5 Flash przez API OrcaRoutera?

Jakie parametry są dostępne dla Gemini 3.5 Flash?

Czy mogę migrować z Google AI lub Vertex AI API do OrcaRouter?

Jakiego obsługiwania błędów powinienem się spodziewać, korzystając z API?

Jak Gemini 3.5 Flash wypada w porównaniu z Gemini 3.5 Pro?

Jak Gemini 3.5 Flash wypada w porównaniu z GPT-4o Mini?

Jak Gemini 3.5 Flash wypada w porównaniu z Claude 3 Haiku?

Jaka jest główna zaleta Gemini 3.5 Flash w porównaniu z modelami open-source?

Przykłady kodu

Cennik

Wydajność

Publiczne benchmarki

Więcej od google

FAQ

Osadź tę odznakę