Google Gemini 3.1 Pro Preview Custom Tools – 1M kontekstu, 95.6 τ²-Bench, multimodalny przez OrcaRouter.
Google Gemini 3.1 Pro Preview Custom Tools to będący w fazie zapoznawczej duży model językowy opracowany przez firmę Google. Został zaprojektowany do zadań wymagających długiego wnioskowania, dużych kontekstów okien oraz integracji z narzędziami zewnętrznymi. Model akceptuje dane wejściowe w formacie tekstu, audio, obrazu, wideo i plików, co czyni go multimodalnym rozwiązaniem zarówno do rozumienia, jak i generowania treści. Za pośrednictwem OrcaRouter możesz wywołać model przy użyciu API kompatybilnego z OpenAI pod adresem bazowym URL https://api.orcarouter.ai/v1 z identyfikatorem modelu „google/gemini-3.1-pro-preview-customtools”. Zgodność ta usprawnia integrację dla zespołów już zaznajomionych z pakietem SDK OpenAI lub podobnymi klientami. Jako model w wersji zapoznawczej może mieć ograniczenia w dostępności lub wydajności w porównaniu do stabilnych wersji.
Ten model jest przeznaczony dla programistów, naukowców zajmujących się danymi oraz zespołów przedsiębiorstw, które muszą przetwarzać bardzo długie dokumenty (do 1 miliona tokenów) lub łączyć wiele modalności wejściowych (tekst, audio, obraz, wideo, pliki) w jednym etapie wnioskowania. Jest szczególnie cenny w zadaniach wymagających niestandardowego użycia narzędzi – tam, gdzie model musi decydować, kiedy i jak wywoływać zewnętrzne funkcje lub API. Zespoły pracujące nad badaniami, analizą prawną, przetwarzaniem mediów lub zaawansowaną automatyzacją docenią duży kontekst oraz silne wyniki benchmarkowe. Ponieważ jest to wersja podglądowa, może być idealna do prototypowania i ewaluacji, a nie do systemów produkcyjnych wymagających gwarantowanej dostępności lub niskiego opóźnienia.
Model oferuje okno kontekstu o wielkości 1 048 576 tokenów oraz maksymalny wynik 65 536 tokenów. Moduły wejściowe obejmują tekst, dźwięk, obraz, wideo i przesyłanie plików. Wynik porównawczy to 95,6 w teście τ²-Bench, który sprawdza rozumowanie przy użyciu narzędzi. Ceny wynoszą 4,00 USD za 1 milion tokenów wejściowych i 18,00 USD za 1 milion tokenów wyjściowych, z zerową marżą przy dostępie przez OrcaRouter. API jest zgodne z OpenAI, a identyfikator modelu to "google/gemini-3.1-pro-preview-customtools". Jako wersja zapoznawcza odzwierciedla najnowsze możliwości, ale może podlegać zmianom.
Gemini 3.1 Pro Preview Custom Tools akceptuje dane wejściowe w formacie tekstu, audio, obrazu, wideo i plików. Pozwala to na dołączenie nagrań dźwiękowych, zdjęć, klipów wideo i przesłanych dokumentów wraz z podpowiedziami tekstowymi w jednym żądaniu. Model może rozumować na podstawie tych modalności, aby generować wyniki tekstowe. Ta multimodalna zdolność umożliwia opisanie obrazu i zadanie pytania na jego temat, transkrypcję audio podczas wykonywania analizy lub połączenie wideo z instrukcją tekstową. Dokładne rozdzielczości, kodeki lub limity rozmiaru plików nie są podane w dostępnych faktach, ale model może natywnie przetwarzać różnorodne media.
Oznaczenie „Custom Tools” oznacza, że model jest zoptymalizowany do wywoływania zdefiniowanych przez użytkownika funkcji lub interfejsów API w ramach swojego procesu wnioskowania. W typowym przepływie pracy dostarczasz zestaw definicji funkcji (w tym nazwy, parametry i opisy), a model decyduje, kiedy je wywołać, aby zrealizować żądanie. Ta możliwość umożliwia autonomiczne przepływy pracy, takie jak wykonywanie zapytań do bazy danych, wysyłanie e-maila czy uruchamianie fragmentu kodu. Model może łączyć wiele wywołań narzędzi w sekwencje. Wysoki wynik τ²-Bench (95.6) wskazuje na silną wydajność w zadaniach wymagających planowania i orkiestracji narzędzi.
Model obsługuje okno kontekstu o wielkości 1,048,576 tokenów (co odpowiada w przybliżeniu 1 milionowi tokenów). Pozwala to na przekazywanie jako kontekstu całych książek, długich baz kodu, wieloetapowych rozmów lub obszernych logów. Maksymalna odpowiedź to 65,536 tokenów na żądanie. Te rozmiary należą do największych dostępnych w obecnym krajobrazie modeli. Duży kontekst jest przydatny w zadaniach takich jak podsumowywanie pełnego transkryptu, odpowiadanie na pytania na podstawie dużego zestawu dokumentów lub utrzymywanie bardzo długiej historii rozmowy bez obcinania.
Ponieważ Gemini 3.1 Pro Preview Custom Tools kosztuje 4,00 USD za 1 mln tokenów wejściowych i 18,00 USD za 1 mln tokenów wyjściowych, jest to oferta premium. W przypadku prostszych zadań – takich jak klasyfikacja krótkiego tekstu, podstawowe streszczanie lub rozmowa jednoetapowa – mniejszy, tańszy model może być bardziej opłacalny. Rozważ alternatywy od OrcaRouter, takie jak Gemini 1.5 Flash (niższy koszt, mniejsze opóźnienie) lub inne lekkie modele, jeśli nie potrzebujesz kontekstu o długości 1 mln tokenów, multimodalnego wejścia lub wydajności w testach narzędziowych. Używaj tego modelu, gdy złożoność zadania uzasadnia wyższy koszt na token.
Model osiągnął wynik 95.6 w benchmarku τ²-Bench (τ²-Bench). Ten benchmark ocenia zdolność modelu do rozumowania przy użyciu narzędzi: planowania i wykonywania sekwencji wywołań funkcji w celu realizacji realistycznego zadania. Wysoki wynik sugeruje silne kompetencje w zakresie autonomicznego wykonywania zadań i podejmowania decyzji. τ²-Bench to nowszy benchmark skupiający się na złożoności rzeczywistych scenariuszy. Wynik 95.6 jest uznawany za bardzo wysoki, choć należy pamiętać, że żaden pojedynczy benchmark nie oddaje w pełni wszystkich aspektów jakości modelu. Model może wykazywać inną wydajność w innych benchmarkach niewymienionych tutaj.
Na podstawie wyniku τ²-Bench model doskonale radzi sobie z zadaniami wymagającymi strukturalnego rozumowania i orkiestracji narzędzi. Obejmuje to wieloetapowe wyszukiwanie, transformację danych oraz wywoływanie API. Duże okno kontekstu pozwala mu również na obsługę bardzo długich instrukcji lub danych zewnętrznych bez utraty spójności. Zdolność do przetwarzania wejścia multimodalnego to kolejna zaleta, umożliwiająca wnioskowanie na podstawie różnych typów mediów. W przypadkach użycia takich jak analiza klipu wideo i odpowiadanie na pytania na jego temat, czy przetwarzanie pliku audio wraz z zapytaniem tekstowym, model ten jest dobrze pozycjonowany w porównaniu z alternatywami wyłącznie tekstowymi.
Żaden benchmark ani model nie jest doskonały. Wynik τ²-Bench wynoszący 95,6 nie gwarantuje takiej samej wydajności w każdym rzeczywistym zadaniu, zwłaszcza tych spoza zakresu benchmarku. Model może osiągać gorsze wyniki w zadaniach wymagających bardzo szczegółowej wiedzy dziedzinowej lub w ocenach zorientowanych na bezpieczeństwo, które nie są objęte przez τ²-Bench. Jako model zapowiedziowy może mieć większe opóźnienie lub niższą niezawodność niż w pełni wydany model. Dostępne fakty nie obejmują danych o opóźnieniach, dlatego należy przetestować go na własnych obciążeniach. Ponadto duże okno kontekstowe może zwiększyć czas i koszt przetwarzania, a nie wszystkie zadania korzystają z pełnej pojemności miliona tokenów.
Dokładne wartości opóźnień nie są podane w dostępnych faktach dla Gemini 3.1 Pro Preview Custom Tools. Ogólnie rzecz biorąc, modele z bardzo dużym oknem kontekstowym (ponad 1M tokenów) mogą dłużej przetwarzać żądania, szczególnie te wykorzystujące pełny kontekst. Opóźnienie zależy również od złożoności żądania, liczby wywołań narzędzi oraz bieżącego obciążenia serwera. OrcaRouter może oferować odpowiedzi strumieniowe, aby skrócić czas do pierwszego tokena. W przypadku aplikacji czasu rzeczywistego warto porównać wydajność z mniejszymi modelami. Rozważ przeprowadzenie własnych testów opóźnienia z typowymi promptami, aby sprawdzić, czy szybkość spełnia Twoje wymagania.
Cennik Gemini 3.1 Pro Preview Custom Tools wynosi 4,00 USD za 1 milion tokenów wejściowych i 18,00 USD za 1 milion tokenów wyjściowych. Stawki te są naliczane według stawki dostawcy z zerową marżą w przypadku dostępu przez OrcaRouter. Oznacza to, że cena, którą widzisz, jest ceną naliczaną przez Google, bez żadnych dodatkowych opłat ze strony OrcaRouter. Tokeny wejściowe obejmują wszystkie tokeny w promptie (tokeny tekstu, tokeny obrazu, tokeny audio itp.). Tokeny wyjściowe to wygenerowana odpowiedź. Maksymalna liczba tokenów wyjściowych modelu wynosi 65 536, więc pojedyncze żądanie może kosztować do 65 536 / 1 000 000 * 18,00 = około 1,18 USD za tokeny wyjściowe, plus koszty tokenów wejściowych.
"Zero markup" oznacza, że OrcaRouter przekazuje dokładny koszt za token od dostawcy (Google) do Ciebie, bez żadnych dodatkowych opłat. Płacisz 4,00 USD za 1 milion tokenów wejściowych i 18,00 USD za 1 milion tokenów wyjściowych – taka sama stawka, jak gdybyś korzystał bezpośrednio z API Google. OrcaRouter może mieć osobne opłaty abonamentowe lub za korzystanie z usługi bramy, ale cena za token modelu nie jest zawyżona. Ta struktura cenowa jest przejrzysta i pomaga dokładnie planować budżet. Zawsze sprawdzaj aktualne warunki OrcaRouter w celu uzyskania informacji o dodatkowych opłatach.
Wysoki koszt na token oznacza, że należy dokładnie oszacować swoje zużycie. W przypadku zapytań korzystających z pełnego okna kontekstowego 1M koszty wejściowe mogą sięgać 4,00 USD za żądanie. Jeśli Twoje zadanie można wykonać przy mniejszym kontekście, rozważ jego skrócenie lub użycie tańszego modelu. Buforowanie nie jest wspomniane w dostępnych faktach; jeśli OrcaRouter oferuje buforowanie zapytań, mogłoby ono obniżyć koszty dla powtarzających się danych wejściowych. Ponieważ model jest wersją zapoznawczą, ceny mogą ulec zmianie po wydaniu stabilnej wersji. Oceń typową liczbę tokenów dla swojego obciążenia, aby zdecydować, czy koszt jest uzasadniony.
Dostęp do modelu uzyskujesz poprzez API OrcaRouter zgodne z API OpenAI. Ustaw swój bazowy URL na `https://api.orcarouter.ai/v1` i użyj identyfikatora modelu `google/gemini-3.1-pro-preview-customtools`. API akceptuje standardowe formaty żądań w stylu OpenAI. Przykład użycia biblioteki openai w Pythonie: ``` import openai client = openai.OpenAI(base_url="https://api.orcarouter.ai/v1", api_key="YOUR_ORCAROUTER_KEY") response = client.chat.completions.create( model="google/gemini-3.1-pro-preview-customtools", messages=[{"role": "user", "content": "Hello"}] ) ``` Potrzebujesz ważnego klucza API OrcaRouter. Uwierzytelnianie odbywa się przez nagłówek `Authorization`.
Ponieważ API jest kompatybilne z OpenAI, możesz używać standardowych parametrów, takich jak `temperature`, `top_p`, `max_tokens`, `stop`, `frequency_penalty`, `presence_penalty` oraz `stream`. W przypadku żądań multimodalnych możesz dołączać obrazy, audio, wideo lub pliki w treści wiadomości, używając formatu tablicy. Do korzystania z narzędzi zdefiniuj funkcje w parametrze `tools` jako listę obiektów JSON. Model może zwrócić `tool_calls` w odpowiedzi. Parametry specyficzne dla własnego API Google (takie jak `safetySettings`) mogą być dostępne lub nie; sprawdź dokumentację OrcaRouter, aby uzyskać szczegóły. Dokładne wsparcie dla parametrów może się różnić w przypadku modeli w wersji podglądowej.
Migracja z standardowego API OpenAI jest prosta. Zmień `base_url` na `https://api.orcarouter.ai/v1` i zaktualizuj parametr `model` na `google/gemini-3.1-pro-preview-customtools`. Zastąp swój klucz API kluczem OrcaRouter. Większość kodu używającego `openai.ChatCompletion.create` lub nowszego `client.chat.completions.create` będzie działać z minimalnymi zmianami. Jeśli używasz wywołań narzędzi (tool calls), format jest identyczny jak w OpenAI. Należy jednak pamiętać, że ten model ma inny tokenizer i może generować inne wyniki dla tego samego promptu. Przed przełączeniem dokładnie przetestuj.
OrcaRouter używa uwierzytelniania za pomocą klucza API. Umieść swój klucz w nagłówku żądania jako `Authorization: Bearer YOUR_ORCAROUTER_API_KEY`. Klucz uzyskujesz rejestrując się w OrcaRouter. Należy zachować go w tajemnicy i nie ujawniać w kodzie po stronie klienta. Dokładna metoda uwierzytelniania może się różnić; zawsze odwołuj się do aktualnej dokumentacji API OrcaRouter. Niektóre punkty końcowe mogą obsługiwać dodatkowe metody uwierzytelniania, ale punkt końcowy zgodny z OpenAI używa standardowego wzorca tokena Bearer. Upewnij się, że Twoje żądania są wysyłane przez HTTPS.
Gemini 1.5 Pro obsługuje również kontekst o wielkości 1 miliona tokenów oraz wprowadzanie multimodalne, ale wersja 3.1 Pro Preview Custom Tools osiągnęła wynik 95,6 w τ²-Bench, co stanowi znaczącą poprawę w stosunku do serii 1.5 (dokładne liczby dla 1.5 nie są podane). Optymalizacja „Custom Tools" jest kluczowym wyróżnikiem, wskazującym na lepszą wydajność w zadaniach związanych z użyciem narzędzi. Cennik modelu w wersji zapoznawczej jest wyższy: Gemini 1.5 Pro jest zazwyczaj tańszy. Jeśli nie potrzebujesz najnowszej wydajności w użyciu narzędzi, Gemini 1.5 Pro może być bardziej opłacalnym wyborem. Ponieważ Gemini 3.1 Pro jest wersją zapoznawczą, może oferować mniejszą stabilność lub gwarancję dostępności w porównaniu do stabilnej wersji Gemini 1.5 Pro.
GPT‑4o obsługuje również wejście multimodalne i użycie narzędzi, ale jego okno kontekstowe wynosi zazwyczaj 128k tokenów – znacznie mniej niż 1M tokenów tego modelu. Wynik τ²-Bench dla GPT‑4o nie jest podany w dostępnych faktach, więc bezpośrednie porównanie nie jest możliwe. Ogólnie rzecz biorąc, Gemini 3.1 Pro Preview Custom Tools oferuje znacznie większe okno kontekstowe, co czyni go bardziej odpowiednim do zadań z długimi dokumentami. GPT‑4o może mieć lepszą wydajność w niektórych benchmarkach językowych lub szersze wsparcie ekosystemu. Ceny GPT‑4o są również inne; porównaj koszty na token, ale zwróć uwagę, że koszt wyjściowy tego modelu ($18/M) jest stosunkowo wysoki.
Claude 3 Opus obsługuje kontekstowe okno 200k tokenów, znacznie mniejsze niż 1M w Gemini 3.1 Pro Preview. Benchmarki takie jak τ²-Bench zwykle nie są raportowane dla Claude'a, więc bezpośrednie porównania są spekulacyjne. Claude jest znany z silnego rozumowania i podążania za instrukcjami. Wybór między nimi zależy od potrzeby 1M kontekstu i multimodalnych danych wejściowych, w porównaniu z konkretnymi mocnymi stronami w zakresie bezpieczeństwa, stylu pisania lub ekosystemu. Jeśli Twój przypadek użycia wymaga przetwarzania bardzo dużych dokumentów lub wielu rodzajów mediów, większe okno kontekstowe i wsparcie multimodalne modelu Gemini są zaletami. Koszt i dostępność przez OrcaRouter również są czynnikami.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview-customtools",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| Wejście / 1M tokenów | $4.00 |
| Wyjście / 1M tokenów | $18.00 |
| Odczyt cache / 1M | $0.400 |
| Waluta | USD |