Gemini 3.1 Pro Preview

google/gemini-3.1-pro-preview
ФлагманРекомендуем
от Google · 2026-02-19

Google Gemini 3.1 Pro Preview: флагманская мультимодальная модель с контекстным окном 1M и оценкой 95.6 τ²-Bench, доступная через OrcaRouter API.

конт.1.05M токенов
Вводaudio + file + image + text + video
Выводtext
p50 TTFT5.71 s
ВХОД$2.00/ 1M токенов
ВЫХОД$12.00/ 1M токенов
p50 TTFT5.71 s7 д
p95 TTFT10.00 s7 д
ТРАФИК5.1Mтокенов / 7 д

Детали модели

Что такое Google Gemini 3.1 Pro Preview?

Google Gemini 3.1 Pro Preview — это флагманская модель от Google, представленная в предварительной версии. Это мультимодальная модель, способная обрабатывать текстовые, графические, видео, аудио и файловые данные. Модель относится к флагманскому уровню, что означает ее предназначение для высоконагруженных сложных приложений, где критически важны производительность и емкость. Как предварительная версия, она может иметь ограничения по стабильности или доступности по сравнению со стабильными релизами. Доступ предоставляется через API OrcaRouter.

Кому следует использовать эту модель?

Эта модель предназначена для разработчиков и предприятий, которым требуется обрабатывать большие контекстные окна до 1 048 576 токенов и необходима поддержка мультимодального понимания. Примеры использования включают анализ длинных документов, модерацию видео, продвинутые чат-боты с памятью о всем диалоге и извлечение сложных данных из смешанных медиа. Статус предварительной версии делает её подходящей для экспериментов и ранней интеграции, но для промышленного развёртывания следует оценить стабильность. Она также идеально подходит командам, уже использующим OpenAI-совместимый API OrcaRouter, которые хотят протестировать новейшие флагманские возможности Google.

Каковы ключевые спецификации?

Модель поддерживает контекстное окно в 1 048 576 токенов (ввод) и максимальный вывод в 65 536 токенов. Она принимает ввод в нескольких модальностях: аудио, файлы (например, PDF, файлы кода), изображения, текст и видео. Основная оценка теста — 95.6 на τ²-Bench, метрике, измеряющей производительность выполнения задач. Модель классифицируется как флагманский уровень своим провайдером, Google. Доступ к ней осуществляется через API OrcaRouter по базовому URL https://api.orcarouter.ai/v1 с идентификатором модели "google/gemini-3.1-pro-preview".

Как это соотносится с другими предварительными версиями Gemini?

Как предварительная версия Gemini 3.1 Pro, эта модель находится на вершине текущей линейки Google среди предварительных релизов. Она предлагает значительно больший контекстный буфер (1M токенов) и более высокие лимиты вывода (65K токенов) по сравнению с более ранними моделями Gemini 2.0 или предварительными версиями Gemini 3.0. Показатель τ²-Bench 95.6 обеспечивает количественный эталон для производительности, ориентированной на задачи. По сравнению с другими предварительными моделями от Google, эта нацелена на самые требовательные сценарии использования, где требуются как широта контекста, так и глубина рассуждений.

Примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Цены

УровеньВвод / 1M токеновВывод / 1M токеновЧтение кэша / 1MЗапись кэша / 1M
200K$2.00$12.00$0.200$0.375
$4.00$18.00$0.400$0.375
Уровень выбирается по количеству входных токенов запроса

Производительность

p50 TTFT
5.71 s
Скорость вывода
429 tok/s
p95 TTFT
10.00 s
Частота ошибок
0%

Публичные тесты

55.5
AA Coding
Лучше, чем 75% сравниваемых моделей
57.2
AA Intelligence
Лучше, чем 80% сравниваемых моделей
GPQA Diamond
94.1
Humanity's Last Exam
44.7
IFBench
77.1
Long-Context Recall
72.7
SciCode
58.9
TerminalBench Hard
53.8
τ²-Bench
95.6
Источник: artificialanalysis.ai

Больше от Google

FAQ

Какова стоимость использования Gemini 3.1 Pro Preview на OrcaRouter?
Детали ценообразования не указаны в доступных фактах. Как флагманская модель, она обычно имеет более высокую цену за токен по сравнению с меньшими моделями. Затраты зависят от использования входных и выходных токенов. Проверьте текущую страницу цен OrcaRouter для точных тарифов.
Какой размер контекстного окна?
Модель поддерживает контекстное окно размером 1,048,576 токенов (входных). Это означает, что вы можете отправлять очень длинные документы, код или историю разговора в одном запросе. Максимальный объем вывода составляет 65,536 токенов.
Каковы основные сильные стороны этой модели?
Его основные преимущества включают огромное контекстное окно (1 млн токенов), высокий лимит вывода (65 тыс. токенов), мультимодальный ввод (аудио, файлы, изображения, текст, видео) и высокий показатель τ²-Bench 95,6, что указывает на высокую точность выполнения агентных задач.
Как Gemini 3.1 Pro Preview соотносится с моделями Gemini 2.0?
Он предлагает гораздо большее контекстное окно (1M против до 32K) и более высокий лимит вывода (65K против 8K). Он также поддерживает больше входных модальностей. Однако это предварительная версия, которая может быть менее стабильной, чем стабильные релизы Gemini 2.0.
Обеспечивает ли OrcaRouter конфиденциальность данных для запросов?
Политики обработки данных не указаны в предоставленных фактах. Пользователям следует ознакомиться с документацией OrcaRouter по обработке данных и конфиденциальности, чтобы понять, как обрабатываются входные и выходные данные.
Как вызвать эту модель через API, совместимый с OpenAI?
Используйте базовый URL https://api.orcarouter.ai/v1 и установите ID модели на "google/gemini-3.1-pro-preview". API следует стандартному формату чат-завершений OpenAI. Для аутентификации требуется ключ API от OrcaRouter.
Что такое показатель τ²-Bench и почему он важен?
Модель набрала 95.6 на τ²-Bench, эталонном тесте, измеряющем производительность выполнения задач. Эта количественная метрика отражает способность модели точно справляться со сложными многошаговыми задачами.
Могу ли я использовать эту модель в production?
Будучи предварительной моделью, она предназначена для тестирования и экспериментов. Она может иметь более низкие лимиты скорости, меньшую надежность и постоянные изменения. Для производства рассмотрите возможность использования стабильной, непредварительной модели.
Какие модальности ввода поддерживаются?
Модель поддерживает аудио, файлы (например, PDF, файлы кода), изображения, текст и видео в качестве входных данных. Все они могут быть включены в один запрос для кросс-модального анализа.
Модель доступна для потоковых ответов?
Имеющиеся факты не указывают на поддержку потоковой передачи. API OrcaRouter, вероятно, поддерживает потоковую передачу для совместимых моделей, но для этой предварительной версии ознакомьтесь с документацией о доступности параметра stream.

Встроить значок

Google: Gemini 3.1 Pro Preview$2.00/M in5707ms p50через OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview в OrcaRouter" /> </a>
Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)