Google Gemini 3.1 Pro Preview Custom Tools – 1M контекст, 95.6 τ²-Bench, мультимодальный через OrcaRouter.
Google Gemini 3.1 Pro Preview Custom Tools — это крупная языковая модель на стадии предварительного доступа, разработанная компанией Google. Она предназначена для задач, требующих длительных рассуждений, больших контекстных окон и интеграции с внешними инструментами. Модель принимает входные данные в форматах текста, аудио, изображений, видео и файлов, что делает её мультимодальным решением как для понимания, так и для генерации контента. Через OrcaRouter вы можете вызывать модель, используя совместимый с OpenAI API, по базовому URL https://api.orcarouter.ai/v1 с идентификатором модели «google/gemini-3.1-pro-preview-customtools». Такая совместимость упрощает интеграцию для команд, уже знакомых с SDK OpenAI или аналогичными клиентами. Будучи предварительной моделью, она может иметь ограничения по доступности или производительности по сравнению со стабильными релизами.
Эта модель подходит для разработчиков, специалистов по данным и корпоративных команд, которым необходимо обрабатывать очень длинные документы (до 1 миллиона токенов) или объединять несколько входных модальностей (текст, аудио, изображение, видео, файлы) в одном шаге рассуждения. Она особенно ценна для задач, связанных с использованием пользовательских инструментов — когда модель должна решать, когда и как вызывать внешние функции или API. Команды, работающие в области исследований, юридического анализа, обработки медиа или продвинутой автоматизации, найдут полезным большой контекст и высокую производительность на эталонных тестах. Поскольку это предварительная версия, она может идеально подходить для прототипирования и оценки, а не для продуктовых систем, требующих гарантированной бесперебойной работы или низкой задержки.
Модель предлагает контекстное окно в 1 048 576 токенов и максимальный вывод в 65 536 токенов. Входные модальности включают текст, аудио, изображения, видео и загрузку файлов. Ключевой показатель бенчмарка — 95,6 в τ²-Bench, тесте на рассуждение с использованием инструментов. Цены: $4,00 за 1 млн входных токенов и $18,00 за 1 млн выходных токенов, без наценки при доступе через OrcaRouter. API совместимо с OpenAI, идентификатор модели — "google/gemini-3.1-pro-preview-customtools". Будучи предварительной версией, она отражает последние возможности, но может быть изменена.
Gemini 3.1 Pro Preview Custom Tools принимает входные данные в форматах текста, аудио, изображений, видео и файлов. Это позволяет включать аудиозаписи, фотографии, видеоклипы и загруженные документы вместе с текстовыми запросами в одном запросе. Модель может рассуждать на основе этих модальностей, чтобы создавать текстовый вывод. Эта мультимодальная возможность позволяет описать изображение и задать вопрос о нем, транскрибировать аудио, выполняя анализ, или объединить видео с текстовой инструкцией. Точные ограничения по разрешению, кодеку или размеру файла не указаны в доступных фактах, но модель может изначально обрабатывать различные медиа.
Обозначение «Custom Tools» означает, что модель оптимизирована для вызова определённых пользователем функций или API как части своих рассуждений. В типичном рабочем процессе вы предоставляете набор определений функций (включая названия, параметры и описания), а модель решает, когда их вызывать для выполнения запроса. Эта возможность позволяет реализовать автономные рабочие процессы, такие как запрос к базе данных, отправка электронного письма или выполнение фрагмента кода. Модель может объединять несколько вызовов инструментов в цепочку. Высокий показатель τ²-Bench (95.6) свидетельствует о высокой производительности в задачах, требующих планирования и координации инструментов.
Модель поддерживает окно контекста размером 1 048 576 токенов (примерно эквивалентно 1 миллиону токенов). Это позволяет передавать в качестве контекста целые книги, длинные кодовые базы, многоходовые диалоги или обширные журналы. Максимальный выход составляет 65 536 токенов за один запрос. Эти размеры являются одними из самых больших в текущем ландшафте моделей. Большой контекст полезен для таких задач, как суммаризация полной расшифровки, ответы на вопросы по большому набору документов или поддержание очень длинной истории разговора без усечения.
Поскольку Gemini 3.1 Pro Preview Custom Tools стоит $4.00 за 1M входных токенов и $18.00 за 1M выходных токенов, это премиум-предложение. Для более простых задач — таких как классификация коротких текстов, базовое реферирование или одношаговый чат — меньшая и более дешевая модель может быть более экономически эффективной. Рассмотрите альтернативы от OrcaRouter, такие как Gemini 1.5 Flash (более низкая стоимость, меньшая задержка) или другие легковесные модели, если вам не нужен контекстный окно в 1M, мультимодальный ввод или производительность тестов использования инструментов. Используйте эту модель, когда сложность задачи оправдывает более высокую стоимость за токен.
Модель достигла выдающегося показателя 95.6 на τ²-Bench (τ²-Bench). Этот бенчмарк оценивает способность модели к рассуждению при использовании инструментов: планированию и выполнению последовательностей вызовов функций для выполнения реалистичной задачи. Высокий показатель свидетельствует о сильной компетенции в автономном выполнении задач и принятии решений. τ²-Bench — это более новый бенчмарк, который фокусируется на сложности реальных сценариев. Показатель 95.6 считается очень высоким, хотя следует отметить, что ни один отдельный бенчмарк не может полностью охватить все аспекты качества модели. Модель может иметь другую производительность на других бенчмарках, не перечисленных здесь.
Основываясь на результате τ²-Bench, модель превосходно справляется с задачами, требующими структурированного рассуждения и оркестровки инструментов. Это включает многоэтапный поиск, преобразование данных и вызовы API. Большое контекстное окно также позволяет ей обрабатывать очень длинные инструкции или внешние данные без потери связности. Возможность многомодального ввода — еще одно преимущество, позволяющее модели рассуждать о различных типах носителей. Для таких случаев использования, как анализ видеоклипа и ответы на вопросы о нем, или обработка аудиофайла вместе с текстовым запросом, эта модель имеет преимущество по сравнению с текстовыми альтернативами.
Ни один бенчмарк или модель не является совершенным. Оценка τ²-Bench в 95,6 не гарантирует такую же производительность на каждой реальной задаче, особенно на тех, что выходят за рамки бенчмарка. Модель может показывать более низкие результаты на задачах, требующих очень специфических предметных знаний, или при проверках безопасности, не охваченных τ²-Bench. Будучи предварительной моделью, она может иметь более высокую задержку или меньшую надежность, чем полностью выпущенная модель. Доступные данные не включают показатели задержки, поэтому вы должны тестировать на своих собственных задачах. Кроме того, большое контекстное окно может увеличить время обработки и стоимость, и не все задачи выигрывают от полной емкости в миллион токенов.
Точные значения задержки не указаны в доступных данных для Gemini 3.1 Pro Preview Custom Tools. В целом, модели с очень большим контекстным окном (более 1 млн токенов) могут обрабатывать запросы дольше, особенно те, которые используют полный контекст. Задержка также зависит от сложности запроса, количества вызовов инструментов и текущей загрузки сервера. OrcaRouter может предлагать потоковые ответы для сокращения времени до первого токена. Для приложений реального времени вы можете сравнить производительность с меньшими моделями. Рассмотрите возможность проведения собственных тестов задержки с типовыми запросами, чтобы определить, соответствует ли скорость вашим требованиям.
Цены на Gemini 3.1 Pro Preview Custom Tools составляют $4.00 за 1 миллион входных токенов и $18.00 за 1 миллион выходных токенов. Эти ставки выставляются по тарифу провайдера с нулевой наценкой при доступе через OrcaRouter. Это означает, что цена, которую вы видите, — это цена, которую взимает Google, без дополнительной комиссии со стороны OrcaRouter. Входные токены включают все токены в запросе (текст, токены изображений, аудиотокены и т.д.). Выходные токены — это сгенерированный ответ. Максимальный объем вывода модели составляет 65,536 токенов, поэтому один запрос может стоить до 65,536 / 1,000,000 * 18.00 = примерно $1.18 за выходные токены плюс стоимость входных токенов.
"Zero markup" означает, что OrcaRouter передает вам точную стоимость за токен от провайдера (Google) без каких‑либо наценок. Вы платите $4.00 за 1M входных токенов и $18.00 за 1M выходных токенов — по той же ставке, как если бы вы напрямую вызывали API Google. OrcaRouter может взимать отдельную плату за подписку или использование шлюзового сервиса, но цена модели за токен не завышена. Такая структура ценообразования прозрачна и помогает точно планировать бюджет. Всегда проверяйте текущие условия OrcaRouter на предмет дополнительных сборов.
Высокая стоимость за токен означает, что вам следует тщательно оценить свое использование. Для запросов, использующих полное окно контекста в 1M, стоимость ввода может достигать $4.00 за запрос. Если вашу задачу можно выполнить с меньшим контекстом, рассмотрите возможность усечения или использования более дешевой модели. Кэширование не упоминается в доступных фактах; если OrcaRouter предлагает кэширование запросов, это может снизить затраты для повторяющихся вводов. Также, поскольку модель является предварительной, цены могут измениться при выпуске стабильной версии. Оцените типичное количество токенов вашей рабочей нагрузки, чтобы решить, оправдана ли стоимость.
Вы получаете доступ к модели через совместимый с OpenAI API OrcaRouter. Установите базовый URL на `https://api.orcarouter.ai/v1` и используйте идентификатор модели `google/gemini-3.1-pro-preview-customtools`. API принимает стандартные форматы запросов в стиле OpenAI. Пример использования библиотеки openai в Python: ``` import openai client = openai.OpenAI(base_url="https://api.orcarouter.ai/v1", api_key="YOUR_ORCAROUTER_KEY") response = client.chat.completions.create( model="google/gemini-3.1-pro-preview-customtools", messages=[{"role": "user", "content": "Hello"}] ) ``` Вам нужен действующий ключ API OrcaRouter. Аутентификация осуществляется через заголовок `Authorization`.
Поскольку API совместим с OpenAI, вы можете использовать стандартные параметры, такие как `temperature`, `top_p`, `max_tokens`, `stop`, `frequency_penalty`, `presence_penalty` и `stream`. Для мультимодальных запросов вы можете включать изображения, аудио, видео или файлы в содержимое сообщения, используя формат массива. Для использования инструментов определите функции в параметре `tools` в виде списка JSON-объектов. Модель может вернуть `tool_calls` в ответе. Параметры, специфичные для собственного API Google (например, `safetySettings`), могут быть доступны или нет; обратитесь к документации OrcaRouter за подробностями. Точная поддержка параметров может различаться для предварительных моделей.
Переход со стандартного API OpenAI не составляет труда. Измените `base_url` на `https://api.orcarouter.ai/v1` и обновите параметр `model` на `google/gemini-3.1-pro-preview-customtools`. Замените ваш API-ключ на ключ OrcaRouter. Большинство кода, использующего `openai.ChatCompletion.create` или более новый `client.chat.completions.create`, будет работать с минимальными изменениями. Если вы используете вызовы инструментов, их формат идентичен формату OpenAI. Однако учтите, что эта модель имеет другой токенизатор и может выдавать иные результаты для одного и того же запроса. Тщательно протестируйте перед переключением.
OrcaRouter использует аутентификацию по API-ключу. Включите свой ключ в заголовок запроса как `Authorization: Bearer YOUR_ORCAROUTER_API_KEY`. Вы получаете ключ, зарегистрировавшись в OrcaRouter. Ключ должен храниться в секрете и не раскрываться в клиентском коде. Точный метод аутентификации может различаться; всегда обращайтесь к текущей документации API OrcaRouter. Некоторые конечные точки могут поддерживать дополнительные методы аутентификации, но совместимая с OpenAI конечная точка использует стандартный шаблон bearer token. Убедитесь, что ваши запросы отправляются через HTTPS.
Gemini 1.5 Pro также поддерживает контекстное окно в 1 млн токенов и мультимодальный ввод, но предварительная версия 3.1 Pro Custom Tools достигла оценки τ²-Bench 95,6, что является значительным улучшением по сравнению с серией 1.5 (точные цифры для 1.5 не приводятся). Оптимизация «Custom Tools» является ключевым отличием, указывая на лучшую производительность в задачах использования инструментов. Цены на предварительную модель выше: Gemini 1.5 Pro обычно дешевле. Если вам не нужна новейшая производительность в использовании инструментов, Gemini 1.5 Pro может быть более экономичным выбором. Поскольку 3.1 Pro является предварительной версией, она может иметь меньшую стабильность или гарантию доступности по сравнению со стабильной версией 1.5 Pro.
GPT‑4o также поддерживает мультимодальный ввод и использование инструментов, но его контекстное окно обычно составляет 128k токенов — что значительно меньше 1M токенов этой модели. Показатель τ²-Bench для GPT‑4o не указан в доступных фактах, поэтому прямое сравнение невозможно. В целом, Gemini 3.1 Pro Preview Custom Tools предлагает значительно большее контекстное окно, что делает его более подходящим для задач с длинными документами. GPT‑4o может иметь лучшие показатели на определенных языковых тестах или более широкую поддержку экосистемы. Цены на GPT‑4o также отличаются; сравните стоимость за токен, но учтите, что стоимость вывода этой модели ($18/M) относительно высока.
Claude 3 Opus поддерживает контекстное окно в 200 000 токенов, что значительно меньше 1 000 000 токенов у Gemini 3.1 Pro Preview. Такие бенчмарки, как τ²-Bench, обычно не публикуются для Claude, поэтому прямое сравнение носит спекулятивный характер. Claude известен сильными способностями к рассуждению и следованию инструкциям. Выбор между ними зависит от ваших потребностей: нужен ли вам контекст в 1 млн токенов и мультимодальный ввод или специфические преимущества в безопасности, стиле письма или экосистеме. Если ваш сценарий использования требует обработки очень больших документов или медиафайлов разных типов, то более широкий контекст и мультимодальная поддержка модели Gemini дают преимущество. Стоимость и доступность через OrcaRouter также являются факторами.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview-customtools",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| Ввод / 1M токенов | $4.00 |
| Вывод / 1M токенов | $18.00 |
| Чтение кэша / 1M | $0.400 |
| Валюта | USD |