Gemini 3 Flash Preview

google/gemini-3-flash-preview
от Google · 2025-12-17

Google Gemini 3 Flash Preview – Мультимодальная модель с контекстом в 1M токенов, 88.2 MMLU-Pro, доступна через OrcaRouter.

конт.1.05M токенов
Вводtext + image + file + audio + video
Выводtext
p50 TTFT3.81 s
ВХОД$0.50/ 1M токенов
ВЫХОД$3.00/ 1M токенов
p50 TTFT3.81 s7 д
p95 TTFT10.00 s7 д
ТРАФИК1.1Mтокенов / 7 д

Детали модели

Что такое Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview — это мультимодальная модель, разработанная Google, оптимизированная для скорости и обработки больших контекстов. Она принимает ввод в форматах текста, изображений, файлов, аудио и видео и может генерировать до 65 536 токенов на выходе. Модель имеет контекстное окно в 1 048 576 токенов, что позволяет ей рассуждать на очень длинных последовательностях. Она набирает 88,2 балла по бенчмарку MMLU-Pro, что свидетельствует о высокой производительности в широком спектре академических и логических задач. Эта предварительная версия доступна через совместимый с OpenAI API от OrcaRouter под идентификатором модели google/gemini-3-flash-preview.

Кто является целевой аудиторией для этой модели?

Gemini 3 Flash Preview нацелен на разработчиков и организации, создающие приложения, требующие быстрого мультимодального рассуждения с большим контекстом. Он хорошо подходит для таких сценариев использования, как анализ видео, обработка длинных документов и понимание аудио-видео в реальном времени. Цена модели — $0.50 за миллион входных токенов и $3.00 за миллион выходных токенов — делает её доступной как для стартапов, так и для крупных компаний. Поскольку это предварительная версия, первые пользователи могут оценить её возможности до стабильного релиза. OrcaRouter обеспечивает плавный доступ к этой модели, включая конечные точки, совместимые с OpenAI, и нулевую наценку на тарифы провайдера.

Какие мультимодальные входные данные он поддерживает?

Gemini 3 Flash Preview поддерживает пять режимов ввода: текст, изображение, файл, аудио и видео. Текст может быть простым или структурированным; изображения могут включать фотографии, диаграммы и скриншоты; файлы охватывают такие форматы, как PDF и документы; аудио включает речь и музыку; видео может обрабатываться как по визуальному, так и по аудиоряду. Модель может комбинировать несколько модальностей в одном запросе — например, анализируя видео и одновременно читая прикрепленный PDF-файл. Такая универсальность позволяет ей выполнять сложные, смешанные задачи без необходимости в отдельных конвейерах. Входные токены подсчитываются на основе правил токенизатора, специфичных для каждой модальности.

Каков статус предварительного просмотра и насколько он стабилен?

Gemini 3 Flash Preview — это предварительная версия модели Flash третьего поколения от Google. Как предварительная версия, она может претерпевать изменения в поведении, производительности и доступности. Google обычно обновляет предварительные модели на основе отзывов пользователей, и со временем они могут заменить конечные точки предварительных версий стабильными релизами. Хотя модель функциональна и подходит для тестирования и разработки, при развертывании в производственной среде следует отслеживать обновления. OrcaRouter зеркалирует конечную точку провайдера, гарантируя, что любые изменения от Google будут оперативно отражены. Идентификатор модели google/gemini-3-flash-preview останется неизменным, если только Google не изменит свое наименование.

Примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Цены

Ввод / 1M токенов$0.500
Вывод / 1M токенов$3.00
Чтение кэша / 1M$0.050
ВалютаUSD

Производительность

p50 TTFT
3.81 s
Скорость вывода
851 tok/s
p95 TTFT
10.00 s
Частота ошибок
0%

Публичные тесты

37.8
AA Coding
Лучше, чем 47% сравниваемых моделей
35.0
AA Intelligence
Лучше, чем 35% сравниваемых моделей
55.7
AA Math
Лучше, чем 32% сравниваемых моделей
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Источник: artificialanalysis.ai

Больше от Google

FAQ

Какова стоимость использования Gemini 3 Flash Preview?
Цена составляет $0.50 за миллион входных токенов и $3.00 за миллион выходных токенов, выставляется по тарифу провайдера без наценки со стороны OrcaRouter.
Какой размер контекстного окна?
Окно контекста составляет 1,048,576 токенов для ввода, и модель может генерировать до 65,536 выходных токенов.
Какие поддерживаемые входные модальности?
Текст, изображение, файл, аудио и видео принимаются в качестве ввода. Вывод — только текст.
Как он сравнивается с Gemini 2 Flash?
Gemini 3 Flash Preview имеет большее окно контекста (1M по сравнению с до 1M, но часто меньше), более высокий балл MMLU-Pro (88.2) и расширенную мультимодальную поддержку, включая видео. Он быстрее и лучше справляется со сложными задачами, но Gemini 2 Flash дешевле за токен.
Как OrcaRouter обрабатывает конфиденциальность данных?
OrcaRouter передает ваши запросы в API Google. Обработка данных осуществляется в соответствии с политикой конфиденциальности Google. OrcaRouter не ведет журнал и не хранит ваш контент сверх того, что необходимо для обработки запроса. Для получения подробной информации ознакомьтесь с политиками обоих поставщиков.
Можно ли вызвать Gemini 3 Flash Preview через OpenAI-совместимый API?
Да. Используйте API OrcaRouter по адресу https://api.orcarouter.ai/v1 с идентификатором модели "google/gemini-3-flash-preview". Аутентификация использует ключ API OrcaRouter. Форматы запросов и ответов соответствуют схеме OpenAI Chat Completions.
Каковы основные сильные стороны модели?
Высокая скорость инференса, большой контекст в 1 млн токенов, мультимодальный ввод (текст, изображение, файл, аудио, видео), сильный бенчмарк MMLU-Pro (88.2) и низкая стоимость по сравнению с более крупными моделями.
Доступен ли Gemini 3 Flash Preview для использования в производстве?
Это предварительная версия, что означает возможные изменения, прерывистую доступность или ограниченную поддержку. Она подходит для тестирования и разработки; для критически важных производственных нагрузок рекомендуется использовать стабильную версию, когда она станет доступна.
Как оценить использование токенов для мультимодальных входных данных?
Каждый модальный тип имеет свою токенизацию. Изображения, аудио и видео делятся на токены в зависимости от разрешения и длительности. OrcaRouter сообщает об использовании токенов в ответе API. Вы также можете обратиться к документации Google для получения подробных правил подсчёта токенов.
Что произойдет, если я превышу контекстное окно?
Входные данные, превышающие 1,048,576 токенов, будут обрезаны, начиная с самого старого содержимого. Модель будет игнорировать лишние токены. Убедитесь, что ваши сообщения укладываются в лимит, отслеживая общее количество токенов в вашем запросе.

Встроить значок

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50через OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview в OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)