Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

от Google · 2025-12-17

Google Gemini 3 Flash Preview – Мультимодальная модель с контекстом в 1M токенов, 88.2 MMLU-Pro, доступна через OrcaRouter.

Эндпоинты:/v1/chat/completions /v1beta/models/{model}:generateContent

конт.1.05M токенов

Вводtext + image + file + audio + video

Выводtext

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

ВХОД$0.50/ 1M токенов

ВЫХОД$3.00/ 1M токенов

p50 TTFT3.81 s7 д

p95 TTFT10.00 s7 д

ТРАФИК1.1Mтокенов / 7 д

Получить API Gemini 3 Flash Preview →▶ Попробовать в Playground </> Через API

Что такое Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview — это мультимодальная модель, разработанная Google, оптимизированная для скорости и обработки больших контекстов. Она принимает ввод в форматах текста, изображений, файлов, аудио и видео и может генерировать до 65 536 токенов на выходе. Модель имеет контекстное окно в 1 048 576 токенов, что позволяет ей рассуждать на очень длинных последовательностях. Она набирает 88,2 балла по бенчмарку MMLU-Pro, что свидетельствует о высокой производительности в широком спектре академических и логических задач. Эта предварительная версия доступна через совместимый с OpenAI API от OrcaRouter под идентификатором модели google/gemini-3-flash-preview.

Кто является целевой аудиторией для этой модели?

Gemini 3 Flash Preview нацелен на разработчиков и организации, создающие приложения, требующие быстрого мультимодального рассуждения с большим контекстом. Он хорошо подходит для таких сценариев использования, как анализ видео, обработка длинных документов и понимание аудио-видео в реальном времени. Цена модели — $0.50 за миллион входных токенов и $3.00 за миллион выходных токенов — делает её доступной как для стартапов, так и для крупных компаний. Поскольку это предварительная версия, первые пользователи могут оценить её возможности до стабильного релиза. OrcaRouter обеспечивает плавный доступ к этой модели, включая конечные точки, совместимые с OpenAI, и нулевую наценку на тарифы провайдера.

Какие мультимодальные входные данные он поддерживает?

Gemini 3 Flash Preview поддерживает пять режимов ввода: текст, изображение, файл, аудио и видео. Текст может быть простым или структурированным; изображения могут включать фотографии, диаграммы и скриншоты; файлы охватывают такие форматы, как PDF и документы; аудио включает речь и музыку; видео может обрабатываться как по визуальному, так и по аудиоряду. Модель может комбинировать несколько модальностей в одном запросе — например, анализируя видео и одновременно читая прикрепленный PDF-файл. Такая универсальность позволяет ей выполнять сложные, смешанные задачи без необходимости в отдельных конвейерах. Входные токены подсчитываются на основе правил токенизатора, специфичных для каждой модальности.

Каков статус предварительного просмотра и насколько он стабилен?

Gemini 3 Flash Preview — это предварительная версия модели Flash третьего поколения от Google. Как предварительная версия, она может претерпевать изменения в поведении, производительности и доступности. Google обычно обновляет предварительные модели на основе отзывов пользователей, и со временем они могут заменить конечные точки предварительных версий стабильными релизами. Хотя модель функциональна и подходит для тестирования и разработки, при развертывании в производственной среде следует отслеживать обновления. OrcaRouter зеркалирует конечную точку провайдера, гарантируя, что любые изменения от Google будут оперативно отражены. Идентификатор модели google/gemini-3-flash-preview останется неизменным, если только Google не изменит свое наименование.

Примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Цены

Ввод / 1M токенов	$0.500
Вывод / 1M токенов	$3.00
Чтение кэша / 1M	$0.050
Валюта	USD

Производительность

за 7 дн.

p50 TTFT

3.81 s

Скорость вывода

851 tok/s

p95 TTFT

10.00 s

Частота ошибок

Публичные тесты

Последняя оценка 2025-12-17

37.8

AA Coding

Лучше, чем 47% сравниваемых моделей

35.0

AA Intelligence

Лучше, чем 35% сравниваемых моделей

55.7

AA Math

Лучше, чем 32% сравниваемых моделей

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

Источник: artificialanalysis.ai

Больше от Google

Все модели от google →

Gemini 3.1 Pro PreviewФлагман

google/gemini-3.1-pro-preview

$2.00 вход · $12.00 выход / 1M

1.05M конт.· качество 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 вход · $18.00 выход / 1M

1.05M конт.· качество 10/10

Gemini 3.5 FlashСамый дешевый

google/gemini-3.5-flash

$1.50 вход · $9.00 выход / 1M

1.05M конт.· качество 9/10

FAQ

Какова стоимость использования Gemini 3 Flash Preview?

Цена составляет $0.50 за миллион входных токенов и $3.00 за миллион выходных токенов, выставляется по тарифу провайдера без наценки со стороны OrcaRouter.

Какой размер контекстного окна?

Окно контекста составляет 1,048,576 токенов для ввода, и модель может генерировать до 65,536 выходных токенов.

Какие поддерживаемые входные модальности?

Текст, изображение, файл, аудио и видео принимаются в качестве ввода. Вывод — только текст.

Как он сравнивается с Gemini 2 Flash?

Gemini 3 Flash Preview имеет большее окно контекста (1M по сравнению с до 1M, но часто меньше), более высокий балл MMLU-Pro (88.2) и расширенную мультимодальную поддержку, включая видео. Он быстрее и лучше справляется со сложными задачами, но Gemini 2 Flash дешевле за токен.

Как OrcaRouter обрабатывает конфиденциальность данных?

OrcaRouter передает ваши запросы в API Google. Обработка данных осуществляется в соответствии с политикой конфиденциальности Google. OrcaRouter не ведет журнал и не хранит ваш контент сверх того, что необходимо для обработки запроса. Для получения подробной информации ознакомьтесь с политиками обоих поставщиков.

Можно ли вызвать Gemini 3 Flash Preview через OpenAI-совместимый API?

Да. Используйте API OrcaRouter по адресу https://api.orcarouter.ai/v1 с идентификатором модели "google/gemini-3-flash-preview". Аутентификация использует ключ API OrcaRouter. Форматы запросов и ответов соответствуют схеме OpenAI Chat Completions.

Каковы основные сильные стороны модели?

Высокая скорость инференса, большой контекст в 1 млн токенов, мультимодальный ввод (текст, изображение, файл, аудио, видео), сильный бенчмарк MMLU-Pro (88.2) и низкая стоимость по сравнению с более крупными моделями.

Доступен ли Gemini 3 Flash Preview для использования в производстве?

Это предварительная версия, что означает возможные изменения, прерывистую доступность или ограниченную поддержку. Она подходит для тестирования и разработки; для критически важных производственных нагрузок рекомендуется использовать стабильную версию, когда она станет доступна.

Как оценить использование токенов для мультимодальных входных данных?

Каждый модальный тип имеет свою токенизацию. Изображения, аудио и видео делятся на токены в зависимости от разрешения и длительности. OrcaRouter сообщает об использовании токенов в ответе API. Вы также можете обратиться к документации Google для получения подробных правил подсчёта токенов.

Что произойдет, если я превышу контекстное окно?

Входные данные, превышающие 1,048,576 токенов, будут обрезаны, начиная с самого старого содержимого. Модель будет игнорировать лишние токены. Убедитесь, что ваши сообщения укладываются в лимит, отслеживая общее количество токенов в вашем запросе.

Встроить значок

Вставьте в свой блог

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•через OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview в OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

Что такое Google Gemini 3 Flash Preview?

Кто является целевой аудиторией для этой модели?

Какие мультимодальные входные данные он поддерживает?

Каков статус предварительного просмотра и насколько он стабилен?

Что может Gemini 3 Flash Preview делать с текстом и изображениями?

Как он обрабатывает аудио и видео?

Каковы лучшие варианты использования этой Flash-модели?

Когда вместо этого вы могли бы выбрать более дешёвую или более мощную модель?

Что означает показатель MMLU-Pro, равный 88.2?

Насколько быстр Gemini 3 Flash Preview для инференса?

Каковы ключевые сильные стороны модели на основе бенчмарков?

Каковы честные ограничения Gemini 3 Flash Preview?

Какова структура ценообразования для Gemini 3 Flash Preview?

Как цены соотносятся с другими моделями?

Есть ли какие-либо скидки на кэширование или оптовые цены?

Как вызвать Gemini 3 Flash Preview через API OrcaRouter?

Какие параметры доступны при вызове модели?

Как перейти с нативного API Google на OrcaRouter?

Есть ли разница в формате ответа по сравнению с OpenAI?

Чем Gemini 3 Flash Preview отличается от Gemini 2 Flash?

Как это сравнивается с GPT-4o?

Как он соотносится с другими моделями Google?

Примеры кода

Цены

Производительность

Публичные тесты

Больше от Google

FAQ

Встроить значок

Gemini 3 Flash Preview

Детали модели

Что такое Google Gemini 3 Flash Preview?

Кто является целевой аудиторией для этой модели?

Какие мультимодальные входные данные он поддерживает?

Каков статус предварительного просмотра и насколько он стабилен?

Что может Gemini 3 Flash Preview делать с текстом и изображениями?

Как он обрабатывает аудио и видео?

Каковы лучшие варианты использования этой Flash-модели?

Когда вместо этого вы могли бы выбрать более дешёвую или более мощную модель?

Что означает показатель MMLU-Pro, равный 88.2?

Насколько быстр Gemini 3 Flash Preview для инференса?

Каковы ключевые сильные стороны модели на основе бенчмарков?

Каковы честные ограничения Gemini 3 Flash Preview?

Какова структура ценообразования для Gemini 3 Flash Preview?

Как цены соотносятся с другими моделями?

Есть ли какие-либо скидки на кэширование или оптовые цены?

Как вызвать Gemini 3 Flash Preview через API OrcaRouter?

Какие параметры доступны при вызове модели?

Как перейти с нативного API Google на OrcaRouter?

Есть ли разница в формате ответа по сравнению с OpenAI?

Чем Gemini 3 Flash Preview отличается от Gemini 2 Flash?

Как это сравнивается с GPT-4o?

Как он соотносится с другими моделями Google?

Примеры кода

Цены

Производительность

Публичные тесты

Больше от Google

FAQ

Встроить значок