Gemini 3.5 Flash

google/gemini-3.5-flash
от google · 2026-05-23

Эффективная мультимодальная модель от Google с контекстом в 1M, высокой производительностью и экономичной ценой через OrcaRouter.

конт.1.05M токенов
Вводtext + image + video + file + audio
Выводtext
p50 TTFT10.00 s
ВХОД$1.50/ 1M токенов
ВЫХОД$9.00/ 1M токенов
p50 TTFT10.00 s7 д
p95 TTFT10.00 s7 д
ТРАФИК4.5Mтокенов / 7 д

Детали модели

Что такое Gemini 3.5 Flash?

Gemini 3.5 Flash — это большая языковая модель, разработанная Google, оптимизированная для скорости и эффективности. Она относится к семейству Gemini и предназначена для обработки мультимодальных входных данных — текста, изображений, видео, файлов и аудио — с быстрой выдачей ответов. Модель поддерживает контекстное окно размером 1 048 576 токенов, что позволяет обрабатывать очень длинные последовательности, такие как целые книги, часовые видео или обширные репозитории кода. Максимальная длина вывода в 65 536 токенов даёт возможность генерировать объёмные материалы, включая полные отчёты или большие файлы с кодом. Gemini 3.5 Flash доступна через совместимый с OpenAI API OrcaRouter, что позволяет интегрировать её в существующие приложения с минимальными изменениями кода.

Кому следует использовать Gemini 3.5 Flash?

Gemini 3.5 Flash идеально подходит для разработчиков и организаций, которым нужен баланс между высокой пропускной способностью, низкой задержкой и стоимостью. Он особенно хорошо подходит для производственных сред, где важна скорость вывода, таких как чат-боты в реальном времени, пайплайны модерации контента или автоматизированная поддержка клиентов. Большой контекстный окно приносит пользу пользователям, которым нужно анализировать большие наборы данных, длинные документы или обширные истории переписки без разбиения на части. Кроме того, команды, создающие мультимодальные приложения — например, описание изображений, обобщение видео или транскрипцию аудио — могут использовать его встроенную поддержку нескольких типов ввода. Если ваша нагрузка требует чрезвычайно высоких аналитических способностей или сложных математических вычислений, рассмотрите более мощную, но более медленную модель.

Какие входные модальности поддерживает Gemini 3.5 Flash?

Gemini 3.5 Flash принимает пять типов входных данных: текст, изображение, видео, файл и аудио. Текстовые входные данные могут быть обычными строками или структурированными сообщениями. Изображения могут передаваться в виде данных в формате base64 или URL-адресов; модель может интерпретировать визуальный контент, такой как диаграммы, схемы или фотографии. Видеовходные данные поддерживаются в виде последовательностей кадров или сжатых видеофайлов, что позволяет модели анализировать движение и временные изменения. Файловые входные данные охватывают распространенные форматы, такие как PDF, DOCX или файлы кода; модель может извлекать и анализировать их содержимое. Аудиовходные данные могут быть необработанными или сжатыми (например, MP3, WAV), что позволяет выполнять транскрипцию речи и анализ звука. Все типы входных данных могут быть объединены в одном запросе, что делает Gemini 3.5 Flash универсальным инструментом для мультимодальных задач.

Как получить доступ к Gemini 3.5 Flash через OrcaRouter?

OrcaRouter предоставляет доступ к Gemini 3.5 Flash через свой API, совместимый с OpenAI. Базовый URL: https://api.orcarouter.ai/v1, а идентификатор модели: "google/gemini-3.5-flash". Вы можете вызывать его с помощью любого SDK OpenAI или прямых HTTP-запросов, просто изменив базовый URL и имя модели. Аутентификация осуществляется через API-ключ, предоставляемый OrcaRouter. API поддерживает стандартные конечные точки чат-завершений, потоковую передачу и необязательные параметры, такие как temperature, top_p и max_tokens. OrcaRouter не добавляет наценки к тарифам провайдера, поэтому вы платите ровно $1.50 за 1 млн входных токенов и $9.00 за 1 млн выходных токенов. Никаких дополнительных шлюзовых комиссий не взимается.

Примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Цены

Ввод / 1M токенов$1.50
Вывод / 1M токенов$9.00
Чтение кэша / 1M$0.150
Запись кэша / 1M$0.083
ВалютаUSD

Производительность

p50 TTFT
10.00 s
Скорость вывода
10766 tok/s
p95 TTFT
10.00 s
Частота ошибок
0.44%

Публичные тесты

49.0
AA Coding
Лучше, чем 68% сравниваемых моделей
47.0
AA Intelligence
Лучше, чем 58% сравниваемых моделей
51.0
AA Math
Лучше, чем 27% сравниваемых моделей
GPQA Diamond
45.0 index
MMLU-Pro
59.0 index
τ²-Bench
42.0 index
Источник: artificialanalysis.ai

Больше от google

FAQ

Сколько стоит Gemini 3.5 Flash на OrcaRouter?
Входные токены стоят $1.50 за 1 миллион токенов; выходные токены стоят $9.00 за 1 миллион токенов. OrcaRouter выставляет счета по тарифам провайдера без наценки. Дополнительных комиссий нет.
Каков размер контекстного окна Gemini 3.5 Flash?
Он поддерживает контекстное окно из 1,048,576 токенов (около 1 миллиона токенов). Это включает как входные, так и выходные токены вместе взятые.
Каковы основные преимущества Gemini 3.5 Flash?
Он оптимизирован для малой задержки, высокой пропускной способности и экономической эффективности. Он поддерживает мультимодальные входные данные (текст, изображение, видео, файл, аудио) и большое контекстное окно, что делает его идеальным для приложений реального времени и обработки длинных документов.
Как Gemini 3.5 Flash сравнивается с Gemini 3.5 Pro?
Flash быстрее и дешевле, но показывает более низкую производительность в бенчмарках по сложным задачам рассуждения и математическим задачам. Pro более точен, но медленнее и дороже. Flash лучше подходит для высоконагруженных приложений, чувствительных к задержкам.
Как обрабатываются данные при использовании Gemini 3.5 Flash через OrcaRouter?
OrcaRouter действует как прокси и не хранит ваши данные. Однако политики обработки данных Google применяются к базовой модели. OrcaRouter рекомендует ознакомиться с условиями Google в отношении хранения данных и конфиденциальности.
Как вызвать Gemini 3.5 Flash с помощью API, совместимого с OpenAI?
Используйте базовый URL https://api.orcarouter.ai/v1, идентификатор модели "google/gemini-3.5-flash" и передайте ключ API OrcaRouter в заголовке Authorization. API поддерживает стандартные завершения чатов и потоковую передачу.
Какую длину вывода может генерировать Gemini 3.5 Flash?
Может генерировать до 65 536 токенов за один ответ. Это значительно больше, чем у многих моделей, что позволяет создавать длинный контент, код или развёрнутые рассуждения.
Есть ли скидка на повторные или кэшированные токены?
На основании предоставленных фактов, OrcaRouter не предлагает кэширование или скидки за объем. Каждый токен тарифицируется по стандартной ставке независимо от повторного использования.

Встроить значок

Gemini 3.5 Flash$1.50/M in10000ms p50через OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash в OrcaRouter" /> </a>
Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)