Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

от google · 2026-05-23

Эффективная мультимодальная модель от Google с контекстом в 1M, высокой производительностью и экономичной ценой через OrcaRouter.

Эндпоинты:/v1/chat/completions /v1beta/models/{model}:generateContent

конт.1.05M токенов

Вводtext + image + video + file + audio

Выводtext

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

ВХОД$1.50/ 1M токенов

ВЫХОД$9.00/ 1M токенов

p50 TTFT10.00 s7 д

p95 TTFT10.00 s7 д

ТРАФИК4.5Mтокенов / 7 д

Получить API Gemini 3.5 Flash →▶ Попробовать в Playground </> Через API

Что такое Gemini 3.5 Flash?

Gemini 3.5 Flash — это большая языковая модель, разработанная Google, оптимизированная для скорости и эффективности. Она относится к семейству Gemini и предназначена для обработки мультимодальных входных данных — текста, изображений, видео, файлов и аудио — с быстрой выдачей ответов. Модель поддерживает контекстное окно размером 1 048 576 токенов, что позволяет обрабатывать очень длинные последовательности, такие как целые книги, часовые видео или обширные репозитории кода. Максимальная длина вывода в 65 536 токенов даёт возможность генерировать объёмные материалы, включая полные отчёты или большие файлы с кодом. Gemini 3.5 Flash доступна через совместимый с OpenAI API OrcaRouter, что позволяет интегрировать её в существующие приложения с минимальными изменениями кода.

Кому следует использовать Gemini 3.5 Flash?

Gemini 3.5 Flash идеально подходит для разработчиков и организаций, которым нужен баланс между высокой пропускной способностью, низкой задержкой и стоимостью. Он особенно хорошо подходит для производственных сред, где важна скорость вывода, таких как чат-боты в реальном времени, пайплайны модерации контента или автоматизированная поддержка клиентов. Большой контекстный окно приносит пользу пользователям, которым нужно анализировать большие наборы данных, длинные документы или обширные истории переписки без разбиения на части. Кроме того, команды, создающие мультимодальные приложения — например, описание изображений, обобщение видео или транскрипцию аудио — могут использовать его встроенную поддержку нескольких типов ввода. Если ваша нагрузка требует чрезвычайно высоких аналитических способностей или сложных математических вычислений, рассмотрите более мощную, но более медленную модель.

Какие входные модальности поддерживает Gemini 3.5 Flash?

Gemini 3.5 Flash принимает пять типов входных данных: текст, изображение, видео, файл и аудио. Текстовые входные данные могут быть обычными строками или структурированными сообщениями. Изображения могут передаваться в виде данных в формате base64 или URL-адресов; модель может интерпретировать визуальный контент, такой как диаграммы, схемы или фотографии. Видеовходные данные поддерживаются в виде последовательностей кадров или сжатых видеофайлов, что позволяет модели анализировать движение и временные изменения. Файловые входные данные охватывают распространенные форматы, такие как PDF, DOCX или файлы кода; модель может извлекать и анализировать их содержимое. Аудиовходные данные могут быть необработанными или сжатыми (например, MP3, WAV), что позволяет выполнять транскрипцию речи и анализ звука. Все типы входных данных могут быть объединены в одном запросе, что делает Gemini 3.5 Flash универсальным инструментом для мультимодальных задач.

Как получить доступ к Gemini 3.5 Flash через OrcaRouter?

OrcaRouter предоставляет доступ к Gemini 3.5 Flash через свой API, совместимый с OpenAI. Базовый URL: https://api.orcarouter.ai/v1, а идентификатор модели: "google/gemini-3.5-flash". Вы можете вызывать его с помощью любого SDK OpenAI или прямых HTTP-запросов, просто изменив базовый URL и имя модели. Аутентификация осуществляется через API-ключ, предоставляемый OrcaRouter. API поддерживает стандартные конечные точки чат-завершений, потоковую передачу и необязательные параметры, такие как temperature, top_p и max_tokens. OrcaRouter не добавляет наценки к тарифам провайдера, поэтому вы платите ровно $1.50 за 1 млн входных токенов и $9.00 за 1 млн выходных токенов. Никаких дополнительных шлюзовых комиссий не взимается.

Примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Цены

Ввод / 1M токенов	$1.50
Вывод / 1M токенов	$9.00
Чтение кэша / 1M	$0.150
Запись кэша / 1M	$0.083
Валюта	USD

Производительность

за 7 дн.

p50 TTFT

10.00 s

Скорость вывода

10766 tok/s

p95 TTFT

10.00 s

Частота ошибок

0.44%

Публичные тесты

Последняя оценка 2026-06-25

49.0

AA Coding

Лучше, чем 68% сравниваемых моделей

47.0

AA Intelligence

Лучше, чем 58% сравниваемых моделей

51.0

AA Math

Лучше, чем 27% сравниваемых моделей

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

Источник: artificialanalysis.ai

Больше от google

Все модели от google →

Gemini 3.1 Pro PreviewФлагман

google/gemini-3.1-pro-preview

$2.00 вход · $12.00 выход / 1M

1.05M конт.· качество 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 вход · $18.00 выход / 1M

1.05M конт.· качество 10/10

Gemini 3 Flash PreviewСамый дешевый

google/gemini-3-flash-preview

$0.50 вход · $3.00 выход / 1M

1.05M конт.· качество 9/10

FAQ

Сколько стоит Gemini 3.5 Flash на OrcaRouter?

Входные токены стоят $1.50 за 1 миллион токенов; выходные токены стоят $9.00 за 1 миллион токенов. OrcaRouter выставляет счета по тарифам провайдера без наценки. Дополнительных комиссий нет.

Каков размер контекстного окна Gemini 3.5 Flash?

Он поддерживает контекстное окно из 1,048,576 токенов (около 1 миллиона токенов). Это включает как входные, так и выходные токены вместе взятые.

Каковы основные преимущества Gemini 3.5 Flash?

Он оптимизирован для малой задержки, высокой пропускной способности и экономической эффективности. Он поддерживает мультимодальные входные данные (текст, изображение, видео, файл, аудио) и большое контекстное окно, что делает его идеальным для приложений реального времени и обработки длинных документов.

Как Gemini 3.5 Flash сравнивается с Gemini 3.5 Pro?

Flash быстрее и дешевле, но показывает более низкую производительность в бенчмарках по сложным задачам рассуждения и математическим задачам. Pro более точен, но медленнее и дороже. Flash лучше подходит для высоконагруженных приложений, чувствительных к задержкам.

Как обрабатываются данные при использовании Gemini 3.5 Flash через OrcaRouter?

OrcaRouter действует как прокси и не хранит ваши данные. Однако политики обработки данных Google применяются к базовой модели. OrcaRouter рекомендует ознакомиться с условиями Google в отношении хранения данных и конфиденциальности.

Как вызвать Gemini 3.5 Flash с помощью API, совместимого с OpenAI?

Используйте базовый URL https://api.orcarouter.ai/v1, идентификатор модели "google/gemini-3.5-flash" и передайте ключ API OrcaRouter в заголовке Authorization. API поддерживает стандартные завершения чатов и потоковую передачу.

Какую длину вывода может генерировать Gemini 3.5 Flash?

Может генерировать до 65 536 токенов за один ответ. Это значительно больше, чем у многих моделей, что позволяет создавать длинный контент, код или развёрнутые рассуждения.

Есть ли скидка на повторные или кэшированные токены?

На основании предоставленных фактов, OrcaRouter не предлагает кэширование или скидки за объем. Каждый токен тарифицируется по стандартной ставке независимо от повторного использования.

Встроить значок

Вставьте в свой блог

Gemini 3.5 Flash•$1.50/M in•10000ms p50•через OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash в OrcaRouter" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

Что такое Gemini 3.5 Flash?

Кому следует использовать Gemini 3.5 Flash?

Какие входные модальности поддерживает Gemini 3.5 Flash?

Как получить доступ к Gemini 3.5 Flash через OrcaRouter?

Для каких задач Gemini 3.5 Flash подходит лучше всего?

Когда стоит выбрать более дешевую модель вместо Gemini 3.5 Flash?

Может ли Gemini 3.5 Flash обрабатывать потоковую передачу данных и взаимодействия в реальном времени?

Какие лучшие практики использования окна контекста Gemini 3.5 Flash?

Каковы известные сильные стороны Gemini 3.5 Flash?

Каковы честные ограничения Gemini 3.5 Flash?

Как задержка соотносится с другими моделями?

Каково качество вывода модели для кода и структурированных данных?

Как тарифицируется Gemini 3.5 Flash на OrcaRouter?

Каковы компромиссы по стоимости между входными и выходными токенами?

Предлагает ли OrcaRouter какие-либо функции кэширования или скидок?

Как стоимость соотносится с другими моделями на OrcaRouter?

Как вызвать Gemini 3.5 Flash через API OrcaRouter?

Какие параметры доступны для Gemini 3.5 Flash?

Могу ли я выполнить миграцию с Google AI или Vertex AI API на OrcaRouter?

Какую обработку ошибок следует ожидать при использовании API?

Как Gemini 3.5 Flash сравнивается с Gemini 3.5 Pro?

Как Gemini 3.5 Flash соотносится с GPT-4o Mini?

Как Gemini 3.5 Flash сравнивается с Claude 3 Haiku?

В чем главное преимущество Gemini 3.5 Flash перед открытыми моделями?

Примеры кода

Цены

Производительность

Публичные тесты

Больше от google

FAQ

Встроить значок

Gemini 3.5 Flash

Детали модели

Что такое Gemini 3.5 Flash?

Кому следует использовать Gemini 3.5 Flash?

Какие входные модальности поддерживает Gemini 3.5 Flash?

Как получить доступ к Gemini 3.5 Flash через OrcaRouter?

Для каких задач Gemini 3.5 Flash подходит лучше всего?

Когда стоит выбрать более дешевую модель вместо Gemini 3.5 Flash?

Может ли Gemini 3.5 Flash обрабатывать потоковую передачу данных и взаимодействия в реальном времени?

Какие лучшие практики использования окна контекста Gemini 3.5 Flash?

Каковы известные сильные стороны Gemini 3.5 Flash?

Каковы честные ограничения Gemini 3.5 Flash?

Как задержка соотносится с другими моделями?

Каково качество вывода модели для кода и структурированных данных?

Как тарифицируется Gemini 3.5 Flash на OrcaRouter?

Каковы компромиссы по стоимости между входными и выходными токенами?

Предлагает ли OrcaRouter какие-либо функции кэширования или скидок?

Как стоимость соотносится с другими моделями на OrcaRouter?

Как вызвать Gemini 3.5 Flash через API OrcaRouter?

Какие параметры доступны для Gemini 3.5 Flash?

Могу ли я выполнить миграцию с Google AI или Vertex AI API на OrcaRouter?

Какую обработку ошибок следует ожидать при использовании API?

Как Gemini 3.5 Flash сравнивается с Gemini 3.5 Pro?

Как Gemini 3.5 Flash соотносится с GPT-4o Mini?

Как Gemini 3.5 Flash сравнивается с Claude 3 Haiku?

В чем главное преимущество Gemini 3.5 Flash перед открытыми моделями?

Примеры кода

Цены

Производительность

Публичные тесты

Больше от google

FAQ

Встроить значок