Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

por google · 2026-05-23

El modelo multimodal eficiente de Google con contexto de 1M, alto rendimiento y precios rentables a través de OrcaRouter.

Endpoints:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M tokens

Entradatext + image + video + file + audio

Salidatext

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

ENTRADA$1.50/ 1M tokens

SALIDA$9.00/ 1M tokens

p50 TTFT10.00 s7 d

p95 TTFT10.00 s7 d

TRÁFICO4.5Mtokens / 7 d

Obtener la API de Gemini 3.5 Flash →▶ Probar en Playground </> Usar vía API

¿Qué es Gemini 3.5 Flash?

Gemini 3.5 Flash es un modelo de lenguaje grande desarrollado por Google, ajustado para velocidad y eficiencia. Pertenece a la familia Gemini y está diseñado para manejar entradas multimodales (texto, imagen, video, archivo y audio) mientras ofrece respuestas rápidas. El modelo admite una ventana de contexto de 1 048 576 tokens, lo que le permite procesar secuencias muy largas, como libros completos, videos de una hora o extensos repositorios de código. Su longitud máxima de salida de 65 536 tokens permite generaciones extensas, incluidos informes completos o archivos de código largos. Se accede a Gemini 3.5 Flash a través de la API compatible con OpenAI de OrcaRouter, lo que significa que puedes integrarlo en aplicaciones existentes con cambios mínimos en el código.

¿Quién debería usar Gemini 3.5 Flash?

Gemini 3.5 Flash es ideal para desarrolladores y organizaciones que necesitan un equilibrio entre alto rendimiento, baja latencia y costo. Es particularmente adecuado para entornos de producción donde la velocidad de inferencia es importante, como chatbots en tiempo real, pipelines de moderación de contenido o atención al cliente automatizada. El generoso contexto resulta beneficioso para usuarios que necesitan analizar grandes conjuntos de datos, documentos extensos o historiales de conversación largos sin necesidad de dividirlos en fragmentos. Además, los equipos que construyen aplicaciones multimodales —como subtitulado de imágenes, resumen de video o transcripción de audio— pueden aprovechar su soporte nativo para múltiples tipos de entrada. Si su carga de trabajo exige una capacidad de razonamiento extremadamente alta o matemáticas complejas, considere usar un modelo más potente y lento en su lugar.

¿Qué modalidades de entrada admite Gemini 3.5 Flash?

Gemini 3.5 Flash acepta cinco modalidades de entrada: texto, imagen, video, archivo y audio. Las entradas de texto pueden ser cadenas simples o mensajes estructurados. Las imágenes pueden pasarse como datos codificados en base64 o URLs; el modelo puede interpretar contenido visual como gráficos, diagramas o fotografías. Las entradas de video son compatibles como secuencias de fotogramas o archivos de video comprimidos, lo que permite al modelo analizar movimiento y cambios temporales. Las entradas de archivo abarcan formatos comunes como PDF, DOCX o archivos de código; el modelo puede extraer y razonar sobre su contenido. Las entradas de audio pueden ser sin procesar o comprimidas (por ejemplo, MP3, WAV), lo que permite transcripción del habla y análisis de sonido. Todas las modalidades pueden combinarse en una sola solicitud, lo que convierte a Gemini 3.5 Flash en una herramienta versátil para tareas multimodales.

¿Cómo se accede a Gemini 3.5 Flash a través de OrcaRouter?

OrcaRouter expone Gemini 3.5 Flash a través de su API compatible con OpenAI. La URL base es https://api.orcarouter.ai/v1, y el ID del modelo específico es "google/gemini-3.5-flash". Puede llamarlo usando cualquier SDK de OpenAI o solicitudes HTTP directas, simplemente cambiando la URL base y el nombre del modelo. La autenticación se maneja mediante una clave de API proporcionada por OrcaRouter. La API admite endpoints estándar de finalizaciones de chat, streaming y parámetros opcionales como temperature, top_p y max_tokens. OrcaRouter no añade ningún margen a la tarifa del proveedor, por lo que paga exactamente $1.50 por 1M de tokens de entrada y $9.00 por 1M de tokens de salida. No se aplican tarifas adicionales de puerta de enlace.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Precios

Entrada / 1M tokens	$1.50
Salida / 1M tokens	$9.00
Lectura caché / 1M	$0.150
Escritura caché / 1M	$0.083
Moneda	USD

Rendimiento

últimos 7 días

p50 TTFT

10.00 s

Velocidad de salida

10766 tok/s

p95 TTFT

10.00 s

Tasa de error

0.44%

Pruebas de referencia públicas

Última evaluación 2026-06-25

49.0

AA Coding

Mejor que el 68 % de los modelos comparados

47.0

AA Intelligence

Mejor que el 58 % de los modelos comparados

51.0

AA Math

Mejor que el 27 % de los modelos comparados

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

Fuente: artificialanalysis.ai

Más de google

Ver todos los modelos de google →

Gemini 3.1 Pro PreviewInsignia

google/gemini-3.1-pro-preview

$2.00 entrada · $12.00 salida / 1M

1.05M ctx· calidad 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 entrada · $18.00 salida / 1M

1.05M ctx· calidad 10/10

Gemini 3 Flash PreviewMás barato

google/gemini-3-flash-preview

$0.50 entrada · $3.00 salida / 1M

1.05M ctx· calidad 9/10

Preguntas frecuentes

¿Cuánto cuesta Gemini 3.5 Flash en OrcaRouter?

Los tokens de entrada son $1.50 por 1 millón de tokens; los tokens de salida son $9.00 por 1 millón de tokens. OrcaRouter factura a la tarifa del proveedor sin margen adicional. No hay cargos adicionales.

¿Cuál es el tamaño de la ventana de contexto de Gemini 3.5 Flash?

Admite una ventana de contexto de 1,048,576 tokens (aproximadamente 1 millón de tokens). Esto incluye tanto tokens de entrada como de salida combinados.

¿Cuáles son las principales fortalezas de Gemini 3.5 Flash?

Está optimizado para baja latencia, alto rendimiento y eficiencia de costos. Admite entradas multimodales (texto, imagen, video, archivo, audio) y una ventana de contexto grande, lo que lo hace ideal para aplicaciones en tiempo real y procesamiento de documentos largos.

¿Cómo se compara Gemini 3.5 Flash con Gemini 3.5 Pro?

Flash es más rápido y más barato, pero tiene un rendimiento inferior en pruebas de benchmark en tareas de razonamiento complejo y matemáticas. Pro es más preciso, pero más lento y más caro. Flash es mejor para aplicaciones de alto volumen y sensibles a la latencia.

¿Cómo se manejan los datos al utilizar Gemini 3.5 Flash a través de OrcaRouter?

OrcaRouter actúa como un proxy y no almacena tus datos. Sin embargo, las políticas de manejo de datos de Google se aplican al modelo subyacente. OrcaRouter recomienda revisar los términos de Google sobre retención de datos y privacidad.

¿Cómo llamo a Gemini 3.5 Flash usando una API compatible con OpenAI?

Usa la URL base https://api.orcarouter.ai/v1, el ID del modelo "google/gemini-3.5-flash", y pasa una clave de API de OrcaRouter en el encabezado Authorization. La API admite completaciones de chat estándar y streaming.

¿Qué longitud de salida puede generar Gemini 3.5 Flash?

Puede generar hasta 65,536 tokens por respuesta. Esto es significativamente mayor que muchos modelos, lo que permite contenido de formato largo, código o razonamiento extendido.

¿Hay algún descuento para tokens repetidos o en caché?

Basado en los hechos proporcionados, OrcaRouter no ofrece almacenamiento en caché ni descuentos por volumen. Cada token se factura a la tarifa estándar independientemente de la reutilización.

Insertar esta insignia

Pegar en tu artículo de blog

Gemini 3.5 Flash•$1.50/M in•10000ms p50•vía OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash en OrcaRouter" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

¿Qué es Gemini 3.5 Flash?

¿Quién debería usar Gemini 3.5 Flash?

¿Qué modalidades de entrada admite Gemini 3.5 Flash?

¿Cómo se accede a Gemini 3.5 Flash a través de OrcaRouter?

¿Para qué tareas es más adecuado Gemini 3.5 Flash?

¿Cuándo deberías elegir un modelo más barato en lugar de Gemini 3.5 Flash?

¿Puede Gemini 3.5 Flash manejar streaming e interacciones en tiempo real?

¿Cuáles son las mejores prácticas para usar la ventana de contexto de Gemini 3.5 Flash?

¿Cuáles son las fortalezas conocidas de Gemini 3.5 Flash?

¿Cuáles son las limitaciones honestas de Gemini 3.5 Flash?

¿Cómo se compara la latencia con otros modelos?

¿Cuál es la calidad de salida del modelo para código y datos estructurados?

¿Cómo se fija el precio de Gemini 3.5 Flash en OrcaRouter?

¿Cuáles son las compensaciones de costos entre los tokens de entrada y salida?

¿Ofrece OrcaRouter funciones de caché o descuento?

¿Cómo se comparan los costos con otros modelos en OrcaRouter?

¿Cómo llamo a Gemini 3.5 Flash a través de la API de OrcaRouter?

¿Qué parámetros están disponibles para Gemini 3.5 Flash?

¿Puedo migrar desde la API de Google AI o Vertex AI a OrcaRouter?

¿Qué manejo de errores debo esperar al usar la API?

¿Cómo se compara Gemini 3.5 Flash con Gemini 3.5 Pro?

¿Cómo se compara Gemini 3.5 Flash con GPT-4o Mini?

¿Cómo se compara Gemini 3.5 Flash con Claude 3 Haiku?

¿Cuál es la principal ventaja de Gemini 3.5 Flash sobre los modelos de código abierto?

Ejemplos de código

Precios

Rendimiento

Pruebas de referencia públicas

Más de google

Preguntas frecuentes

Insertar esta insignia

Gemini 3.5 Flash

Detalles del modelo

¿Qué es Gemini 3.5 Flash?

¿Quién debería usar Gemini 3.5 Flash?

¿Qué modalidades de entrada admite Gemini 3.5 Flash?

¿Cómo se accede a Gemini 3.5 Flash a través de OrcaRouter?

¿Para qué tareas es más adecuado Gemini 3.5 Flash?

¿Cuándo deberías elegir un modelo más barato en lugar de Gemini 3.5 Flash?

¿Puede Gemini 3.5 Flash manejar streaming e interacciones en tiempo real?

¿Cuáles son las mejores prácticas para usar la ventana de contexto de Gemini 3.5 Flash?

¿Cuáles son las fortalezas conocidas de Gemini 3.5 Flash?

¿Cuáles son las limitaciones honestas de Gemini 3.5 Flash?

¿Cómo se compara la latencia con otros modelos?

¿Cuál es la calidad de salida del modelo para código y datos estructurados?

¿Cómo se fija el precio de Gemini 3.5 Flash en OrcaRouter?

¿Cuáles son las compensaciones de costos entre los tokens de entrada y salida?

¿Ofrece OrcaRouter funciones de caché o descuento?

¿Cómo se comparan los costos con otros modelos en OrcaRouter?

¿Cómo llamo a Gemini 3.5 Flash a través de la API de OrcaRouter?

¿Qué parámetros están disponibles para Gemini 3.5 Flash?

¿Puedo migrar desde la API de Google AI o Vertex AI a OrcaRouter?

¿Qué manejo de errores debo esperar al usar la API?

¿Cómo se compara Gemini 3.5 Flash con Gemini 3.5 Pro?

¿Cómo se compara Gemini 3.5 Flash con GPT-4o Mini?

¿Cómo se compara Gemini 3.5 Flash con Claude 3 Haiku?

¿Cuál es la principal ventaja de Gemini 3.5 Flash sobre los modelos de código abierto?

Ejemplos de código

Precios

Rendimiento

Pruebas de referencia públicas

Más de google

Preguntas frecuentes

Insertar esta insignia