Gemini 3.5 Flash

google/gemini-3.5-flash
por google · 2026-05-23

El modelo multimodal eficiente de Google con contexto de 1M, alto rendimiento y precios rentables a través de OrcaRouter.

ctx1.05M tokens
Entradatext + image + video + file + audio
Salidatext
p50 TTFT10.00 s
ENTRADA$1.50/ 1M tokens
SALIDA$9.00/ 1M tokens
p50 TTFT10.00 s7 d
p95 TTFT10.00 s7 d
TRÁFICO4.5Mtokens / 7 d

Detalles del modelo

¿Qué es Gemini 3.5 Flash?

Gemini 3.5 Flash es un modelo de lenguaje grande desarrollado por Google, ajustado para velocidad y eficiencia. Pertenece a la familia Gemini y está diseñado para manejar entradas multimodales (texto, imagen, video, archivo y audio) mientras ofrece respuestas rápidas. El modelo admite una ventana de contexto de 1 048 576 tokens, lo que le permite procesar secuencias muy largas, como libros completos, videos de una hora o extensos repositorios de código. Su longitud máxima de salida de 65 536 tokens permite generaciones extensas, incluidos informes completos o archivos de código largos. Se accede a Gemini 3.5 Flash a través de la API compatible con OpenAI de OrcaRouter, lo que significa que puedes integrarlo en aplicaciones existentes con cambios mínimos en el código.

¿Quién debería usar Gemini 3.5 Flash?

Gemini 3.5 Flash es ideal para desarrolladores y organizaciones que necesitan un equilibrio entre alto rendimiento, baja latencia y costo. Es particularmente adecuado para entornos de producción donde la velocidad de inferencia es importante, como chatbots en tiempo real, pipelines de moderación de contenido o atención al cliente automatizada. El generoso contexto resulta beneficioso para usuarios que necesitan analizar grandes conjuntos de datos, documentos extensos o historiales de conversación largos sin necesidad de dividirlos en fragmentos. Además, los equipos que construyen aplicaciones multimodales —como subtitulado de imágenes, resumen de video o transcripción de audio— pueden aprovechar su soporte nativo para múltiples tipos de entrada. Si su carga de trabajo exige una capacidad de razonamiento extremadamente alta o matemáticas complejas, considere usar un modelo más potente y lento en su lugar.

¿Qué modalidades de entrada admite Gemini 3.5 Flash?

Gemini 3.5 Flash acepta cinco modalidades de entrada: texto, imagen, video, archivo y audio. Las entradas de texto pueden ser cadenas simples o mensajes estructurados. Las imágenes pueden pasarse como datos codificados en base64 o URLs; el modelo puede interpretar contenido visual como gráficos, diagramas o fotografías. Las entradas de video son compatibles como secuencias de fotogramas o archivos de video comprimidos, lo que permite al modelo analizar movimiento y cambios temporales. Las entradas de archivo abarcan formatos comunes como PDF, DOCX o archivos de código; el modelo puede extraer y razonar sobre su contenido. Las entradas de audio pueden ser sin procesar o comprimidas (por ejemplo, MP3, WAV), lo que permite transcripción del habla y análisis de sonido. Todas las modalidades pueden combinarse en una sola solicitud, lo que convierte a Gemini 3.5 Flash en una herramienta versátil para tareas multimodales.

¿Cómo se accede a Gemini 3.5 Flash a través de OrcaRouter?

OrcaRouter expone Gemini 3.5 Flash a través de su API compatible con OpenAI. La URL base es https://api.orcarouter.ai/v1, y el ID del modelo específico es "google/gemini-3.5-flash". Puede llamarlo usando cualquier SDK de OpenAI o solicitudes HTTP directas, simplemente cambiando la URL base y el nombre del modelo. La autenticación se maneja mediante una clave de API proporcionada por OrcaRouter. La API admite endpoints estándar de finalizaciones de chat, streaming y parámetros opcionales como temperature, top_p y max_tokens. OrcaRouter no añade ningún margen a la tarifa del proveedor, por lo que paga exactamente $1.50 por 1M de tokens de entrada y $9.00 por 1M de tokens de salida. No se aplican tarifas adicionales de puerta de enlace.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Precios

Entrada / 1M tokens$1.50
Salida / 1M tokens$9.00
Lectura caché / 1M$0.150
Escritura caché / 1M$0.083
MonedaUSD

Rendimiento

p50 TTFT
10.00 s
Velocidad de salida
10766 tok/s
p95 TTFT
10.00 s
Tasa de error
0.44%

Pruebas de referencia públicas

49.0
AA Coding
Mejor que el 68 % de los modelos comparados
47.0
AA Intelligence
Mejor que el 58 % de los modelos comparados
51.0
AA Math
Mejor que el 27 % de los modelos comparados
GPQA Diamond
45.0 index
MMLU-Pro
59.0 index
τ²-Bench
42.0 index
Fuente: artificialanalysis.ai

Preguntas frecuentes

¿Cuánto cuesta Gemini 3.5 Flash en OrcaRouter?
Los tokens de entrada son $1.50 por 1 millón de tokens; los tokens de salida son $9.00 por 1 millón de tokens. OrcaRouter factura a la tarifa del proveedor sin margen adicional. No hay cargos adicionales.
¿Cuál es el tamaño de la ventana de contexto de Gemini 3.5 Flash?
Admite una ventana de contexto de 1,048,576 tokens (aproximadamente 1 millón de tokens). Esto incluye tanto tokens de entrada como de salida combinados.
¿Cuáles son las principales fortalezas de Gemini 3.5 Flash?
Está optimizado para baja latencia, alto rendimiento y eficiencia de costos. Admite entradas multimodales (texto, imagen, video, archivo, audio) y una ventana de contexto grande, lo que lo hace ideal para aplicaciones en tiempo real y procesamiento de documentos largos.
¿Cómo se compara Gemini 3.5 Flash con Gemini 3.5 Pro?
Flash es más rápido y más barato, pero tiene un rendimiento inferior en pruebas de benchmark en tareas de razonamiento complejo y matemáticas. Pro es más preciso, pero más lento y más caro. Flash es mejor para aplicaciones de alto volumen y sensibles a la latencia.
¿Cómo se manejan los datos al utilizar Gemini 3.5 Flash a través de OrcaRouter?
OrcaRouter actúa como un proxy y no almacena tus datos. Sin embargo, las políticas de manejo de datos de Google se aplican al modelo subyacente. OrcaRouter recomienda revisar los términos de Google sobre retención de datos y privacidad.
¿Cómo llamo a Gemini 3.5 Flash usando una API compatible con OpenAI?
Usa la URL base https://api.orcarouter.ai/v1, el ID del modelo "google/gemini-3.5-flash", y pasa una clave de API de OrcaRouter en el encabezado Authorization. La API admite completaciones de chat estándar y streaming.
¿Qué longitud de salida puede generar Gemini 3.5 Flash?
Puede generar hasta 65,536 tokens por respuesta. Esto es significativamente mayor que muchos modelos, lo que permite contenido de formato largo, código o razonamiento extendido.
¿Hay algún descuento para tokens repetidos o en caché?
Basado en los hechos proporcionados, OrcaRouter no ofrece almacenamiento en caché ni descuentos por volumen. Cada token se factura a la tarifa estándar independientemente de la reutilización.

Insertar esta insignia

Gemini 3.5 Flash$1.50/M in10000ms p50vía OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash en OrcaRouter" /> </a>
Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)