Gemini 3 Flash Preview

google/gemini-3-flash-preview
por Google · 2025-12-17

Google Gemini 3 Flash Preview – Modelo multimodal con contexto de 1M tokens, 88.2 MMLU-Pro, accesible a través de OrcaRouter.

ctx1.05M tokens
Entradatext + image + file + audio + video
Salidatext
p50 TTFT3.81 s
ENTRADA$0.50/ 1M tokens
SALIDA$3.00/ 1M tokens
p50 TTFT3.81 s7 d
p95 TTFT10.00 s7 d
TRÁFICO1.1Mtokens / 7 d

Detalles del modelo

¿Qué es Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview es un modelo multimodal desarrollado por Google, optimizado para velocidad y procesamiento de contextos largos. Acepta entrada en formatos de texto, imagen, archivo, audio y video, y puede generar hasta 65,536 tokens de salida. El modelo tiene una ventana de contexto de 1,048,576 tokens, lo que le permite razonar a través de secuencias muy largas. Obtiene una puntuación de 88.2 en el benchmark MMLU-Pro, lo que indica un rendimiento sólido en una amplia gama de tareas académicas y de razonamiento. Esta versión preliminar está disponible a través de la API compatible con OpenAI de OrcaRouter bajo el ID de modelo google/gemini-3-flash-preview.

¿Quién es el público objetivo de este modelo?

Gemini 3 Flash Preview se dirige a desarrolladores y organizaciones que construyen aplicaciones que requieren razonamiento multimodal rápido con gran contexto. Es ideal para casos de uso como análisis de video, resumen de documentos largos y comprensión de audio y video en tiempo real. El precio del modelo —$0.50 por millón de tokens de entrada y $3.00 por millón de tokens de salida— lo hace accesible tanto para startups como para empresas. Debido a que es una versión preliminar, los primeros usuarios pueden evaluar sus capacidades antes de un lanzamiento estable. OrcaRouter proporciona acceso sin interrupciones a este modelo, incluyendo endpoints compatibles con OpenAI y sin margen de beneficio en las tarifas del proveedor.

¿Qué entradas multimodales admite?

Gemini 3 Flash Preview admite cinco modalidades de entrada: texto, imagen, archivo, audio y video. El texto puede ser plano o estructurado; las imágenes pueden incluir fotos, diagramas y capturas de pantalla; los archivos cubren formatos como PDF y documentos; el audio incluye habla y música; el video puede procesarse con pistas tanto visuales como de audio. El modelo puede combinar múltiples modalidades en un solo prompt—por ejemplo, analizando un video mientras también lee un PDF adjunto. Esta versatilidad le permite manejar tareas complejas de medios mixtos sin requerir pipelines separados. Los tokens de entrada se cuentan según las reglas específicas del tokenizador de cada modalidad.

¿Cuál es el estado de la vista previa y qué tan estable es?

Gemini 3 Flash Preview es una versión preliminar del modelo Flash de tercera generación de Google. Como vista previa, puede experimentar cambios en el comportamiento, el rendimiento y la disponibilidad. Google normalmente actualiza los modelos de vista previa según los comentarios de los usuarios, y eventualmente pueden reemplazar los endpoints de vista previa con versiones estables. Aunque el modelo es funcional y adecuado para pruebas y desarrollo, los despliegues en producción deben monitorear las actualizaciones. OrcaRouter refleja el endpoint del proveedor, asegurando que cualquier cambio de Google se refleje rápidamente. El ID del modelo google/gemini-3-flash-preview se mantendrá consistente a menos que Google modifique su nomenclatura.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Precios

Entrada / 1M tokens$0.500
Salida / 1M tokens$3.00
Lectura caché / 1M$0.050
MonedaUSD

Rendimiento

p50 TTFT
3.81 s
Velocidad de salida
851 tok/s
p95 TTFT
10.00 s
Tasa de error
0%

Pruebas de referencia públicas

37.8
AA Coding
Mejor que el 47 % de los modelos comparados
35.0
AA Intelligence
Mejor que el 35 % de los modelos comparados
55.7
AA Math
Mejor que el 32 % de los modelos comparados
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Fuente: artificialanalysis.ai

Preguntas frecuentes

¿Cuál es el costo de usar Gemini 3 Flash Preview?
El precio es de $0.50 por millón de tokens de entrada y $3.00 por millón de tokens de salida, facturados según la tarifa del proveedor sin margen añadido por OrcaRouter.
¿Cuál es el tamaño de la ventana de contexto?
La ventana de contexto es de 1,048,576 tokens de entrada y el modelo puede generar hasta 65,536 tokens de salida.
¿Cuáles son las modalidades de entrada compatibles?
Se aceptan como entrada texto, imagen, archivo, audio y video. La salida es solo texto.
¿Cómo se compara con Gemini 2 Flash?
Gemini 3 Flash Preview tiene una ventana de contexto más grande (1M frente a hasta 1M pero a menudo más pequeña), una puntuación MMLU-Pro más alta (88.2) y soporte multimodal expandido que incluye video. Es más rápido y más capaz para tareas complejas, pero Gemini 2 Flash es más barato por token.
¿Cómo maneja OrcaRouter la privacidad de los datos?
OrcaRouter envía sus solicitudes a la API de Google. El manejo de datos sigue la política de privacidad de Google. OrcaRouter no registra ni almacena su contenido más allá de lo necesario para procesar la solicitud. Revise las políticas de ambos proveedores para obtener más detalles.
¿Puedo llamar a Gemini 3 Flash Preview usando una API compatible con OpenAI?
Sí. Use la API de OrcaRouter en https://api.orcarouter.ai/v1 con el ID de modelo "google/gemini-3-flash-preview". La autenticación utiliza una clave de API de OrcaRouter. Los formatos de solicitud y respuesta siguen el esquema de Chat Completions de OpenAI.
¿Cuáles son las principales fortalezas del modelo?
Alta velocidad de inferencia, gran contexto de 1M de tokens, entrada multimodal (texto, imagen, archivo, audio, video), sólido benchmark MMLU-Pro (88.2) y bajo costo en comparación con modelos más grandes.
¿Está Gemini 3 Flash Preview disponible para producción?
Es una versión preliminar, lo que significa que puede tener cambios, disponibilidad intermitente o soporte limitado. Es adecuada para pruebas y desarrollo; para cargas de trabajo críticas de producción, considere usar la versión estable una vez que esté disponible.
¿Cómo estimo el uso de tokens para entradas multimodales?
Cada modalidad tiene su propia tokenización. Las imágenes, el audio y el video se dividen en tokens según la resolución y la duración. OrcaRouter informa el uso de tokens en la respuesta de la API. También puedes consultar la documentación de Google para conocer las reglas detalladas de conteo de tokens.
¿Qué sucede si excedo la ventana de contexto?
Las entradas que excedan 1.048.576 tokens se truncarán a partir del contenido más antiguo. El modelo ignorará los tokens sobrantes. Asegúrese de que sus mensajes se ajusten al límite monitoreando el total de tokens en su solicitud.

Insertar esta insignia

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50vía OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview en OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)