Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

por Google · 2025-12-17

Google Gemini 3 Flash Preview – Modelo multimodal con contexto de 1M tokens, 88.2 MMLU-Pro, accesible a través de OrcaRouter.

Endpoints:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M tokens

Entradatext + image + file + audio + video

Salidatext

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

ENTRADA$0.50/ 1M tokens

SALIDA$3.00/ 1M tokens

p50 TTFT3.81 s7 d

p95 TTFT10.00 s7 d

TRÁFICO1.1Mtokens / 7 d

Obtener la API de Gemini 3 Flash Preview →▶ Probar en Playground </> Usar vía API

¿Qué es Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview es un modelo multimodal desarrollado por Google, optimizado para velocidad y procesamiento de contextos largos. Acepta entrada en formatos de texto, imagen, archivo, audio y video, y puede generar hasta 65,536 tokens de salida. El modelo tiene una ventana de contexto de 1,048,576 tokens, lo que le permite razonar a través de secuencias muy largas. Obtiene una puntuación de 88.2 en el benchmark MMLU-Pro, lo que indica un rendimiento sólido en una amplia gama de tareas académicas y de razonamiento. Esta versión preliminar está disponible a través de la API compatible con OpenAI de OrcaRouter bajo el ID de modelo google/gemini-3-flash-preview.

¿Quién es el público objetivo de este modelo?

Gemini 3 Flash Preview se dirige a desarrolladores y organizaciones que construyen aplicaciones que requieren razonamiento multimodal rápido con gran contexto. Es ideal para casos de uso como análisis de video, resumen de documentos largos y comprensión de audio y video en tiempo real. El precio del modelo —$0.50 por millón de tokens de entrada y $3.00 por millón de tokens de salida— lo hace accesible tanto para startups como para empresas. Debido a que es una versión preliminar, los primeros usuarios pueden evaluar sus capacidades antes de un lanzamiento estable. OrcaRouter proporciona acceso sin interrupciones a este modelo, incluyendo endpoints compatibles con OpenAI y sin margen de beneficio en las tarifas del proveedor.

¿Qué entradas multimodales admite?

Gemini 3 Flash Preview admite cinco modalidades de entrada: texto, imagen, archivo, audio y video. El texto puede ser plano o estructurado; las imágenes pueden incluir fotos, diagramas y capturas de pantalla; los archivos cubren formatos como PDF y documentos; el audio incluye habla y música; el video puede procesarse con pistas tanto visuales como de audio. El modelo puede combinar múltiples modalidades en un solo prompt—por ejemplo, analizando un video mientras también lee un PDF adjunto. Esta versatilidad le permite manejar tareas complejas de medios mixtos sin requerir pipelines separados. Los tokens de entrada se cuentan según las reglas específicas del tokenizador de cada modalidad.

¿Cuál es el estado de la vista previa y qué tan estable es?

Gemini 3 Flash Preview es una versión preliminar del modelo Flash de tercera generación de Google. Como vista previa, puede experimentar cambios en el comportamiento, el rendimiento y la disponibilidad. Google normalmente actualiza los modelos de vista previa según los comentarios de los usuarios, y eventualmente pueden reemplazar los endpoints de vista previa con versiones estables. Aunque el modelo es funcional y adecuado para pruebas y desarrollo, los despliegues en producción deben monitorear las actualizaciones. OrcaRouter refleja el endpoint del proveedor, asegurando que cualquier cambio de Google se refleje rápidamente. El ID del modelo google/gemini-3-flash-preview se mantendrá consistente a menos que Google modifique su nomenclatura.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Precios

Entrada / 1M tokens	$0.500
Salida / 1M tokens	$3.00
Lectura caché / 1M	$0.050
Moneda	USD

Rendimiento

últimos 7 días

p50 TTFT

3.81 s

Velocidad de salida

851 tok/s

p95 TTFT

10.00 s

Tasa de error

Pruebas de referencia públicas

Última evaluación 2025-12-17

37.8

AA Coding

Mejor que el 47 % de los modelos comparados

35.0

AA Intelligence

Mejor que el 35 % de los modelos comparados

55.7

AA Math

Mejor que el 32 % de los modelos comparados

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

Fuente: artificialanalysis.ai

Más de Google

Ver todos los modelos de google →

Gemini 3.1 Pro PreviewInsignia

google/gemini-3.1-pro-preview

$2.00 entrada · $12.00 salida / 1M

1.05M ctx· calidad 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 entrada · $18.00 salida / 1M

1.05M ctx· calidad 10/10

Gemini 3.5 FlashMás barato

google/gemini-3.5-flash

$1.50 entrada · $9.00 salida / 1M

1.05M ctx· calidad 9/10

Preguntas frecuentes

¿Cuál es el costo de usar Gemini 3 Flash Preview?

El precio es de $0.50 por millón de tokens de entrada y $3.00 por millón de tokens de salida, facturados según la tarifa del proveedor sin margen añadido por OrcaRouter.

¿Cuál es el tamaño de la ventana de contexto?

La ventana de contexto es de 1,048,576 tokens de entrada y el modelo puede generar hasta 65,536 tokens de salida.

¿Cuáles son las modalidades de entrada compatibles?

Se aceptan como entrada texto, imagen, archivo, audio y video. La salida es solo texto.

¿Cómo se compara con Gemini 2 Flash?

Gemini 3 Flash Preview tiene una ventana de contexto más grande (1M frente a hasta 1M pero a menudo más pequeña), una puntuación MMLU-Pro más alta (88.2) y soporte multimodal expandido que incluye video. Es más rápido y más capaz para tareas complejas, pero Gemini 2 Flash es más barato por token.

¿Cómo maneja OrcaRouter la privacidad de los datos?

OrcaRouter envía sus solicitudes a la API de Google. El manejo de datos sigue la política de privacidad de Google. OrcaRouter no registra ni almacena su contenido más allá de lo necesario para procesar la solicitud. Revise las políticas de ambos proveedores para obtener más detalles.

¿Puedo llamar a Gemini 3 Flash Preview usando una API compatible con OpenAI?

Sí. Use la API de OrcaRouter en https://api.orcarouter.ai/v1 con el ID de modelo "google/gemini-3-flash-preview". La autenticación utiliza una clave de API de OrcaRouter. Los formatos de solicitud y respuesta siguen el esquema de Chat Completions de OpenAI.

¿Cuáles son las principales fortalezas del modelo?

Alta velocidad de inferencia, gran contexto de 1M de tokens, entrada multimodal (texto, imagen, archivo, audio, video), sólido benchmark MMLU-Pro (88.2) y bajo costo en comparación con modelos más grandes.

¿Está Gemini 3 Flash Preview disponible para producción?

Es una versión preliminar, lo que significa que puede tener cambios, disponibilidad intermitente o soporte limitado. Es adecuada para pruebas y desarrollo; para cargas de trabajo críticas de producción, considere usar la versión estable una vez que esté disponible.

¿Cómo estimo el uso de tokens para entradas multimodales?

Cada modalidad tiene su propia tokenización. Las imágenes, el audio y el video se dividen en tokens según la resolución y la duración. OrcaRouter informa el uso de tokens en la respuesta de la API. También puedes consultar la documentación de Google para conocer las reglas detalladas de conteo de tokens.

¿Qué sucede si excedo la ventana de contexto?

Las entradas que excedan 1.048.576 tokens se truncarán a partir del contenido más antiguo. El modelo ignorará los tokens sobrantes. Asegúrese de que sus mensajes se ajusten al límite monitoreando el total de tokens en su solicitud.

Insertar esta insignia

Pegar en tu artículo de blog

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•vía OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview en OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

¿Qué es Google Gemini 3 Flash Preview?

¿Quién es el público objetivo de este modelo?

¿Qué entradas multimodales admite?

¿Cuál es el estado de la vista previa y qué tan estable es?

¿Qué puede hacer Gemini 3 Flash Preview con texto e imágenes?

¿Cómo maneja el audio y el video?

¿Cuáles son los mejores casos de uso para este modelo Flash?

¿Cuándo podrías elegir un modelo más barato o más potente en su lugar?

¿Qué significa la puntuación MMLU-Pro de 88.2?

¿Qué tan rápido es Gemini 3 Flash Preview para inferencia?

¿Cuáles son las fortalezas clave del modelo según los benchmarks?

¿Cuáles son las limitaciones honestas de Gemini 3 Flash Preview?

¿Cuál es la estructura de precios de Gemini 3 Flash Preview?

¿Cómo se compara el precio con otros modelos?

¿Hay descuentos por almacenamiento en caché o precios por volumen?

¿Cómo llamo a Gemini 3 Flash Preview a través de la API de OrcaRouter?

¿Qué parámetros están disponibles al llamar al modelo?

Cómo migrar de la API nativa de Google a OrcaRouter?

¿Hay alguna diferencia en el formato de respuesta en comparación con OpenAI?

¿Cómo se compara Gemini 3 Flash Preview con Gemini 2 Flash?

¿Cómo se compara con GPT-4o?

¿Cómo se compara con otros modelos de Google?

Ejemplos de código

Precios

Rendimiento

Pruebas de referencia públicas

Más de Google

Preguntas frecuentes

Insertar esta insignia

Gemini 3 Flash Preview

Detalles del modelo

¿Qué es Google Gemini 3 Flash Preview?

¿Quién es el público objetivo de este modelo?

¿Qué entradas multimodales admite?

¿Cuál es el estado de la vista previa y qué tan estable es?

¿Qué puede hacer Gemini 3 Flash Preview con texto e imágenes?

¿Cómo maneja el audio y el video?

¿Cuáles son los mejores casos de uso para este modelo Flash?

¿Cuándo podrías elegir un modelo más barato o más potente en su lugar?

¿Qué significa la puntuación MMLU-Pro de 88.2?

¿Qué tan rápido es Gemini 3 Flash Preview para inferencia?

¿Cuáles son las fortalezas clave del modelo según los benchmarks?

¿Cuáles son las limitaciones honestas de Gemini 3 Flash Preview?

¿Cuál es la estructura de precios de Gemini 3 Flash Preview?

¿Cómo se compara el precio con otros modelos?

¿Hay descuentos por almacenamiento en caché o precios por volumen?

¿Cómo llamo a Gemini 3 Flash Preview a través de la API de OrcaRouter?

¿Qué parámetros están disponibles al llamar al modelo?

Cómo migrar de la API nativa de Google a OrcaRouter?

¿Hay alguna diferencia en el formato de respuesta en comparación con OpenAI?

¿Cómo se compara Gemini 3 Flash Preview con Gemini 2 Flash?

¿Cómo se compara con GPT-4o?

¿Cómo se compara con otros modelos de Google?

Ejemplos de código

Precios

Rendimiento

Pruebas de referencia públicas

Más de Google

Preguntas frecuentes

Insertar esta insignia