Gemini 3.1 Pro Preview

google/gemini-3.1-pro-preview
InsigniaDestacado
por Google · 2026-02-19

Google Gemini 3.1 Pro Preview: modelo multimodal insignia con ventana de contexto de 1M y puntuación de 95.6 τ²-Bench, accedido mediante la API de OrcaRouter.

ctx1.05M tokens
Entradaaudio + file + image + text + video
Salidatext
p50 TTFT5.71 s
ENTRADA$2.00/ 1M tokens
SALIDA$12.00/ 1M tokens
p50 TTFT5.71 s7 d
p95 TTFT10.00 s7 d
TRÁFICO5.1Mtokens / 7 d

Detalles del modelo

¿Qué es Google Gemini 3.1 Pro Preview?

Google Gemini 3.1 Pro Preview es un modelo insignia de Google, ofrecido en forma de vista previa. Es un modelo multimodal capaz de procesar entradas de texto, imagen, video, audio y archivos. El modelo está categorizado como nivel insignia, lo que indica que está diseñado para aplicaciones de alta demanda y complejas donde el rendimiento y la capacidad son críticos. Como vista previa, puede tener limitaciones en estabilidad o disponibilidad en comparación con las versiones estables. El acceso se proporciona a través de la API de OrcaRouter.

¿Quién debería usar este modelo?

Este modelo está diseñado para desarrolladores y empresas que necesitan manejar grandes ventanas de contexto de hasta 1,048,576 tokens y requieren comprensión multimodal. Los casos de uso incluyen análisis de documentos largos, moderación de videos, chatbots avanzados con memoria de conversaciones completas y extracción compleja de datos de medios mixtos. El estado de vista previa lo hace adecuado para experimentación e integración temprana, pero los despliegues en producción deben evaluar la estabilidad. También es ideal para equipos que ya utilizan la API compatible con OpenAI de OrcaRouter y que desean probar las últimas capacidades emblemáticas de Google.

¿Cuáles son las especificaciones clave?

El modelo admite una ventana de contexto de 1,048,576 tokens (entrada) y una salida máxima de 65,536 tokens. Acepta entrada en múltiples modalidades: audio, archivo (p. ej., PDF, archivos de código), imagen, texto y video. La puntuación de referencia principal es 95.6 en τ²-Bench, una métrica que mide el rendimiento en la finalización de tareas. El modelo está clasificado como nivel insignia por su proveedor, Google. Se accede a través de la API de OrcaRouter en la URL base https://api.orcarouter.ai/v1 con el ID de modelo "google/gemini-3.1-pro-preview".

¿Cómo se compara con otras vistas previas de Gemini?

Como versión preliminar de Gemini 3.1 Pro, este modelo se sitúa al frente de la oferta actual de Google entre las versiones de vista previa. Ofrece una ventana de contexto significativamente mayor (1M tokens) y límites de salida más altos (65K tokens) en comparación con los modelos anteriores de Gemini 2.0 o las vistas previas de Gemini 3.0. La puntuación de 95.6 en el benchmark τ²-Bench proporciona un punto de referencia cuantitativo para el rendimiento orientado a tareas. En comparación con otros modelos en vista previa de Google, este está dirigido a los casos de uso más exigentes, donde se requiere tanto amplitud de contexto como profundidad de razonamiento.

Ejemplos de código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Precios

NivelEntrada / 1M tokensSalida / 1M tokensLectura caché / 1MEscritura caché / 1M
200K$2.00$12.00$0.200$0.375
$4.00$18.00$0.400$0.375
El nivel se selecciona por el número de tokens de entrada de cada solicitud

Rendimiento

p50 TTFT
5.71 s
Velocidad de salida
429 tok/s
p95 TTFT
10.00 s
Tasa de error
0%

Pruebas de referencia públicas

55.5
AA Coding
Mejor que el 75 % de los modelos comparados
57.2
AA Intelligence
Mejor que el 80 % de los modelos comparados
GPQA Diamond
94.1
Humanity's Last Exam
44.7
IFBench
77.1
Long-Context Recall
72.7
SciCode
58.9
TerminalBench Hard
53.8
τ²-Bench
95.6
Fuente: artificialanalysis.ai

Preguntas frecuentes

¿Cuál es el costo de usar Gemini 3.1 Pro Preview en OrcaRouter?
Los detalles de precios no se proporcionan en los hechos disponibles. Como modelo insignia, normalmente tiene un precio más alto por token que los modelos más pequeños. Los costos dependen del uso de tokens de entrada y salida. Consulte la página de precios actual de OrcaRouter para conocer las tarifas exactas.
¿Qué tan grande es la ventana de contexto?
El modelo admite una ventana de contexto de 1,048,576 tokens (entrada). Esto significa que puedes enviar documentos muy largos, código o historial de conversación en una sola solicitud. La salida máxima es de 65,536 tokens.
¿Cuáles son las principales fortalezas de este modelo?
Sus principales fortalezas incluyen una ventana de contexto masiva (1M de tokens), un límite de salida alto (65K tokens), entrada multimodal (audio, archivo, imagen, texto, video) y una puntuación τ²-Bench de 95.6, que indica una alta precisión en tareas agentivas.
¿Cómo se compara Gemini 3.1 Pro Preview con los modelos Gemini 2.0?
Ofrece una ventana de contexto mucho más grande (1M frente a hasta 32K) y un límite de salida mayor (65K frente a 8K). También admite más modalidades de entrada. Sin embargo, es una versión preliminar y puede tener menos estabilidad que las versiones estables de Gemini 2.0.
¿Maneja OrcaRouter la privacidad de datos para las solicitudes?
Las políticas de manejo de datos no están especificadas en los hechos proporcionados. Los usuarios deben revisar la documentación de procesamiento de datos y privacidad de OrcaRouter para entender cómo se tratan los datos de entrada y salida.
¿Cómo llamo a este modelo a través de una API compatible con OpenAI?
Usa la URL base https://api.orcarouter.ai/v1 y establece el ID del modelo en "google/gemini-3.1-pro-preview". La API sigue el formato estándar de completaciones de chat de OpenAI. La autenticación requiere una clave API de OrcaRouter.
¿Qué es la puntuación τ²-Bench y por qué importa?
El modelo obtuvo un 95.6 en τ²-Bench, un punto de referencia que mide el rendimiento en la finalización de tareas. Esta métrica cuantitativa refleja la capacidad del modelo para manejar tareas complejas y de varios pasos con precisión.
¿Puedo usar este modelo para producción?
Como modelo de vista previa, está destinado para pruebas y experimentación. Puede tener límites de velocidad más bajos, menor fiabilidad y cambios continuos. Para producción, considere usar un modelo estable, no de vista previa.
¿Qué modalidades de entrada están soportadas?
El modelo admite entradas de audio, archivos (por ejemplo, PDFs, archivos de código), imágenes, texto y video. Todos pueden incluirse en una sola solicitud para razonamiento cross-modal.
¿Está disponible el modelo para respuestas en streaming?
Los hechos disponibles no especifican soporte para streaming. Es probable que la API de OrcaRouter admita streaming para modelos compatibles, pero para esta vista previa, consulte la documentación para conocer la disponibilidad del parámetro de streaming.

Insertar esta insignia

Google: Gemini 3.1 Pro Preview$2.00/M in5707ms p50vía OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview en OrcaRouter" /> </a>
Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)