Google Gemini 3.1 Pro Preview Custom Tools – 1M de contexto, 95.6 τ²-Bench, multimodal vía OrcaRouter.
Google Gemini 3.1 Pro Preview Custom Tools es un modelo de lenguaje grande en fase de vista previa desarrollado por Google. Está diseñado para tareas que requieren razonamiento de formato largo, ventanas de contexto amplias e integración con herramientas externas. El modelo acepta entradas en formato de texto, audio, imagen, video y archivos, lo que lo convierte en una solución multimodal tanto para la comprensión como para la generación de contenido. A través de OrcaRouter, puedes llamar al modelo usando una API compatible con OpenAI en la URL base https://api.orcarouter.ai/v1 con el ID de modelo "google/gemini-3.1-pro-preview-customtools". Esta compatibilidad simplifica la integración para equipos que ya están familiarizados con el SDK de OpenAI o clientes similares. Al ser un modelo en vista previa, puede tener limitaciones en disponibilidad o rendimiento en comparación con las versiones estables.
Este modelo es adecuado para desarrolladores, científicos de datos y equipos empresariales que necesitan procesar documentos muy largos (hasta 1 millón de tokens) o combinar múltiples modalidades de entrada (texto, audio, imagen, video, archivos) en un solo paso de razonamiento. Es particularmente valioso para tareas que implican el uso de herramientas personalizadas, donde el modelo debe decidir cuándo y cómo llamar a funciones o APIs externas. Los equipos que trabajan en investigación, análisis legal, procesamiento de medios o automatización avanzada encontrarán útil el gran contexto y el sólido rendimiento en benchmarks. Debido a que es una vista previa, puede ser ideal para prototipado y evaluación en lugar de sistemas de producción que requieren tiempo de actividad o latencia garantizados.
El modelo ofrece una ventana de contexto de 1 048 576 tokens y una salida máxima de 65 536 tokens. Las modalidades de entrada incluyen texto, audio, imagen, video y cargas de archivos. La puntuación de referencia principal es 95,6 en τ²-Bench, una prueba de razonamiento en uso de herramientas. El precio es de $4,00 por cada 1M de tokens de entrada y $18,00 por cada 1M de tokens de salida, sin margen adicional cuando se accede a través de OrcaRouter. La API es compatible con OpenAI y el ID del modelo es «google/gemini-3.1-pro-preview-customtools». Al tratarse de una vista previa, refleja las capacidades más recientes, pero puede estar sujeta a cambios.
Gemini 3.1 Pro Preview Custom Tools acepta entrada en formatos de texto, audio, imagen, video y archivo. Esto permite incluir grabaciones de audio, fotografías, videoclips y documentos cargados junto con indicaciones de texto en una sola solicitud. El modelo puede razonar a través de estas modalidades para producir una salida de texto. Esta capacidad multimodal hace posible describir una imagen y hacer una pregunta sobre ella, transcribir audio mientras se realiza un análisis, o combinar un video con una instrucción textual. Los límites exactos de resolución, códec o tamaño de archivo no se proporcionan en los hechos disponibles, pero el modelo puede ingerir diversos medios de forma nativa.
La designación "Herramientas Personalizadas" significa que el modelo está optimizado para invocar funciones o API definidas por el usuario como parte de su razonamiento. En un flujo de trabajo típico, se proporciona un conjunto de definiciones de funciones (incluyendo nombres, parámetros y descripciones), y el modelo decide cuándo llamarlas para cumplir una solicitud. Esta capacidad permite flujos de trabajo autónomos, como consultar una base de datos, enviar un correo electrónico o ejecutar un fragmento de código. El modelo puede encadenar múltiples llamadas a herramientas. La alta puntuación τ²-Bench (95,6) indica un rendimiento sólido en tareas que requieren planificación y orquestación de herramientas.
El modelo admite una ventana de contexto de 1.048.576 tokens (aproximadamente equivalente a 1 millón de tokens). Esto permite pasar libros completos, bases de código extensas, conversaciones de múltiples turnos o registros largos como contexto. La salida máxima es de 65.536 tokens por solicitud. Estos tamaños se encuentran entre los más grandes disponibles en el panorama actual de modelos. El contexto amplio es útil para tareas como resumir una transcripción completa, responder preguntas sobre un conjunto extenso de documentos o mantener un historial de conversación muy largo sin truncamiento.
Debido a que Gemini 3.1 Pro Preview Custom Tools tiene un precio de $4.00 por cada 1M de tokens de entrada y $18.00 por cada 1M de tokens de salida, se trata de una oferta premium. Para tareas más simples, como clasificación de texto de formato corto, resúmenes básicos o chat de una sola instancia, un modelo más pequeño y económico puede ser más rentable. Considere alternativas de OrcaRouter como Gemini 1.5 Flash (menor costo, menor latencia) u otros modelos ligeros si no necesita la ventana de contexto de 1M, la entrada multimodal o el rendimiento de referencia de uso de herramientas. Use este modelo cuando la complejidad de la tarea justifique el mayor costo por token.
El modelo obtuvo una puntuación destacada de 95.6 en τ²-Bench (τ²-Bench). Este benchmark evalúa la capacidad de un modelo para realizar razonamiento de uso de herramientas: planificar y ejecutar secuencias de llamadas a funciones para completar una tarea realista. La alta puntuación sugiere una fuerte competencia en la finalización autónoma de tareas y la toma de decisiones. τ²-Bench es un benchmark más nuevo que se centra en la complejidad de escenarios del mundo real. Una puntuación de 95.6 se considera muy alta, aunque debes tener en cuenta que ningún benchmark por sí solo captura todos los aspectos de la calidad del modelo. El modelo puede tener un rendimiento diferente en otros benchmarks no listados aquí.
Basado en el resultado de τ²-Bench, el modelo sobresale en tareas que requieren razonamiento estructurado y orquestación de herramientas. Esto incluye recuperación en múltiples pasos, transformación de datos y llamadas a API. La gran ventana de contexto también le permite manejar instrucciones muy largas o datos externos sin perder coherencia. La capacidad de entrada multimodal es otra fortaleza, permitiéndole razonar a través de diferentes tipos de medios. Para casos de uso como analizar un videoclip y responder preguntas sobre él, o procesar un archivo de audio junto con una consulta de texto, este modelo está bien posicionado en comparación con alternativas solo de texto.
Ningún benchmark o modelo es perfecto. La puntuación de 95.6 en τ²-Bench no garantiza el mismo rendimiento en todas las tareas del mundo real, especialmente aquellas fuera del alcance del benchmark. El modelo puede tener un rendimiento inferior en tareas que requieren conocimientos de dominio muy específicos o en evaluaciones orientadas a la seguridad que no están cubiertas por τ²-Bench. Como modelo de vista previa, puede tener una latencia más alta o una confiabilidad menor que un modelo completamente lanzado. Los datos disponibles no incluyen cifras de latencia, por lo que debe probar con sus propias cargas de trabajo. Además, la gran ventana de contexto puede aumentar el tiempo de procesamiento y el costo, y no todas las tareas se benefician de la capacidad completa de un millón de tokens.
No se proporcionan números exactos de latencia en los datos disponibles para Gemini 3.1 Pro Preview Custom Tools. En general, los modelos con una ventana de contexto muy grande (de más de 1 millón de tokens) pueden tardar más en procesar solicitudes, especialmente aquellas que usan el contexto completo. La latencia también depende de la complejidad de la solicitud, la cantidad de llamadas a herramientas y la carga actual del servidor. OrcaRouter puede ofrecer respuestas en streaming para reducir el tiempo hasta el primer token. Para aplicaciones en tiempo real, es posible que desees comparar el rendimiento con modelos más pequeños. Considera realizar tus propias pruebas de latencia con indicaciones típicas para determinar si la velocidad cumple con tus requisitos.
El precio de Gemini 3.1 Pro Preview Custom Tools es de $4.00 por cada 1 millón de tokens de entrada y $18.00 por cada 1 millón de tokens de salida. Estas tarifas se facturan según la tarifa del proveedor, sin margen adicional, cuando se accede a través de OrcaRouter. Eso significa que el precio que ves es el que cobra Google, sin ningún cargo adicional de OrcaRouter. Los tokens de entrada incluyen todos los tokens del mensaje (texto, tokens de imagen, tokens de audio, etc.). Los tokens de salida son la respuesta generada. La salida máxima del modelo es de 65 536 tokens, por lo que una sola solicitud podría costar hasta 65 536 / 1 000 000 * 18.00 = aproximadamente $1.18 en tokens de salida, más los costos de tokens de entrada.
"Zero markup" significa que OrcaRouter traslada el costo exacto por token del proveedor (Google) a ti, sin añadir ningún recargo. Pagas $4.00 por cada 1M de tokens de entrada y $18.00 por cada 1M de tokens de salida, la misma tarifa que si estuvieras llamando directamente a la API de Google. OrcaRouter puede tener tarifas de suscripción o uso separadas para el servicio de puerta de enlace, pero el precio por token del modelo no está inflado. Esta estructura de precios es transparente y te ayuda a presupuestar con precisión. Siempre revisa los términos actuales de OrcaRouter para ver si hay cargos adicionales.
El alto coste por token significa que debes estimar cuidadosamente tu uso. Para indicaciones que utilicen la ventana de contexto completa de 1M, los costes de entrada pueden alcanzar los $4.00 por solicitud. Si tu tarea puede realizarse con un contexto más pequeño, considera truncar o usar un modelo más barato. Caching no se menciona en los datos disponibles; si OrcaRouter ofrece almacenamiento en caché de indicaciones, podría reducir los costes para entradas repetidas. Además, debido a que el modelo es una vista previa, los precios pueden cambiar cuando se lance una versión estable. Evalúa el recuento típico de tokens de tu carga de trabajo para decidir si el coste está justificado.
Accedes al modelo a través de la API compatible con OpenAI de OrcaRouter. Establece tu URL base en `https://api.orcarouter.ai/v1` y usa el ID de modelo `google/gemini-3.1-pro-preview-customtools`. La API acepta formatos de solicitud estándar al estilo de OpenAI. Un ejemplo usando la librería openai de Python: ``` import openai client = openai.OpenAI(base_url="https://api.orcarouter.ai/v1", api_key="YOUR_ORCAROUTER_KEY") response = client.chat.completions.create( model="google/gemini-3.1-pro-preview-customtools", messages=[{"role": "user", "content": "Hello"}] ) ``` Necesitas una clave API de OrcaRouter válida. La autenticación es mediante el encabezado `Authorization`.
Dado que la API es compatible con OpenAI, puedes usar parámetros estándar como `temperature`, `top_p`, `max_tokens`, `stop`, `frequency_penalty`, `presence_penalty` y `stream`. Para solicitudes multimodales, puedes incluir imágenes, audio, video o archivos en el contenido del mensaje usando el formato de arreglo. Para el uso de herramientas, define funciones en el parámetro `tools` como una lista de objetos JSON. El modelo puede devolver `tool_calls` en la respuesta. Los parámetros específicos de la API propia de Google (como `safetySettings`) pueden o no estar disponibles; consulta la documentación de OrcaRouter para más detalles. El soporte exacto de parámetros puede variar para modelos en vista previa.
Migrar desde la API estándar de OpenAI es sencillo. Cambia `base_url` a `https://api.orcarouter.ai/v1` y actualiza el parámetro `model` a `google/gemini-3.1-pro-preview-customtools`. Reemplaza tu clave API por una clave de OrcaRouter. La mayoría del código que usa `openai.ChatCompletion.create` o el más reciente `client.chat.completions.create` funcionará con cambios mínimos. Si usas llamadas a herramientas, el formato es idéntico al de OpenAI. Sin embargo, ten en cuenta que este modelo tiene un tokenizador diferente y puede producir resultados distintos para el mismo prompt. Realiza pruebas exhaustivas antes de cambiar.
OrcaRouter utiliza autenticación mediante clave API. Incluye tu clave en el encabezado de la solicitud como `Authorization: Bearer YOUR_ORCAROUTER_API_KEY`. Obtienes una clave al registrarte en OrcaRouter. La clave debe mantenerse en secreto y no exponerse en código del lado del cliente. El método de autenticación exacto puede variar; consulta siempre la documentación actual de la API de OrcaRouter. Algunos endpoints pueden admitir métodos de autenticación adicionales, pero el endpoint compatible con OpenAI utiliza el patrón estándar de bearer token. Asegúrate de que tus solicitudes se envíen a través de HTTPS.
Gemini 1.5 Pro también admite una ventana de contexto de 1M tokens y entrada multimodal, pero el 3.1 Pro Preview Custom Tools logró una puntuación τ²-Bench de 95.6, lo que representa una mejora significativa con respecto a la serie 1.5 (no se proporcionan números exactos para 1.5). La optimización "Custom Tools" es el factor diferenciador clave, lo que indica un mejor rendimiento en las tareas de uso de herramientas. El precio es más alto para el modelo de vista previa: Gemini 1.5 Pro es generalmente más barato. Si no necesita el rendimiento más reciente de uso de herramientas, Gemini 1.5 Pro puede ser una opción más rentable. Debido a que el 3.1 Pro es una vista previa, puede tener menos estabilidad o garantía de disponibilidad que el 1.5 Pro estable.
GPT‑4o también admite entrada multimodal y uso de herramientas, pero su ventana de contexto suele ser de 128k tokens—mucho menor que los 1M tokens de este modelo. La puntuación de τ²-Bench para GPT‑4o no se proporciona en los hechos disponibles, por lo que no es posible una comparación directa. En general, Gemini 3.1 Pro Preview Custom Tools ofrece una ventana de contexto significativamente más grande, lo que lo hace más adecuado para tareas de documentos largos. GPT‑4o puede tener un mejor rendimiento en ciertos puntos de referencia de lenguaje o un soporte de ecosistema más amplio. Los precios de GPT‑4o también son diferentes; compare los costos por token, pero tenga en cuenta que el costo de salida de este modelo ($18/M) es relativamente alto.
Claude 3 Opus admite una ventana de contexto de 200k tokens, mucho menos que el 1M de Gemini 3.1 Pro Preview. Puntos de referencia como τ²-Bench no se suelen reportar para Claude, por lo que las comparaciones directas son especulativas. Claude es conocido por su sólido razonamiento y seguimiento de instrucciones. Elegir entre ellos depende de tu necesidad de un contexto de 1M y entrada multimodal versus fortalezas específicas en seguridad, estilo de escritura o ecosistema. Si tu caso de uso requiere procesar documentos muy grandes o múltiples tipos de medios, el contexto más grande y el soporte multimodal del modelo Gemini son ventajas. El costo y la disponibilidad a través de OrcaRouter también son factores.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview-customtools",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| Entrada / 1M tokens | $4.00 |
| Salida / 1M tokens | $18.00 |
| Lectura caché / 1M | $0.400 |
| Moneda | USD |