Google Gemini 3.1 Pro Preview Custom Tools – 1M konteks, 95.6 τ²-Bench, multimodal melalui OrcaRouter.
Google Gemini 3.1 Pro Preview Custom Tools adalah model bahasa besar tahap pratinjau yang dikembangkan oleh Google. Model ini dirancang untuk tugas-tugas yang memerlukan penalaran bentuk panjang, jendela konteks besar, dan integrasi dengan alat eksternal. Model ini menerima masukan dalam format teks, audio, gambar, video, dan file, menjadikannya solusi multimodal untuk pemahaman dan pembuatan konten. Melalui OrcaRouter, Anda dapat memanggil model menggunakan API yang kompatibel dengan OpenAI di URL dasar https://api.orcarouter.ai/v1 dengan ID model "google/gemini-3.1-pro-preview-customtools". Kompatibilitas ini menyederhanakan integrasi bagi tim yang sudah terbiasa dengan OpenAI SDK atau klien serupa. Sebagai model pratinjau, model ini mungkin memiliki keterbatasan dalam ketersediaan atau kinerja dibandingkan dengan rilis stabil.
Model ini cocok untuk pengembang, ilmuwan data, dan tim perusahaan yang perlu memproses dokumen yang sangat panjang (hingga 1 juta token) atau menggabungkan beberapa modalitas input (teks, audio, gambar, video, file) dalam satu langkah penalaran. Model ini sangat bernilai untuk tugas-tugas yang melibatkan penggunaan alat kustom—di mana model harus memutuskan kapan dan bagaimana memanggil fungsi atau API eksternal. Tim yang bekerja pada riset, analisis hukum, pemrosesan media, atau otomatisasi tingkat lanjut akan merasakan manfaat dari konteks besar dan kinerja benchmark yang kuat. Karena ini adalah pratayang, model ini mungkin ideal untuk pembuatan purwarupa dan evaluasi, bukan untuk sistem produksi yang membutuhkan jaminan waktu aktif atau latensi.
Model ini menawarkan jendela konteks sebesar 1,048,576 token dan output maksimum sebesar 65,536 token. Modalitas input mencakup teks, audio, gambar, video, dan unggahan file. Skor tolok ukur utama adalah 95.6 pada τ²-Bench, sebuah tes penalaran penggunaan alat. Harga adalah $4.00 per 1M token input dan $18.00 per 1M token output, dengan tanpa markup saat diakses melalui OrcaRouter. API ini kompatibel dengan OpenAI, dan ID modelnya adalah "google/gemini-3.1-pro-preview-customtools". Sebagai pratinjau, ini mencerminkan kemampuan terbaru namun dapat berubah sewaktu-waktu.
Gemini 3.1 Pro Preview Custom Tools menerima input dalam format teks, audio, gambar, video, dan file. Ini memungkinkan Anda untuk menyertakan rekaman audio, foto, klip video, dan dokumen yang diunggah bersama dengan perintah teks dalam satu permintaan. Model ini dapat bernalar di seluruh modalitas ini untuk menghasilkan output teks. Kemampuan multimodal ini memungkinkan untuk mendeskripsikan gambar dan mengajukan pertanyaan tentangnya, mentranskripsikan audio sambil melakukan analisis, atau menggabungkan video dengan instruksi teks. Batasan resolusi, codec, atau ukuran file yang tepat tidak diberikan dalam fakta yang tersedia, tetapi model ini dapat menyerap berbagai media secara native.
Penunjukan "Custom Tools" berarti model dioptimalkan untuk memanggil fungsi atau API yang ditentukan pengguna sebagai bagian dari penalarannya. Dalam alur kerja yang umum, Anda menyediakan serangkaian definisi fungsi (termasuk nama, parameter, dan deskripsi), dan model memutuskan kapan harus memanggilnya untuk memenuhi permintaan. Kemampuan ini memungkinkan alur kerja otonom seperti melakukan kueri pada basis data, mengirim email, atau menjalankan potongan kode. Model dapat merangkai beberapa panggilan alat secara berurutan. Skor τ²-Bench yang tinggi (95,6) menunjukkan kinerja yang kuat pada tugas-tugas yang memerlukan perencanaan dan orkestrasi alat.
Model ini mendukung jendela konteks sebesar 1.048.576 token (kira-kira setara dengan 1 juta token). Hal ini memungkinkan Anda untuk memasukkan buku utuh, basis kode yang panjang, percakapan multi‑giliran, atau log yang ekstensif sebagai konteks. Output maksimum adalah 65.536 token per permintaan. Ukuran-ukuran ini termasuk yang terbesar yang tersedia di lanskap model saat ini. Konteks yang besar berguna untuk tugas seperti merangkum transkrip lengkap, menjawab pertanyaan berdasarkan kumpulan dokumen yang besar, atau mempertahankan riwayat percakapan yang sangat panjang tanpa pemotongan.
Karena Gemini 3.1 Pro Preview Custom Tools dibanderol seharga $4,00 per 1M token input dan $18,00 per 1M token output, itu adalah penawaran premium. Untuk tugas yang lebih sederhana—seperti klasifikasi teks bentuk pendek, perangkuman dasar, atau obrolan satu putaran—model yang lebih kecil dan lebih murah mungkin lebih hemat biaya. Pertimbangkan alternatif dari OrcaRouter seperti Gemini 1.5 Flash (biaya lebih rendah, latensi lebih rendah) atau model ringan lainnya jika Anda tidak memerlukan jendela konteks 1M, input multimodal, atau performa tolok ukur penggunaan alat. Gunakan model ini ketika kompleksitas tugas membenarkan biaya per token yang lebih tinggi.
Model ini mencapai skor headline sebesar 95,6 pada τ²-Bench (τ²-Bench). Tolok ukur ini mengevaluasi kemampuan model dalam melakukan penalaran penggunaan alat: merencanakan dan mengeksekusi urutan panggilan fungsi untuk menyelesaikan tugas yang realistis. Skor tinggi ini menunjukkan kompetensi yang kuat dalam penyelesaian tugas secara otonom dan pengambilan keputusan. τ²-Bench adalah tolok ukur yang lebih baru yang berfokus pada kompleksitas skenario dunia nyata. Skor 95,6 dianggap sangat tinggi, meskipun perlu dicatat bahwa tidak ada satu pun tolok ukur yang sepenuhnya mencakup semua aspek kualitas model. Model mungkin memiliki kinerja yang berbeda pada tolok ukur lain yang tidak tercantum di sini.
Berdasarkan hasil τ²-Bench, model ini unggul dalam tugas yang memerlukan penalaran terstruktur dan orkestrasi alat, termasuk pengambilan multi‑langkah, transformasi data, dan pemanggilan API. Jendela konteks yang besar juga memungkinkannya menangani instruksi yang sangat panjang atau data eksternal tanpa kehilangan koherensi. Kemampuan input multimodal merupakan keunggulan lain, yang memungkinkannya menalar lintas berbagai jenis media. Untuk kasus penggunaan seperti menganalisis klip video dan menjawab pertanyaan tentangnya, atau memproses file audio bersama kueri teks, model ini berada di posisi yang lebih baik dibandingkan alternatif berbasis teks saja.
Tidak ada tolok ukur atau model yang sempurna. Skor τ²-Bench sebesar 95,6 tidak menjamin kinerja yang sama pada setiap tugas dunia nyata, terutama yang berada di luar cakupan tolok ukur tersebut. Model mungkin berkinerja lebih rendah pada tugas yang memerlukan pengetahuan domain yang sangat spesifik atau pada evaluasi berorientasi keselamatan yang tidak tercakup oleh τ²-Bench. Sebagai model pratinjau, model ini mungkin memiliki latensi yang lebih tinggi atau keandalan yang lebih rendah dibandingkan model yang dirilis sepenuhnya. Fakta yang tersedia tidak mencakup angka latensi, jadi Anda harus menguji dengan beban kerja Anda sendiri. Selain itu, jendela konteks yang besar dapat meningkatkan waktu dan biaya pemrosesan, dan tidak semua tugas mendapat manfaat dari kapasitas penuh satu juta token.
Angka latensi yang tepat tidak disediakan dalam fakta yang tersedia untuk Gemini 3.1 Pro Preview Custom Tools. Secara umum, model dengan jendela konteks yang sangat besar (lebih dari 1 juta token) dapat membutuhkan waktu lebih lama untuk memproses permintaan, terutama yang menggunakan konteks penuh. Latensi juga tergantung pada kompleksitas permintaan, jumlah panggilan alat, dan beban server saat ini. OrcaRouter mungkin menawarkan respons streaming untuk mengurangi waktu hingga token pertama. Untuk aplikasi waktu nyata, Anda mungkin ingin membandingkan kinerja dengan model yang lebih kecil. Pertimbangkan untuk melakukan pengujian latensi sendiri dengan prompt yang umum untuk menentukan apakah kecepatannya memenuhi persyaratan Anda.
Harga untuk Gemini 3.1 Pro Preview Custom Tools adalah $4,00 per 1 juta token input dan $18,00 per 1 juta token output. Tarif ini ditagih berdasarkan tarif penyedia tanpa markup saat diakses melalui OrcaRouter. Artinya, harga yang Anda lihat adalah harga yang dikenakan Google, tanpa biaya tambahan dari OrcaRouter. Token input mencakup semua token dalam prompt (token teks, token gambar, token audio, dll.). Token output adalah respons yang dihasilkan. Output maksimum model adalah 65.536 token, sehingga satu permintaan dapat menghabiskan biaya hingga 65.536 / 1.000.000 * 18,00 = sekitar $1,18 untuk token output, ditambah biaya token input.
"Markup nol" berarti OrcaRouter meneruskan biaya per token yang tepat dari penyedia (Google) kepada Anda, tanpa menambahkan biaya tambahan. Anda membayar $4.00 per 1 juta token input dan $18.00 per 1 juta token output—tarif yang sama seperti jika Anda memanggil API Google secara langsung. OrcaRouter mungkin memiliki biaya langganan atau penggunaan terpisah untuk layanan gateway, tetapi harga per token model tidak dinaikkan. Struktur harga ini transparan dan membantu Anda menganggarkan dengan akurat. Selalu periksa persyaratan terkini OrcaRouter untuk mengetahui biaya tambahan.
Biaya per‑token yang tinggi berarti Anda harus memperkirakan penggunaan Anda dengan hati-hati. Untuk prompt yang menggunakan jendela konteks penuh 1M, biaya input bisa mencapai $4,00 per permintaan. Jika tugas Anda dapat diselesaikan dengan konteks yang lebih kecil, pertimbangkan untuk memotong atau menggunakan model yang lebih murah. Caching tidak disebutkan dalam fakta yang tersedia; jika OrcaRouter menawarkan prompt caching, hal itu dapat mengurangi biaya untuk input yang berulang. Selain itu, karena model ini adalah pratinjau, harga dapat berubah ketika versi stabil dirilis. Evaluasi jumlah token tipikal dari beban kerja Anda untuk memutuskan apakah biaya tersebut dapat dibenarkan.
Anda mengakses model melalui API OrcaRouter yang kompatibel dengan OpenAI. Atur URL dasar Anda ke `https://api.orcarouter.ai/v1` dan gunakan ID model `google/gemini-3.1-pro-preview-customtools`. API ini menerima format permintaan standar gaya OpenAI. Contoh menggunakan pustaka openai Python: ``` import openai client = openai.OpenAI(base_url="https://api.orcarouter.ai/v1", api_key="YOUR_ORCAROUTER_KEY") response = client.chat.completions.create( model="google/gemini-3.1-pro-preview-customtools", messages=[{"role": "user", "content": "Hello"}] ) ``` Anda memerlukan kunci API OrcaRouter yang valid. Autentikasi dilakukan melalui header `Authorization`.
Karena API ini kompatibel dengan OpenAI, Anda dapat menggunakan parameter standar seperti `temperature`, `top_p`, `max_tokens`, `stop`, `frequency_penalty`, `presence_penalty`, dan `stream`. Untuk permintaan multimodal, Anda dapat menyertakan gambar, audio, video, atau file dalam konten pesan menggunakan format array. Untuk penggunaan alat, definisikan fungsi dalam parameter `tools` sebagai daftar objek JSON. Model dapat mengembalikan `tool_calls` dalam respons. Parameter khusus untuk API milik Google (seperti `safetySettings`) mungkin tersedia atau tidak; konsultasikan dokumentasi OrcaRouter untuk detailnya. Dukungan parameter yang tepat dapat bervariasi untuk model pratinjau.
Migrasi dari API OpenAI standar cukup mudah. Ubah `base_url` menjadi `https://api.orcarouter.ai/v1` dan perbarui parameter `model` menjadi `google/gemini-3.1-pro-preview-customtools`. Ganti kunci API Anda dengan kunci OrcaRouter. Sebagian besar kode yang menggunakan `openai.ChatCompletion.create` atau `client.chat.completions.create` yang lebih baru akan bekerja dengan perubahan minimal. Jika Anda menggunakan panggilan alat, formatnya identik dengan OpenAI. Namun, perlu diketahui bahwa model ini memiliki tokenizer yang berbeda dan dapat menghasilkan output yang berbeda untuk prompt yang sama. Uji secara menyeluruh sebelum beralih.
OrcaRouter menggunakan autentikasi kunci API. Sertakan kunci Anda di header permintaan sebagai `Authorization: Bearer YOUR_ORCAROUTER_API_KEY`. Anda memperoleh kunci dengan mendaftar ke OrcaRouter. Kunci harus dijaga kerahasiaannya dan tidak boleh diekspos dalam kode sisi klien. Metode autentikasi yang tepat dapat bervariasi; selalu rujuk ke dokumentasi API OrcaRouter saat ini. Beberapa titik akhir mungkin mendukung metode autentikasi tambahan, tetapi titik akhir yang kompatibel dengan OpenAI menggunakan pola bearer token standar. Pastikan permintaan Anda dikirim melalui HTTPS.
Gemini 1.5 Pro juga mendukung jendela konteks 1M token dan input multimodal, tetapi 3.1 Pro Preview Custom Tools mencapai skor τ²-Bench sebesar 95,6, yang merupakan peningkatan signifikan dibandingkan seri 1.5 (angka pasti untuk 1.5 tidak diberikan). Optimasi "Custom Tools" adalah pembeda utama, yang menunjukkan performa lebih baik pada tugas penggunaan alat. Harga untuk model pratinjau lebih tinggi: Gemini 1.5 Pro biasanya lebih murah. Jika Anda tidak memerlukan performa penggunaan alat terbaru, Gemini 1.5 Pro mungkin menjadi pilihan yang lebih hemat biaya. Karena 3.1 Pro adalah pratinjau, stabilitas atau jaminan waktu aktifnya mungkin lebih rendah dibandingkan 1.5 Pro yang stabil.
GPT‑4o juga mendukung input multimodal dan penggunaan alat, tetapi jendela konteksnya biasanya 128k token—jauh lebih kecil dari 1M token model ini. Skor τ²-Bench untuk GPT‑4o tidak tersedia dalam fakta yang ada, sehingga perbandingan langsung tidak memungkinkan. Secara umum, Gemini 3.1 Pro Preview Custom Tools menawarkan jendela konteks yang jauh lebih besar, sehingga lebih cocok untuk tugas dokumen panjang. GPT‑4o mungkin memiliki kinerja yang lebih baik pada tolok ukur bahasa tertentu atau dukungan ekosistem yang lebih luas. Harga untuk GPT‑4o juga berbeda; bandingkan biaya per token, tetapi perhatikan bahwa biaya output model ini ($18/M) relatif tinggi.
Claude 3 Opus mendukung jendela konteks sebesar 200k token, jauh lebih kecil dari 1M yang dimiliki Gemini 3.1 Pro Preview. Tolok ukur seperti τ²-Bench biasanya tidak dilaporkan untuk Claude, sehingga perbandingan langsung bersifat spekulatif. Claude dikenal karena penalaran yang kuat dan kemampuannya mengikuti instruksi. Memilih di antara keduanya tergantung pada kebutuhan Anda akan konteks 1M dan input multimodal versus kekuatan spesifik dalam hal keamanan, gaya penulisan, atau ekosistem. Jika kasus penggunaan Anda memerlukan pemrosesan dokumen yang sangat besar atau berbagai jenis media, konteks yang lebih besar dan dukungan multimodal dari model Gemini adalah keuntungan. Biaya dan ketersediaan melalui OrcaRouter juga menjadi faktor.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview-customtools",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| Input / 1M token | $4.00 |
| Output / 1M token | $18.00 |
| Baca cache / 1M | $0.400 |
| Mata uang | USD |