Google Gemini 3.1 Pro Preview: model multimodal unggulan dengan jendela konteks 1M dan skor τ²-Bench 95.6, diakses melalui API OrcaRouter.
Google Gemini 3.1 Pro Preview adalah model unggulan dari Google, yang ditawarkan dalam bentuk pratayang. Model ini merupakan model multimodal yang mampu memproses input teks, gambar, video, audio, dan file. Model ini dikategorikan sebagai tingkat unggulan, yang menunjukkan bahwa model ini dirancang untuk aplikasi dengan permintaan tinggi dan kompleks di mana kinerja dan kapasitas sangat penting. Sebagai pratayang, model ini mungkin memiliki keterbatasan dalam stabilitas atau ketersediaan dibandingkan dengan rilis stabil. Akses disediakan melalui OrcaRouter API.
Model ini ditujukan bagi pengembang dan perusahaan yang perlu menangani jendela konteks besar hingga 1.048.576 token serta memerlukan pemahaman multimodal. Kasus penggunaannya meliputi analisis dokumen panjang, moderasi video, chatbot canggih dengan memori percakapan penuh, dan ekstraksi data kompleks dari media campuran. Status pratinjau membuatnya cocok untuk eksperimen dan integrasi awal, namun penerapan produksi perlu mengevaluasi stabilitas. Model ini juga ideal bagi tim yang sudah menggunakan API kompatibel dengan OpenAI milik OrcaRouter dan ingin menguji kemampuan unggulan terbaru Google.
Model ini mendukung jendela konteks sebesar 1,048,576 token (input) dan output maksimum sebesar 65,536 token. Ia menerima input dalam berbagai modalitas: audio, file (misalnya, PDF, file kode), gambar, teks, dan video. Skor tolok ukur utama adalah 95.6 pada τ²-Bench, sebuah metrik yang mengukur kinerja penyelesaian tugas. Model ini diklasifikasikan sebagai tier unggulan oleh penyedianya, Google. Model ini diakses melalui API OrcaRouter di URL dasar https://api.orcarouter.ai/v1 dengan ID model "google/gemini-3.1-pro-preview".
Sebagai versi pratinjau Gemini 3.1 Pro, model ini menempati puncak jajaran produk pratinjau Google saat ini. Ia menawarkan jendela konteks yang jauh lebih besar (1M token) dan batas output yang lebih tinggi (65K token) dibandingkan dengan model Gemini 2.0 sebelumnya atau pratinjau Gemini 3.0. Skor τ²-Bench sebesar 95.6 memberikan tolok ukur kuantitatif untuk kinerja yang berorientasi pada tugas. Dibandingkan dengan model pratinjau lain dari Google, model ini menargetkan kasus penggunaan yang paling menuntut, di mana diperlukan baik keluasan konteks maupun kedalaman penalaran.
Gemini 3.1 Pro Preview bersifat multimodal dan dapat memproses masukan audio, file (termasuk dokumen, kode, dan spreadsheet), gambar, teks, dan video. Hal ini memungkinkannya untuk bernalar di berbagai jenis data dalam satu percakapan. Misalnya, Anda dapat mengunggah gambar beserta perintah teks yang menanyakan tentang isinya, atau menganalisis video bersama dengan transkripnya. Modalitas masukan file mendukung data terstruktur dan tidak terstruktur, sehingga berguna untuk analisis dokumen dan tugas ekstraksi data.
Model ini mendukung jendela konteks sebanyak 1.048.576 token untuk input. Ini adalah salah satu jendela konteks terbesar yang tersedia pada model unggulan. Hal ini memungkinkan pemrosesan dokumen yang sangat panjang, seluruh basis kode, atau transkrip video selama berjam-jam dalam satu permintaan. Jika dikombinasikan dengan batas output 65.536 token, hal ini memungkinkan pembuatan laporan, ringkasan, atau rangkaian penalaran multi-langkah secara ekstensif tanpa perlu melakukan paginasi atau memotong input.
Kasus penggunaan ideal mencakup peringkasan dokumen panjang, agen percakapan multi-putaran dengan memori riwayat pengguna secara keseluruhan, analisis konten video, ekstraksi data kompleks dari media campuran, serta tugas agenik yang membutuhkan akurasi tinggi (sebagaimana tercermin dalam skor τ²-Bench). Model ini juga unggul dalam tugas yang menggabungkan beberapa jenis input, seperti menganalisis grafik dalam gambar sambil membaca teks terkait. Untuk tugas yang lebih sederhana, model yang lebih murah mungkin lebih hemat biaya, namun overhead dari konteks besar tetap dapat dibenarkan untuk aplikasi yang canggih.
Untuk tugas yang hanya memerlukan pembuatan teks pendek, klasifikasi sederhana, atau respons latensi rendah, model yang lebih kecil atau non-unggulan mungkin lebih tepat. Jendela konteks besar dan kapasitas multimodal dari Gemini 3.1 Pro Preview hadir dengan biaya komputasi yang lebih tinggi per permintaan. Jika kasus penggunaan Anda tidak memerlukan konteks token 1M penuh atau output 65K token, pertimbangkan untuk menggunakan model yang lebih ringan yang tersedia melalui OrcaRouter, seperti Gemini 2.0 Flash atau alternatif lain yang hemat biaya. Selalu evaluasi trade-off biaya-kinerja berdasarkan rata-rata penggunaan token input dan output Anda.
Model ini mencapai skor 95,6 pada τ²-Bench. τ²-Bench adalah sebuah tolok ukur yang mengevaluasi kinerja penyelesaian tugas pada berbagai tugas agen, penalaran, dan perencanaan. Skor 95,6 menunjukkan tingkat akurasi yang tinggi dalam menyelesaikan tugas-tugas tersebut. Meskipun komposisi pasti dari τ²-Bench tidak disebutkan, skor ini menempatkan model ini sebagai pemain yang kuat untuk pengambilan keputusan terstruktur dan tantangan penalaran multi-langkah. Ini berfungsi sebagai indikator kuantitatif kemampuan model dibandingkan dengan model besar lainnya.
Detail latensi untuk Gemini 3.1 Pro Preview tidak disediakan dalam fakta yang tersedia. Namun, mengingat tingkat flagship-nya dan jendela konteks besar (1M token) serta batas output (65K token), waktu respons akan bervariasi berdasarkan panjang input, output yang diminta, dan beban server. Memproses input yang sangat panjang atau menghasilkan output yang besar akan memakan waktu lebih lama dibandingkan dengan model yang lebih kecil. Untuk aplikasi real-time, pertimbangkan untuk menggunakan model yang lebih cepat. API OrcaRouter tidak memberikan jaminan latensi spesifik untuk model pratinjau ini.
Kekuatan model, yang disimpulkan dari spesifikasinya, mencakup kapasitas konteks yang sangat besar (1.048.576 token), batas token output yang tinggi (65.536 token), dukungan input multimodal, serta skor τ²-Bench yang kuat (95,6). Fitur-fitur ini membuatnya cocok untuk tugas kompleks yang memerlukan penalaran dalam konteks panjang dan berbagai tipe data. Status pratinjau dapat memungkinkan akses awal ke kemampuan canggih sebelum rilis stabil. Klasifikasi tingkat flagship menunjukkan bahwa model ini dirancang untuk aplikasi dengan permintaan tinggi.
Sebagai model pratinjau, Gemini 3.1 Pro Preview mungkin tidak memiliki stabilitas, ketersediaan, atau dukungan yang sama dengan rilis stabil. Model ini dapat mengalami perubahan atau penghentian tanpa pemberitahuan. Tidak ada angka latensi atau throughput spesifik yang diberikan, sehingga kinerja di bawah beban tidak diketahui. Skor tolok ukur pada τ²-Bench adalah metrik tunggal dan mungkin tidak mencerminkan kinerja pada semua tugas. Selain itu, jendela konteks yang besar dapat meningkatkan biaya dan waktu respons. Pengguna harus menguji secara menyeluruh sebelum penggunaan produksi.
Detail harga untuk Gemini 3.1 Pro Preview tidak tersedia dalam fakta yang ada. Sebagai model unggulan, harga umumnya lebih tinggi dibandingkan varian yang lebih kecil atau non-unggulan, dengan biaya biasanya didasarkan pada jumlah token input dan output. Jendela konteks yang besar (1 juta token) dan batas output (65 ribu token) dapat menyebabkan penggunaan token yang signifikan per permintaan. OrcaRouter mungkin menerapkan harga per token untuk input dan output, dengan kemungkinan biaya tambahan untuk input multimodal. Pengguna disarankan untuk berkonsultasi dengan halaman harga OrcaRouter untuk tarif terkini.
Saat menggunakan Gemini 3.1 Pro Preview, faktor biaya terbesar adalah konsumsi token. Satu permintaan yang menggunakan konteks token penuh 1M akan menimbulkan biaya token input yang tinggi. Demikian pula, menghasilkan hingga 65K token output akan meningkatkan biaya output. Untuk kasus penggunaan yang tidak memerlukan konteks atau output penuh, pengguna mungkin dapat mengurangi biaya dengan memotong input atau mengatur max_tokens lebih rendah. Caching (jika didukung oleh OrcaRouter) dapat mengurangi biaya input yang redundan, tetapi tidak ada detail caching yang diberikan. Evaluasi pola penggunaan rata-rata untuk memutuskan apakah model yang lebih murah lebih ekonomis.
Fakta yang tersedia tidak menyebutkan apakah OrcaRouter menawarkan caching untuk Gemini 3.1 Pro Preview. Banyak penyedia API menawarkan caching token untuk prefiks input yang berulang, yang dapat menurunkan biaya dan meningkatkan latensi. Jika caching tersedia, ini akan bermanfaat untuk kasus penggunaan dengan instruksi berulang atau prompt sistem yang sering. Pengguna harus memeriksa dokumentasi OrcaRouter untuk dukungan caching. Tanpa adanya caching, biaya penuh token input akan dikenakan pada setiap permintaan.
Tidak ada perbandingan harga spesifik yang diberikan. Secara umum, model flagship lebih mahal per token dibandingkan model yang lebih kecil. Gemini 3.1 Pro Preview, sebagai pratinjau flagship, kemungkinan memiliki biaya per token yang lebih tinggi daripada Gemini 2.0 Flash atau Gemini 2.0 Pro. Namun, karena ini adalah pratinjau, harga mungkin bersifat promosi atau dapat berubah. Pengguna harus membandingkan harga yang tercantum di OrcaRouter untuk setiap model Google guna menentukan opsi yang paling hemat biaya untuk beban kerja mereka.
Untuk menggunakan Gemini 3.1 Pro Preview di OrcaRouter, buat permintaan ke titik akhir API yang kompatibel dengan OpenAI di https://api.orcarouter.ai/v1/chat/completions. Setel parameter model menjadi "google/gemini-3.1-pro-preview". API ini menerima parameter standar seperti messages, max_tokens, temperature, dan top_p. Untuk input multimodal, gunakan content array dengan tipe yang sesuai (text, image_url, dll.). Contoh kode dan SDK tersedia di dokumentasi OrcaRouter.
Anda dapat mengonfigurasi token output maksimum hingga 65.536 menggunakan parameter max_tokens. Model ini mendukung temperature, top_p, dan parameter sampling umum lainnya. Untuk input multimodal, tentukan jenis konten dalam array messages. Jendela konteks sebanyak 1.048.576 token berlaku untuk semua token input yang digabungkan. Semua parameter mengikuti spesifikasi OpenAI chat completions. Lihat referensi API OrcaRouter untuk setiap batasan khusus model atau parameter tambahan.
Migrasi ke OrcaRouter sangat mudah karena menggunakan API yang kompatibel dengan OpenAI. Cukup ubah URL dasar menjadi https://api.orcarouter.ai/v1 dan perbarui ID model menjadi "google/gemini-3.1-pro-preview". Metode autentikasi (kunci API) serupa. Jika sebelumnya Anda menggunakan model Google yang berbeda, Anda mungkin perlu menyesuaikan dengan kemampuan yang berbeda (misalnya, ukuran jendela konteks, penanganan multimodal). Uji dengan permintaan sampel untuk memastikan kompatibilitas. Dokumentasi OrcaRouter menyediakan panduan migrasi untuk pengaturan umum.
Sebagai model pratinjau, Gemini 3.1 Pro Preview mungkin memiliki batas kuota yang lebih rendah, keandalan yang kurang, atau dapat berubah tanpa pemberitahuan. Model ini dimaksudkan untuk pengujian dan evaluasi. Jika Anda membutuhkan model produksi yang stabil, pertimbangkan untuk menggunakan model non-pratinjau. API dapat mengembalikan respons lebih cepat atau lebih lambat tergantung pada beban. Pantau kinerja dan miliki model cadangan. OrcaRouter dapat memperbarui ID model atau menghentikan versi pratinjau; rencanakan dengan sesuai.
Dibandingkan dengan model Google sebelumnya seperti Gemini 2.0 Pro, pratinjau ini menawarkan jendela konteks yang jauh lebih besar (1M vs. 32K token) dan batas output yang lebih tinggi (65K vs. 8K token). Ini juga mendukung modalitas input tambahan seperti video dan file dengan cara yang lebih terintegrasi. Skor τ²-Bench sebesar 95,6 khusus untuk model ini dan menunjukkan kinerja tugas yang kuat. Namun, sebagai pratinjau, model ini mungkin kurang stabil dibandingkan rilis stabil Gemini 2.0 atau Gemini 3.0. Tingkat unggulan menempatkannya di atas Gemini 2.0 Flash dalam hal kemampuan dan biaya.
Tidak ada perbandingan tolok ukur langsung yang disediakan. Jendela konteks 1M token model ini termasuk yang terbesar yang tersedia, menyamai atau melampaui banyak pesaing. Dukungan input multimodalnya luas (audio, file, gambar, teks, video). Skor τ²-Bench sebesar 95,6 menawarkan titik perbandingan untuk tugas-tugas agen, tetapi tanpa skor model lain pada tolok ukur yang sama, perbandingan penuh tidak mungkin dilakukan. Pengguna harus mengevaluasi berdasarkan kebutuhan kasus penggunaan spesifik mereka.
Pilih model ini ketika tugas Anda memerlukan jendela konteks sebesar mungkin (hingga 1M token) dan generasi output yang tinggi (hingga 65K token). Ini juga merupakan pilihan terbaik ketika Anda perlu menangani beberapa modalitas input – terutama file dan video – dalam satu langkah penalaran. Skor τ²-Bench yang tinggi menunjukkan bahwa model ini unggul dalam tugas-tugas agen yang kompleks. Jika Anda sudah menggunakan OrcaRouter dan ingin menguji kemampuan unggulan terbaru Google, pratinjau ini adalah titik awal yang baik.
Pilihlah alternatif jika Anda memerlukan model yang stabil dan terverifikasi produksi (karena ini adalah pratinjau). Jika kasus penggunaan Anda memiliki persyaratan latensi rendah atau penggunaan token kecil, model yang lebih murah seperti Gemini 2.0 Flash atau model non-Google akan lebih hemat biaya. Juga, jika tugas Anda tidak memerlukan konteks 1M token penuh atau input multimodal, model yang lebih kecil dapat memberikan respons yang lebih cepat dan lebih murah. Evaluasilah trade-off antara kemampuan, biaya, dan keandalan untuk aplikasi spesifik Anda.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| Tingkat | Input / 1M token | Output / 1M token | Baca cache / 1M | Tulis cache / 1M |
|---|---|---|---|---|
| ≤ 200K | $2.00 | $12.00 | $0.200 | $0.375 |
| ≤ ∞ | $4.00 | $18.00 | $0.400 | $0.375 |
| Tingkat dipilih berdasarkan jumlah token input setiap permintaan | ||||