Gemini 3 Flash Preview

google/gemini-3-flash-preview
oleh Google · 2025-12-17

Google Gemini 3 Flash Preview – Model multimodal dengan konteks 1M token, 88.2 MMLU-Pro, dapat diakses melalui OrcaRouter.

ctx1.05M token
Masukantext + image + file + audio + video
Keluarantext
p50 TTFT3.81 s
INPUT$0.50/ 1M token
OUTPUT$3.00/ 1M token
p50 TTFT3.81 s7h
p95 TTFT10.00 s7h
LALU LINTAS1.1Mtoken / 7h

Detail model

Apa itu Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview adalah model multimodal yang dikembangkan oleh Google, dioptimalkan untuk kecepatan dan pemrosesan konteks besar. Model ini menerima input dalam format teks, gambar, file, audio, dan video, serta dapat menghasilkan hingga 65.536 token output. Model ini memiliki jendela konteks sebesar 1.048.576 token, memungkinkannya untuk bernalar pada urutan yang sangat panjang. Model ini mendapat skor 88,2 pada tolok ukur MMLU-Pro, menunjukkan kinerja yang kuat di berbagai tugas akademis dan penalaran. Versi pratinjau ini tersedia melalui API yang kompatibel dengan OpenAI milik OrcaRouter dengan ID model google/gemini-3-flash-preview.

Siapa target audiens untuk model ini?

Gemini 3 Flash Preview menargetkan pengembang dan organisasi yang membangun aplikasi yang memerlukan penalaran multimodal cepat dengan konteks besar. Model ini sangat cocok untuk kasus penggunaan seperti analisis video, ringkasan dokumen panjang, dan pemahaman audio-video real-time. Harga model—$0,50 per juta token input dan $3,00 per juta token output—membuatnya terjangkau bagi startup dan perusahaan besar. Karena merupakan pratinjau, pengadopsi awal dapat mengevaluasi kemampuannya sebelum rilis stabil. OrcaRouter menyediakan akses yang mulus ke model ini, termasuk endpoint yang kompatibel dengan OpenAI dan tanpa markup pada tarif penyedia.

Input multimodal apa saja yang didukung?

Gemini 3 Flash Preview mendukung lima modalitas input: teks, gambar, file, audio, dan video. Teks bisa polos atau terstruktur; gambar dapat mencakup foto, diagram, dan tangkapan layar; file mencakup format seperti PDF dan dokumen; audio mencakup ucapan dan musik; video dapat diproses dengan trek visual dan audio. Model ini dapat menggabungkan beberapa modalitas dalam satu perintah—misalnya, menganalisis video sambil membaca PDF yang dilampirkan. Fleksibilitas ini memungkinkannya menangani tugas media campuran yang kompleks tanpa memerlukan jalur terpisah. Token input dihitung berdasarkan aturan tokenizer spesifik masing-masing modalitas.

Apa status pratinjau dan seberapa stabil?

Gemini 3 Flash Preview adalah versi pra-rilis dari model Flash generasi ketiga Google. Sebagai pratinjau, model ini dapat mengalami perubahan dalam perilaku, kinerja, dan ketersediaan. Google biasanya memperbarui model pratinjau berdasarkan umpan balik pengguna, dan mereka pada akhirnya dapat mengganti titik akhir pratinjau dengan rilis stabil. Meskipun model ini berfungsi dan cocok untuk pengujian dan pengembangan, penerapan produksi harus memantau pembaruan. OrcaRouter mencerminkan titik akhir penyedia, memastikan bahwa setiap perubahan dari Google tercermin dengan cepat. ID model google/gemini-3-flash-preview akan tetap konsisten kecuali Google mengubah penamaannya.

Contoh kode

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Harga

Input / 1M token$0.500
Output / 1M token$3.00
Baca cache / 1M$0.050
Mata uangUSD

Performa

p50 TTFT
3.81 s
Kecepatan output
851 tok/s
p95 TTFT
10.00 s
Tingkat kesalahan
0%

Benchmark publik

37.8
AA Coding
Lebih baik dari 47% model yang dibandingkan
35.0
AA Intelligence
Lebih baik dari 35% model yang dibandingkan
55.7
AA Math
Lebih baik dari 32% model yang dibandingkan
AIME 2025
55.7
GPQA Diamond
81.2
Humanity's Last Exam
14.1
IFBench
55.1
LiveCodeBench
79.7
Long-Context Recall
48.0
MMLU-Pro
88.2
SciCode
49.9
TerminalBench Hard
31.8
τ²-Bench
43.3
Sumber: artificialanalysis.ai

FAQ

Berapa biaya untuk menggunakan Gemini 3 Flash Preview?
Harga adalah $0.50 per juta token masukan dan $3.00 per juta token keluaran, ditagih dengan tarif penyedia tanpa markup tambahan oleh OrcaRouter.
Berapa ukuran jendela konteksnya?
Jendela konteks adalah 1.048.576 token untuk input dan model dapat menghasilkan hingga 65.536 token output.
Apa saja modalitas input yang didukung?
Teks, gambar, berkas, audio, dan video semuanya diterima sebagai masukan. Keluaran hanya berupa teks.
Bagaimana perbandingannya dengan Gemini 2 Flash?
Gemini 3 Flash Preview memiliki jendela konteks yang lebih besar (1M vs hingga 1M tetapi seringkali lebih kecil), skor MMLU-Pro yang lebih tinggi (88.2), dan dukungan multimodal yang diperluas termasuk video. Ini lebih cepat dan lebih mampu untuk tugas-tugas kompleks, tetapi Gemini 2 Flash lebih murah per token.
Bagaimana OrcaRouter menangani privasi data?
OrcaRouter meneruskan permintaan Anda ke API Google. Penanganan data mengikuti kebijakan privasi Google. OrcaRouter tidak mencatat atau menyimpan konten Anda melebihi yang diperlukan untuk memproses permintaan. Tinjau kebijakan kedua penyedia untuk detailnya.
Bisakah saya memanggil Gemini 3 Flash Preview menggunakan API yang kompatibel dengan OpenAI?
Ya. Gunakan API OrcaRouter di https://api.orcarouter.ai/v1 dengan ID model "google/gemini-3-flash-preview". Autentikasi menggunakan kunci API OrcaRouter. Format permintaan dan respons mengikuti skema Chat Completions OpenAI.
Apa kekuatan utama model ini?
Kecepatan inferensi tinggi, konteks 1M-token yang besar, input multimodal (teks, gambar, file, audio, video), tolok ukur MMLU-Pro yang kuat (88,2), dan biaya rendah relatif terhadap model yang lebih besar.
Apakah Gemini 3 Flash Preview tersedia untuk produksi?
Ini adalah versi pratinjau, artinya mungkin mengalami perubahan, ketersediaan yang tidak menentu, atau dukungan terbatas. Versi ini cocok untuk pengujian dan pengembangan; untuk beban kerja produksi yang kritis, pertimbangkan untuk menggunakan rilis stabil setelah tersedia.
Bagaimana cara memperkirakan penggunaan token untuk input multimodal?
Setiap modalitas memiliki tokenisasinya sendiri. Gambar, audio, dan video dipecah menjadi token berdasarkan resolusi dan durasi. OrcaRouter melaporkan penggunaan token dalam respons API. Anda juga dapat berkonsultasi dengan dokumentasi Google untuk aturan penghitungan token yang terperinci.
Apa yang terjadi jika saya melebihi jendela konteks?
Input yang melebihi 1,048,576 token akan dipotong dari konten terlama. Model akan mengabaikan token yang berlebih. Pastikan pesan Anda sesuai dengan batas dengan memantau total token dalam permintaan Anda.

Sematkan lencana ini

Google: Gemini 3 Flash Preview$0.50/M in3812ms p50via OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview di OrcaRouter" /> </a>
Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)