Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

oleh Google · 2025-12-17

Google Gemini 3 Flash Preview – Model multimodal dengan konteks 1M token, 88.2 MMLU-Pro, dapat diakses melalui OrcaRouter.

Endpoint:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M token

Masukantext + image + file + audio + video

Keluarantext

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

INPUT$0.50/ 1M token

OUTPUT$3.00/ 1M token

p50 TTFT3.81 s7h

p95 TTFT10.00 s7h

LALU LINTAS1.1Mtoken / 7h

Dapatkan API Gemini 3 Flash Preview →▶ Coba di playground </> Gunakan via API

Apa itu Google Gemini 3 Flash Preview?

Google Gemini 3 Flash Preview adalah model multimodal yang dikembangkan oleh Google, dioptimalkan untuk kecepatan dan pemrosesan konteks besar. Model ini menerima input dalam format teks, gambar, file, audio, dan video, serta dapat menghasilkan hingga 65.536 token output. Model ini memiliki jendela konteks sebesar 1.048.576 token, memungkinkannya untuk bernalar pada urutan yang sangat panjang. Model ini mendapat skor 88,2 pada tolok ukur MMLU-Pro, menunjukkan kinerja yang kuat di berbagai tugas akademis dan penalaran. Versi pratinjau ini tersedia melalui API yang kompatibel dengan OpenAI milik OrcaRouter dengan ID model google/gemini-3-flash-preview.

Siapa target audiens untuk model ini?

Gemini 3 Flash Preview menargetkan pengembang dan organisasi yang membangun aplikasi yang memerlukan penalaran multimodal cepat dengan konteks besar. Model ini sangat cocok untuk kasus penggunaan seperti analisis video, ringkasan dokumen panjang, dan pemahaman audio-video real-time. Harga model—$0,50 per juta token input dan $3,00 per juta token output—membuatnya terjangkau bagi startup dan perusahaan besar. Karena merupakan pratinjau, pengadopsi awal dapat mengevaluasi kemampuannya sebelum rilis stabil. OrcaRouter menyediakan akses yang mulus ke model ini, termasuk endpoint yang kompatibel dengan OpenAI dan tanpa markup pada tarif penyedia.

Input multimodal apa saja yang didukung?

Gemini 3 Flash Preview mendukung lima modalitas input: teks, gambar, file, audio, dan video. Teks bisa polos atau terstruktur; gambar dapat mencakup foto, diagram, dan tangkapan layar; file mencakup format seperti PDF dan dokumen; audio mencakup ucapan dan musik; video dapat diproses dengan trek visual dan audio. Model ini dapat menggabungkan beberapa modalitas dalam satu perintah—misalnya, menganalisis video sambil membaca PDF yang dilampirkan. Fleksibilitas ini memungkinkannya menangani tugas media campuran yang kompleks tanpa memerlukan jalur terpisah. Token input dihitung berdasarkan aturan tokenizer spesifik masing-masing modalitas.

Apa status pratinjau dan seberapa stabil?

Gemini 3 Flash Preview adalah versi pra-rilis dari model Flash generasi ketiga Google. Sebagai pratinjau, model ini dapat mengalami perubahan dalam perilaku, kinerja, dan ketersediaan. Google biasanya memperbarui model pratinjau berdasarkan umpan balik pengguna, dan mereka pada akhirnya dapat mengganti titik akhir pratinjau dengan rilis stabil. Meskipun model ini berfungsi dan cocok untuk pengujian dan pengembangan, penerapan produksi harus memantau pembaruan. OrcaRouter mencerminkan titik akhir penyedia, memastikan bahwa setiap perubahan dari Google tercermin dengan cepat. ID model google/gemini-3-flash-preview akan tetap konsisten kecuali Google mengubah penamaannya.

Contoh kode

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Harga

Input / 1M token	$0.500
Output / 1M token	$3.00
Baca cache / 1M	$0.050
Mata uang	USD

Performa

7 hari terakhir

p50 TTFT

3.81 s

Kecepatan output

851 tok/s

p95 TTFT

10.00 s

Tingkat kesalahan

Benchmark publik

Terakhir dievaluasi 2025-12-17

37.8

AA Coding

Lebih baik dari 47% model yang dibandingkan

35.0

AA Intelligence

Lebih baik dari 35% model yang dibandingkan

55.7

AA Math

Lebih baik dari 32% model yang dibandingkan

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

Sumber: artificialanalysis.ai

Lainnya dari Google

Lihat semua model dari google →

Gemini 3.1 Pro PreviewUnggulan

google/gemini-3.1-pro-preview

$2.00 masuk · $12.00 keluar / 1M

1.05M ctx· kualitas 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 masuk · $18.00 keluar / 1M

1.05M ctx· kualitas 10/10

Gemini 3.5 FlashTermurah

google/gemini-3.5-flash

$1.50 masuk · $9.00 keluar / 1M

1.05M ctx· kualitas 9/10

FAQ

Berapa biaya untuk menggunakan Gemini 3 Flash Preview?

Harga adalah $0.50 per juta token masukan dan $3.00 per juta token keluaran, ditagih dengan tarif penyedia tanpa markup tambahan oleh OrcaRouter.

Berapa ukuran jendela konteksnya?

Jendela konteks adalah 1.048.576 token untuk input dan model dapat menghasilkan hingga 65.536 token output.

Apa saja modalitas input yang didukung?

Teks, gambar, berkas, audio, dan video semuanya diterima sebagai masukan. Keluaran hanya berupa teks.

Bagaimana perbandingannya dengan Gemini 2 Flash?

Gemini 3 Flash Preview memiliki jendela konteks yang lebih besar (1M vs hingga 1M tetapi seringkali lebih kecil), skor MMLU-Pro yang lebih tinggi (88.2), dan dukungan multimodal yang diperluas termasuk video. Ini lebih cepat dan lebih mampu untuk tugas-tugas kompleks, tetapi Gemini 2 Flash lebih murah per token.

Bagaimana OrcaRouter menangani privasi data?

OrcaRouter meneruskan permintaan Anda ke API Google. Penanganan data mengikuti kebijakan privasi Google. OrcaRouter tidak mencatat atau menyimpan konten Anda melebihi yang diperlukan untuk memproses permintaan. Tinjau kebijakan kedua penyedia untuk detailnya.

Bisakah saya memanggil Gemini 3 Flash Preview menggunakan API yang kompatibel dengan OpenAI?

Ya. Gunakan API OrcaRouter di https://api.orcarouter.ai/v1 dengan ID model "google/gemini-3-flash-preview". Autentikasi menggunakan kunci API OrcaRouter. Format permintaan dan respons mengikuti skema Chat Completions OpenAI.

Apa kekuatan utama model ini?

Kecepatan inferensi tinggi, konteks 1M-token yang besar, input multimodal (teks, gambar, file, audio, video), tolok ukur MMLU-Pro yang kuat (88,2), dan biaya rendah relatif terhadap model yang lebih besar.

Apakah Gemini 3 Flash Preview tersedia untuk produksi?

Ini adalah versi pratinjau, artinya mungkin mengalami perubahan, ketersediaan yang tidak menentu, atau dukungan terbatas. Versi ini cocok untuk pengujian dan pengembangan; untuk beban kerja produksi yang kritis, pertimbangkan untuk menggunakan rilis stabil setelah tersedia.

Bagaimana cara memperkirakan penggunaan token untuk input multimodal?

Setiap modalitas memiliki tokenisasinya sendiri. Gambar, audio, dan video dipecah menjadi token berdasarkan resolusi dan durasi. OrcaRouter melaporkan penggunaan token dalam respons API. Anda juga dapat berkonsultasi dengan dokumentasi Google untuk aturan penghitungan token yang terperinci.

Apa yang terjadi jika saya melebihi jendela konteks?

Input yang melebihi 1,048,576 token akan dipotong dari konten terlama. Model akan mengabaikan token yang berlebih. Pastikan pesan Anda sesuai dengan batas dengan memantau total token dalam permintaan Anda.

Sematkan lencana ini

Tempel ke artikel blog Anda

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•via OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="Google: Gemini 3 Flash Preview di OrcaRouter" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

Apa itu Google Gemini 3 Flash Preview?

Siapa target audiens untuk model ini?

Input multimodal apa saja yang didukung?

Apa status pratinjau dan seberapa stabil?

Apa yang bisa dilakukan Gemini 3 Flash Preview dengan teks dan gambar?

Bagaimana cara menangani audio dan video?

Apa saja kasus penggunaan terbaik untuk model Flash ini?

Kapan Anda mungkin memilih model yang lebih murah atau lebih kuat sebagai gantinya?

Apa arti skor MMLU-Pro sebesar 88.2?

Seberapa cepat Gemini 3 Flash Preview untuk inferensi?

Apa kekuatan utama model berdasarkan tolok ukur?

Apa saja keterbatasan sesungguhnya dari Gemini 3 Flash Preview?

Apa struktur harga untuk Gemini 3 Flash Preview?

Bagaimana perbandingan harga dengan model lainnya?

Apakah ada diskon caching atau harga volume?

Bagaimana cara memanggil Gemini 3 Flash Preview melalui API OrcaRouter?

Parameter apa yang tersedia saat memanggil model?

Cara migrasi dari API asli Google ke OrcaRouter?

Apakah ada perbedaan dalam format respons dibandingkan dengan OpenAI?

Bagaimana perbandingan Gemini 3 Flash Preview dengan Gemini 2 Flash?

Bagaimana perbandingannya dengan GPT-4o?

Bagaimana perbandingannya dengan model Google lainnya?

Contoh kode

Harga

Performa

Benchmark publik

Lainnya dari Google

FAQ

Sematkan lencana ini

Gemini 3 Flash Preview

Detail model

Apa itu Google Gemini 3 Flash Preview?

Siapa target audiens untuk model ini?

Input multimodal apa saja yang didukung?

Apa status pratinjau dan seberapa stabil?

Apa yang bisa dilakukan Gemini 3 Flash Preview dengan teks dan gambar?

Bagaimana cara menangani audio dan video?

Apa saja kasus penggunaan terbaik untuk model Flash ini?

Kapan Anda mungkin memilih model yang lebih murah atau lebih kuat sebagai gantinya?

Apa arti skor MMLU-Pro sebesar 88.2?

Seberapa cepat Gemini 3 Flash Preview untuk inferensi?

Apa kekuatan utama model berdasarkan tolok ukur?

Apa saja keterbatasan sesungguhnya dari Gemini 3 Flash Preview?

Apa struktur harga untuk Gemini 3 Flash Preview?

Bagaimana perbandingan harga dengan model lainnya?

Apakah ada diskon caching atau harga volume?

Bagaimana cara memanggil Gemini 3 Flash Preview melalui API OrcaRouter?

Parameter apa yang tersedia saat memanggil model?

Cara migrasi dari API asli Google ke OrcaRouter?

Apakah ada perbedaan dalam format respons dibandingkan dengan OpenAI?

Bagaimana perbandingan Gemini 3 Flash Preview dengan Gemini 2 Flash?

Bagaimana perbandingannya dengan GPT-4o?

Bagaimana perbandingannya dengan model Google lainnya?

Contoh kode

Harga

Performa

Benchmark publik

Lainnya dari Google

FAQ

Sematkan lencana ini