Gemini 3 Flash Preview

Name: Google: Gemini 3 Flash Preview API
Brand: Google

google/gemini-3-flash-preview

提供 Google · 2025-12-17

Google Gemini 3 Flash Preview – 100万トークンのコンテキストを持つマルチモーダルモデル、88.2 MMLU-Pro、OrcaRouter経由でアクセス可能

エンドポイント:/v1/chat/completions /v1beta/models/{model}:generateContent

コンテキスト1.05M トークン

入力text + image + file + audio + video

出力text

p50 TTFT3.81 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

入力$0.50/ 100万 tokens

出力$3.00/ 100万 tokens

p50 TTFT3.81 s7日

p95 TTFT10.00 s7日

トラフィック1.1Mtokens / 7日

Gemini 3 Flash Preview API を取得 →▶ Playground で試す </> API で使用

Google Gemini 3 Flash Previewとは何ですか？

Google Gemini 3 Flash Previewは、Googleが開発したマルチモーダルモデルであり、高速処理と大規模なコンテキスト処理に最適化されています。テキスト、画像、ファイル、音声、動画の形式で入力を受け付け、最大65,536トークンの出力を生成できます。このモデルは1,048,576トークンのコンテキストウィンドウを持ち、非常に長い系列にわたって推論することが可能です。MMLU-Proベンチマークでは88.2をスコアしており、幅広い学術的・推論タスクで高い性能を示しています。このプレビュー版は、OrcaRouterのOpenAI互換APIを通じて、モデルID google/gemini-3-flash-previewで利用可能です。

このモデルのターゲットオーディエンスは誰ですか？

Gemini 3 Flash Previewは、高速なマルチモーダル推論と大規模なコンテキストを必要とするアプリケーションを構築する開発者や組織を対象としています。このモデルは、動画分析、長文書の要約、リアルタイムの音声・動画理解などのユースケースに適しています。モデルの価格は、入力トークン100万トークンあたり0.50ドル、出力トークン100万トークンあたり3.00ドルで、スタートアップと企業の両方が利用しやすいものとなっています。プレビュー版であるため、早期導入者は安定版リリース前にその機能を評価できます。OrcaRouterは、OpenAI互換のエンドポイントとプロバイダー料金に対するゼロマークアップを含む、このモデルへのシームレスなアクセスを提供します。

それはどのようなマルチモーダル入力をサポートしていますか？

Gemini 3 Flash Previewは、テキスト、画像、ファイル、音声、動画の5つの入力モダリティをサポートします。テキストはプレーンまたは構造化された形式で指定可能です。画像には写真、図表、スクリーンショットが含まれます。ファイルはPDFやドキュメントなどの形式に対応し、音声には音声会話や音楽が含まれます。動画は視覚・音声トラックの両方を処理できます。このモデルは、単一のプロンプト内で複数のモダリティを組み合わせることが可能であり、例えば動画を分析しながら添付のPDFを読み込むこともできます。この多様性により、個別のパイプラインを必要とせず、複雑なマルチメディアタスクを処理できます。入力トークンは、各モダリティ固有のトークナイザルールに基づいてカウントされます。

プレビューの状態はどうなっていますか？また、その安定性はどのくらいですか？

Gemini 3 Flash Previewは、Googleの第3世代Flashモデルのプレリリース版です。プレビュー版であるため、動作、パフォーマンス、可用性が変更される可能性があります。Googleは通常、ユーザーフィードバックに基づいてプレビューモデルを更新し、最終的にはプレビューエンドポイントを安定版リリースに置き換えることがあります。モデルは機能しており、テストや開発に適していますが、本番環境でのデプロイメントでは更新を監視する必要があります。OrcaRouterはプロバイダーのエンドポイントをミラーリングし、Googleからの変更が迅速に反映されるようにします。モデルID google/gemini-3-flash-previewは、Googleが命名を変更しない限り一貫して維持されます。

コードサンプル

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3-flash-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

料金

入力 / 1M tokens	$0.500
出力 / 1M tokens	$3.00
キャッシュ読み取り / 1M	$0.050
通貨	USD

パフォーマンス

過去 7 日間

p50 TTFT

3.81 s

出力速度

851 tok/s

p95 TTFT

10.00 s

エラー率

公開ベンチマーク

最終評価 2025-12-17

37.8

AA Coding

比較対象モデルの 47% を上回る

35.0

AA Intelligence

比較対象モデルの 35% を上回る

55.7

AA Math

比較対象モデルの 32% を上回る

AIME 2025

55.7

GPQA Diamond

81.2

Humanity's Last Exam

14.1

IFBench

55.1

LiveCodeBench

79.7

Long-Context Recall

48.0

MMLU-Pro

88.2

SciCode

49.9

TerminalBench Hard

31.8

τ²-Bench

43.3

ソース: artificialanalysis.ai

Google の他のモデル

google のすべてのモデルを見る →

Gemini 3.1 Pro Previewフラッグシップ

google/gemini-3.1-pro-preview

入力 $2.00 · 出力 $12.00 / 100万

1.05M コンテキスト· 品質 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

入力 $4.00 · 出力 $18.00 / 100万

1.05M コンテキスト· 品質 10/10

Gemini 3.5 Flash最安

google/gemini-3.5-flash

入力 $1.50 · 出力 $9.00 / 100万

1.05M コンテキスト· 品質 9/10

よくある質問

Gemini 3 Flash Previewを使用するコストはいくらですか？

料金は、入力トークン100万件あたり0.50ドル、出力トークン100万件あたり3.00ドルで、プロバイダー料金に基づいて請求され、OrcaRouterによるマークアップは一切追加されません。

コンテキストウィンドウサイズとは何ですか？

コンテキストウィンドウは入力用に1,048,576トークンであり、モデルは最大65,536出力トークンを生成できます。

サポートされている入力モダリティは何ですか？

テキスト、画像、ファイル、音声、動画はすべて入力として受け付けられます。出力はテキストのみです。

Gemini 2 Flashと比べてどうですか？

Gemini 3 Flash Previewは、より大きなコンテキストウィンドウ（1M vs 最大1Mだが通常はより小さい）、より高いMMLU-Proスコア（88.2）、および動画を含む拡張されたマルチモーダルサポートを備えています。複雑なタスクにおいてより高速で高性能ですが、Gemini 2 Flashの方がトークンあたりのコストが低くなっています。

OrcaRouterはどのようにデータプライバシーを処理しますか？

OrcaRouterはお客様のリクエストをGoogleのAPIに送信します。データの取り扱いはGoogleのプライバシーポリシーに従います。OrcaRouterはリクエストの処理に必要な範囲を超えてお客様のコンテンツをログに記録したり保存したりすることはありません。詳細については両方のプロバイダーのポリシーをご確認ください。

Gemini 3 Flash Preview を OpenAI 互換の API で呼び出すことはできますか？

はい。OrcaRouterのAPI（https://api.orcarouter.ai/v1）を使用し、モデルIDは"google/gemini-3-flash-preview"です。認証にはOrcaRouterのAPIキーを使用します。リクエストとレスポンスの形式はOpenAIのChat Completionsスキーマに従います。

モデルの主な強みは何ですか？

高い推論速度、大規模な1Mトークンコンテキスト、マルチモーダル入力（テキスト、画像、ファイル、音声、動画）、強力なMMLU-Proベンチマーク（88.2）、そして大規模モデルと比較して低コスト。

Gemini 3 Flash Previewはプロダクションで利用可能ですか？

これはプレビュー版であり、変更が加えられる可能性、断続的な利用可能性、または限定的なサポートがあることを意味します。テストと開発に適しています。重要な本番環境のワークロードには、利用可能になり次第、安定版の使用を検討してください。

マルチモーダル入力のトークン使用量を見積もるにはどうすればよいですか？

各モダリティには独自のトークン化方式があります。画像、音声、動画は解像度と長さに基づいてトークンに分割されます。OrcaRouterはAPIレスポンスでトークンの使用状況を報告します。詳細なトークンカウントルールについては、Googleのドキュメントも参照できます。

コンテキストウィンドウを超えるとどうなりますか？

1,048,576トークンを超える入力は、最も古いコンテンツから切り捨てられます。モデルは超過したトークンを無視します。リクエスト内のトークン総数を監視して、メッセージが制限内に収まるようにしてください。

このバッジを埋め込む

ブログ記事に貼り付け

Google: Gemini 3 Flash Preview•$0.50/M in•3812ms p50•OrcaRouter 経由

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3-flash-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg" alt="OrcaRouter の Google: Gemini 3 Flash Preview" /> </a>

Markdown [![Google: Gemini 3 Flash Preview](https://www.orcarouter.ai/embed/google/gemini-3-flash-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3-flash-preview)

Gemini 3 Flash Preview

Google Gemini 3 Flash Previewとは何ですか？

このモデルのターゲットオーディエンスは誰ですか？

それはどのようなマルチモーダル入力をサポートしていますか？

プレビューの状態はどうなっていますか？また、その安定性はどのくらいですか？