Google Gemini 3.1 Pro Preview: 1Mコンテキストウィンドウと95.6 τ²-Benchスコアを備えたフラッグシップマルチモーダルモデル、OrcaRouter API経由でアクセス可能。
Google Gemini 3.1 Pro Preview は、Googleのフラッグシップモデルで、プレビュー版として提供されています。テキスト、画像、動画、音声、ファイル入力を処理可能なマルチモーダルモデルです。本モデルはフラッグシップ層に分類され、パフォーマンスと容量が重要となる高負荷・複雑なアプリケーション向けに設計されています。プレビュー版であるため、安定版と比較して安定性や可用性に制限がある場合があります。アクセスは OrcaRouter API を通じて提供されます。
このモデルは、最大1,048,576トークンまでの大きなコンテキストウィンドウを扱う必要があり、マルチモーダルな理解を必要とする開発者や企業向けに設計されています。ユースケースとしては、長文書の分析、動画モデレーション、会話全体を記憶する高度なチャットボット、複合メディアからの複雑なデータ抽出などがあります。プレビュー段階であるため、実験や早期の統合には適していますが、本番環境でのデプロイには安定性の評価が必要です。また、すでにOrcaRouterのOpenAI互換APIを使用しており、Googleの最新フラッグシップ機能を試してみたいチームにも最適です。
このモデルは、1,048,576トークン(入力)のコンテキストウィンドウと、最大65,536トークンの出力をサポートしています。複数のモダリティ(音声、ファイル(例:PDF、コードファイル)、画像、テキスト、動画)での入力を受け付けます。見出しのベンチマークスコアは、タスク完了パフォーマンスを測定する指標であるτ²-Benchで95.6です。このモデルは、提供元であるGoogleによってフラッグシップ層に分類されています。これは、ベースURL https://api.orcarouter.ai/v1 でOrcaRouterのAPIを介してアクセスされ、モデルIDは "google/gemini-3.1-pro-preview" です。
プレビュー版のGemini 3.1 Proとして、本モデルはGoogleの現行ラインナップの中でプレビューリリースのトップに位置します。以前のGemini 2.0モデルやGemini 3.0プレビューと比較して、大幅に大きなコンテキストウィンドウ(100万トークン)と高い出力制限(65,000トークン)を提供します。τ²-Benchスコア95.6は、タスク指向のパフォーマンスの定量的ベンチマークを示しています。Googleの他のプレビューモデルと比較して、このモデルはコンテキストの広さと推論の深さの両方が求められる最も要求の厳しいユースケースを対象としています。
Gemini 3.1 Pro Previewはマルチモーダルであり、音声、ファイル(文書、コード、スプレッドシートを含む)、画像、テキスト、および動画の入力を処理できます。これにより、単一の会話内で異なるデータタイプにわたって推論することが可能です。例えば、画像とその内容について質問するテキストプロンプトを一緒にアップロードしたり、動画をトランスクリプトとともに分析したりできます。ファイル入力モダリティは構造化データと非構造化データをサポートしており、文書分析やデータ抽出タスクに役立ちます。
このモデルは、入力に対して1,048,576トークンのコンテキストウィンドウをサポートしています。これはフラッグシップモデルで利用可能な最大級のコンテキストウィンドウの1つです。これにより、非常に長い文書、コードベース全体、または何時間ものビデオトランスクリプトを1回のリクエストで処理できます。65,536トークンの出力制限と組み合わせることで、入力をページ分割やチャンク化する必要なく、レポート、要約、または多段階の推論チェーンを広範囲に生成できます。
理想的な使用例としては、長文書の要約、ユーザーの全履歴を記憶したマルチターン会話エージェント、動画コンテンツ分析、複合メディアからの複雑なデータ抽出、そして高い精度が求められるエージェントタスク(τ²-Benchスコアに反映されています)が挙げられます。また、このモデルは、画像内のグラフを分析しながら関連するテキストを読むなど、複数の入力タイプを組み合わせたタスクにも優れています。単純なタスクであれば、より低コストなモデルの方が費用対効果が高い場合もありますが、高度なアプリケーションでは大きなコンテキストのオーバーヘッドが正当化されます。
短いテキスト生成のみが必要なタスクや、単純な分類、低レイテンシ応答が必要な場合、より小型の非フラッグシップモデルの方が適切かもしれません。Gemini 3.1 Pro Previewの大規模なコンテキストウィンドウとマルチモーダル能力は、リクエストごとに高い計算コストが伴います。ユースケースが1Mトークンのコンテキストや65Kトークンの出力を必要としない場合、OrcaRouterを通じて利用可能なより軽量なモデル、例えばGemini 2.0 Flashや他のコスト効率の良い代替案の使用を検討してください。平均的な入力および出力トークン使用量に基づいて、コストパフォーマンスのトレードオフを常に評価してください。
モデルはτ²-Benchで95.6のスコアを達成しました。τ²-Benchは、さまざまなエージェント系、推論系、計画系のタスクにおけるタスク完了パフォーマンスを評価するベンチマークです。95.6というスコアは、そのようなタスクを高い精度で完了できることを示しています。τ²-Benchの正確な構成は明らかにされていませんが、このスコアは、構造化された意思決定や多段階の推論課題において、本モデルが強力なパフォーマンスを発揮することを示しています。これは、他の大規模モデルと比較した場合のモデルの能力を示す定量的指標として機能します。
Gemini 3.1 Pro Preview のレイテンシー詳細は、利用可能な情報では提供されていません。しかし、そのフラッグシップ層と大きなコンテキストウィンドウ(100万トークン)および出力制限(65Kトークン)を考慮すると、応答時間は入力の長さ、要求された出力、サーバー負荷によって異なります。非常に長い入力を処理したり、大きな出力を生成する場合は、より小さなモデルよりも時間がかかります。リアルタイムアプリケーションの場合は、より高速なモデルの使用を検討してください。OrcaRouterのAPIは、このプレビューモデルに対する具体的なレイテンシー保証を提供していません。
モデルの強みは、仕様から推測されるように、非常に大きなコンテキスト容量(1,048,576トークン)、高い出力トークン制限(65,536トークン)、マルチモーダル入力対応、そして高いτ²-Benchスコア(95.6)を含みます。これらの特徴により、長いコンテキストや複数のデータ型にわたる推論を必要とする複雑なタスクに適しています。プレビュー状態では、安定版リリース前に高度な機能への早期アクセスが可能になる場合があります。フラッグシップ層の分類は、高需要アプリケーション向けに設計されていることを示唆しています。
プレビューモデルとして、Gemini 3.1 Pro Previewは安定版リリースと同等の安定性、可用性、サポートを保証するものではありません。予告なく変更や非推奨が発生する可能性があります。具体的なレイテンシやスループットの数値は提供されていないため、負荷時のパフォーマンスは不明です。τ²-Benchのベンチマークスコアは単一の指標であり、すべてのタスクでのパフォーマンスを反映するものではありません。また、大規模なコンテキストウィンドウはコストと応答時間を増加させる可能性があります。本番環境で使用する前に、ユーザーは十分にテストしてください。
Gemini 3.1 Pro Previewの料金詳細は、利用可能な情報には記載されていません。フラッグシップモデルとして、一般的に小型モデルや非フラッグシップモデルより高価であり、コストは通常、入力トークン数と出力トークン数に基づいて決まります。大規模なコンテキストウィンドウ(100万トークン)と出力制限(65,000トークン)により、1リクエストあたりのトークン使用量が大幅に増加する可能性があります。OrcaRouterは、入力と出力の両方に対してトークン単位の料金を適用する場合があり、マルチモーダル入力には追加料金がかかる可能性があります。ユーザーは、最新の料金を確認するためにOrcaRouterの料金ページを参照してください。
Gemini 3.1 Pro Preview を使用する場合、最大のコスト要因はトークン消費です。1M トークンのフルコンテキストを使用する単一リクエストは、高い入力トークンコストが発生します。同様に、最大 65K 出力トークンを生成すると、出力コストが増加します。フルコンテキストや出力を必要としないユースケースでは、入力を切り詰めたり、max_tokens を低く設定することでコストを削減できる場合があります。キャッシュ(OrcaRouter でサポートされている場合)は冗長な入力コストを削減できる可能性がありますが、キャッシュの詳細は提供されていません。平均的な使用パターンを評価して、より安価なモデルの方が経済的かどうかを判断してください。
利用可能な事実では、OrcaRouterがGemini 3.1 Pro Previewに対してキャッシングを提供するかどうかは明記されていません。多くのAPIプロバイダーは、繰り返される入力プレフィックスに対してトークンキャッシングを提供しており、これによりコストを削減し、レイテンシを改善できます。キャッシングが利用可能な場合、頻繁に繰り返される指示やシステムプロンプトが発生するユースケースで有益です。ユーザーはOrcaRouterのドキュメントでキャッシングサポートの有無を確認する必要があります。キャッシングがない場合、各リクエストで入力トークンの全コストが発生します。
具体的な価格比較は提供されていません。一般的に、フラッグシップモデルは小規模モデルよりもトークンあたりのコストが高くなります。Gemini 3.1 Pro Previewはフラッグシッププレビューであるため、Gemini 2.0 FlashやGemini 2.0 Proよりもトークンあたりのコストが高い可能性があります。ただし、プレビュー版であるため、価格はプロモーション価格であるか、変更される可能性があります。ユーザーは、OrcaRouterに表示されている各Googleモデルの価格を比較し、自分のワークロードに最もコスト効率の良いオプションを判断する必要があります。
OrcaRouterでGemini 3.1 Pro Previewを使用するには、OpenAI互換のAPIエンドポイントhttps://api.orcarouter.ai/v1/chat/completionsにリクエストを送信します。modelパラメータを"google/gemini-3.1-pro-preview"に設定してください。APIは、messages、max_tokens、temperature、top_pなどの標準パラメータを受け付けます。マルチモーダル入力の場合は、適切なtype(text、image_urlなど)を持つcontent配列を使用します。コード例とSDKはOrcaRouterのドキュメントで入手できます。
max_tokens パラメータを使用して、最大出力トークンを 65,536 まで設定できます。このモデルは temperature、top_p、およびその他の一般的なサンプリングパラメータをサポートしています。マルチモーダル入力の場合は、messages 配列内でコンテンツタイプを指定してください。1,048,576 トークンのコンテキストウィンドウは、すべての入力トークンの合計に適用されます。すべてのパラメータは OpenAI チャット補完仕様に従います。モデル固有の制限や追加パラメータについては、OrcaRouter の API リファレンスを参照してください。
OrcaRouterへの移行は、OpenAI互換のAPIを使用しているため簡単です。ベースURLをhttps://api.orcarouter.ai/v1に変更し、モデルIDを「google/gemini-3.1-pro-preview」に更新するだけで済みます。認証方法(APIキー)は同様です。別のGoogleモデルを使用していた場合は、コンテキストウィンドウサイズやマルチモーダル処理といった異なる機能に合わせて調整が必要になる場合があります。互換性を確認するために、サンプルリクエストでテストを行ってください。OrcaRouterのドキュメントには、一般的なセットアップ向けの移行ガイドが用意されています。
プレビューモデルとして、Gemini 3.1 Pro Previewはレート制限が低い、信頼性が低い、または予告なく変更される可能性があります。テストおよび評価を目的としています。安定した本番モデルが必要な場合は、非プレビューモデルの使用を検討してください。APIは負荷に応じて応答が速くなったり遅くなったりする可能性があります。パフォーマンスを監視し、フォールバックモデルを用意してください。OrcaRouterはモデルIDを更新したり、プレビューバージョンを非推奨にしたりする可能性があります。それに応じて計画を立ててください。
以前のGoogleモデル(Gemini 2.0 Proなど)と比較して、このプレビュー版はコンテキストウィンドウが大幅に大きく(1M対32Kトークン)、出力制限も高くなっています(65K対8Kトークン)。また、ビデオやファイルなどの追加の入力モダリティをより統合された方法でサポートします。τ²-Benchスコア95.6はこのモデルに固有のものであり、強力なタスク性能を示しています。ただし、プレビュー版であるため、Gemini 2.0やGemini 3.0の安定版の安定性に欠ける可能性があります。フラッグシップティアは、これを能力とコストの面でGemini 2.0 Flashより上位に位置づけています。
直接的なベンチマーク比較は提供されていません。このモデルの100万トークンのコンテキストウィンドウは、利用可能な中で最大級のものであり、多くの競合他社に匹敵するか、それを上回っています。マルチモーダル入力のサポートは広範で(音声、ファイル、画像、テキスト、動画)、τ²-Benchスコア95.6はエージェントタスクの比較ポイントを提供しますが、同じベンチマークにおける他モデルのスコアがないため、完全な比較はできません。ユーザーは自身の特定のユースケース要件に基づいて評価する必要があります。
このモデルは、最大限のコンテキストウィンドウ(最大100万トークン)と高い出力生成(最大65Kトークン)が必要なタスクに選択してください。また、単一の推論パスで複数の入力モダリティ(特にファイルとビデオ)を処理する必要がある場合にも最適です。高いτ²-Benchスコアは、複雑なエージェントタスクに優れていることを示しています。すでにOrcaRouterを使用しており、Googleの最新フラッグシップ機能をテストしたい場合、このプレビューは良い出発点です。
安定した本番環境で検証済みのモデルが必要な場合は別の選択肢を検討してください(これはプレビュー版のため)。レイテンシ要件が低い、またはトークン使用量が少ないユースケースであれば、Gemini 2.0 Flashのような安価なモデルやGoogle以外のモデルの方が費用対効果が高くなります。また、タスクに100万トークンのフルコンテキストやマルチモーダル入力が不要な場合は、より小型のモデルが高速かつ低コストで応答を提供できます。特定のアプリケーションにおいて、能力、コスト、信頼性のトレードオフを評価してください。
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| 階層 | 入力 / 1M tokens | 出力 / 1M tokens | キャッシュ読み取り / 1M | キャッシュ書き込み / 1M |
|---|---|---|---|---|
| ≤ 200K | $2.00 | $12.00 | $0.200 | $0.375 |
| ≤ ∞ | $4.00 | $18.00 | $0.400 | $0.375 |
| 階層はリクエストごとの入力トークン数で決定されます | ||||