Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

提供 google · 2026-05-23

Googleの効率的なマルチモーダルモデル、1Mコンテキスト、高出力、OrcaRouterを介したコスト効率の良い価格設定

エンドポイント:/v1/chat/completions /v1beta/models/{model}:generateContent

コンテキスト1.05M トークン

入力text + image + video + file + audio

出力text

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

入力$1.50/ 100万 tokens

出力$9.00/ 100万 tokens

p50 TTFT10.00 s7日

p95 TTFT10.00 s7日

トラフィック7.4Mtokens / 7日

Gemini 3.5 Flash API を取得 →▶ Playground で試す </> API で使用

Gemini 3.5 Flashとは？

Gemini 3.5 Flashは、Googleが開発した大規模言語モデルで、速度と効率性に特化して調整されています。Geminiファミリーに属し、テキスト、画像、動画、ファイル、音声といったマルチモーダル入力を処理し、高速な応答を提供するように設計されています。このモデルは1,048,576トークンのコンテキストウィンドウをサポートしており、書籍全体、1時間におよぶ動画、大規模なコードリポジトリなど、非常に長いシーケンスを処理できます。最大出力長は65,536トークンで、完全なレポートや長大なコードファイルなど、長文の生成が可能です。Gemini 3.5 Flashは、OrcaRouterのOpenAI互換APIを通じてアクセスされます。つまり、最小限のコード変更で既存のアプリケーションに統合できます。

Gemini 3.5 Flashは誰が使うべきですか？

Gemini 3.5 Flashは、高スループット、低レイテンシ、低コストのバランスを必要とする開発者や組織に最適です。特に、リアルタイムチャットボット、コンテンツモデレーションパイプライン、自動カスタマーサポートなど、推論速度が重要な本番環境に適しています。広いコンテキストウィンドウは、大規模なデータセット、長文ドキュメント、広範囲な会話履歴をチャンク分割なしで分析する必要があるユーザーにとって有益です。さらに、画像キャプション生成、動画要約、音声文字起こしなどのマルチモーダルアプリケーションを構築するチームは、複数の入力タイプをネイティブサポートする機能を活用できます。もしワークロードに極めて高い推論能力や複雑な数学計算が求められる場合は、代わりにより高性能で低速なモデルを検討してください。

Gemini 3.5 Flash はどのような入力モダリティをサポートしていますか？

Gemini 3.5 Flashは、テキスト、画像、動画、ファイル、音声の5つの入力モダリティを受け付けます。テキスト入力はプレーンな文字列または構造化メッセージです。画像はBase64エンコードされたデータまたはURLとして渡すことができ、モデルはチャート、図、写真などの視覚コンテンツを解釈できます。動画入力はフレームのシーケンスまたは圧縮動画ファイルとしてサポートされており、モデルは動きや時間的変化を分析できます。ファイル入力はPDF、DOCX、コードファイルなどの一般的な形式に対応し、モデルはそれらの内容を抽出して推論できます。音声入力は生データまたは圧縮形式（MP3、WAVなど）で、音声文字起こしや音響分析が可能です。すべてのモダリティを1つのリクエストで組み合わせることができ、Gemini 3.5 Flashはマルチモーダルタスクのための多用途ツールとなっています。

Gemini 3.5 FlashはOrcaRouterを通じてどのようにアクセスされますか？

OrcaRouterは、OpenAI互換のAPIを介してGemini 3.5 Flashを公開しています。ベースURLはhttps://api.orcarouter.ai/v1、特定のモデルIDは"google/gemini-3.5-flash"です。ベースURLとモデル名を変更するだけで、任意のOpenAI SDKまたは直接HTTPリクエストを使用して呼び出すことができます。認証はOrcaRouterが提供するAPIキーを通じて処理されます。APIは標準のチャット完了エンドポイント、ストリーミング、およびtemperature、top_p、max_tokensなどのオプションパラメータをサポートしています。OrcaRouterはプロバイダー料金に一切マークアップを追加しないため、入力トークン1Mあたり正確に$1.50、出力トークン1Mあたり$9.00をお支払いいただきます。追加のゲートウェイ料金は適用されません。

コードサンプル

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

料金

入力 / 1M tokens	$1.50
出力 / 1M tokens	$9.00
キャッシュ読み取り / 1M	$0.150
キャッシュ書き込み / 1M	$0.083
通貨	USD

パフォーマンス

過去 7 日間

p50 TTFT

10.00 s

出力速度

12384 tok/s

p95 TTFT

10.00 s

エラー率

0.44%

公開ベンチマーク

最終評価 2026-06-25

49.0

AA Coding

比較対象モデルの 68% を上回る

47.0

AA Intelligence

比較対象モデルの 58% を上回る

51.0

AA Math

比較対象モデルの 27% を上回る

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

ソース: artificialanalysis.ai

google の他のモデル

google のすべてのモデルを見る →

Gemini 3.1 Pro Previewフラッグシップ

google/gemini-3.1-pro-preview

入力 $2.00 · 出力 $12.00 / 100万

1.05M コンテキスト· 品質 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

入力 $4.00 · 出力 $18.00 / 100万

1.05M コンテキスト· 品質 10/10

Gemini 3 Flash Preview最安

google/gemini-3-flash-preview

入力 $0.50 · 出力 $3.00 / 100万

1.05M コンテキスト· 品質 9/10

よくある質問

OrcaRouterでのGemini 3.5 Flashの料金はいくらですか？

入力トークンは100万トークンあたり$1.50、出力トークンは100万トークンあたり$9.00です。OrcaRouterは提供元のレートで課金し、マークアップはありません。追加料金はかかりません。

Gemini 3.5 Flashのコンテキストウィンドウサイズは何ですか？

これは1,048,576トークン（約100万トークン）のコンテキストウィンドウをサポートしています。これには入力トークンと出力トークンの両方が含まれます。

Gemini 3.5 Flashの主な強みは何ですか？

低レイテンシ、高スループット、コスト効率に最適化されています。マルチモーダル入力（テキスト、画像、動画、ファイル、音声）と大規模なコンテキストウィンドウをサポートしており、リアルタイムアプリケーションや長文書処理に最適です。

Gemini 3.5 Flash は Gemini 3.5 Pro と比べてどうですか？

Flashはより速く、より安価ですが、複雑な推論や数学的タスクにおけるベンチマーク性能は低めです。Proはより正確ですが、より遅く、より高価です。Flashは高ボリュームでレイテンシが重要なアプリケーションに適しています。

OrcaRouter経由でGemini 3.5 Flashを使用する場合、データはどのように扱われますか？

OrcaRouterはプロキシとして動作し、あなたのデータを保存しません。ただし、Googleのデータ取り扱いポリシーが基盤となるモデルに適用されます。OrcaRouterは、データ保持とプライバシーに関するGoogleの利用規約を確認することを推奨します。

OpenAI互換APIを使用してGemini 3.5 Flashを呼び出すにはどうすればよいですか？

ベースURL https://api.orcarouter.ai/v1 を使用し、モデルID "google/gemini-3.5-flash" を使用し、AuthorizationヘッダーにOrcaRouter APIキーを渡します。このAPIは標準のチャット補完とストリーミングをサポートしています。

Gemini 3.5 Flashはどのくらいの出力長を生成できますか？

応答ごとに最大65,536トークンを生成できます。これは多くのモデルよりも大幅に大きく、長文コンテンツ、コード、または拡張された推論を可能にします。

繰り返しまたはキャッシュされたトークンに対する割引はありますか？

提供された事実に基づき、OrcaRouterはキャッシングやボリュームディスカウントを提供していません。再利用にかかわらず、各トークンは標準レートで請求されます。

このバッジを埋め込む

ブログ記事に貼り付け

Gemini 3.5 Flash•$1.50/M in•10000ms p50•OrcaRouter 経由

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="OrcaRouter の Gemini 3.5 Flash" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

Gemini 3.5 Flashとは？

Gemini 3.5 Flashは誰が使うべきですか？

Gemini 3.5 Flash はどのような入力モダリティをサポートしていますか？

Gemini 3.5 FlashはOrcaRouterを通じてどのようにアクセスされますか？

Gemini 3.5 Flash はどのようなタスクに最適ですか？

いつ、Gemini 3.5 Flashよりも安いモデルを選ぶべきですか？

Gemini 3.5 Flashはストリーミングおよびリアルタイムの対話を処理できますか？

Gemini 3.5 Flashのコンテキストウィンドウを利用するためのベストプラクティスは何ですか？

Gemini 3.5 Flashの既知の強みは何ですか？

Gemini 3.5 Flashの正直な制限は何ですか？

他のモデルと比較してレイテンシはどうですか？

コードと構造化データに対するモデルの出力品質はどうですか？

Gemini 3.5 FlashのOrcaRouterでの価格はどうなっていますか？

入力トークンと出力トークンのコストトレードオフは何ですか？

OrcaRouterにはキャッシュ機能や割引機能がありますか？

OrcaRouter上の他のモデルと比べて、コストはどうですか？

Gemini 3.5 FlashをOrcaRouterのAPI経由で呼び出すにはどうすればよいですか？

Gemini 3.5 Flashではどのようなパラメータが利用可能ですか？

Google AIまたはVertex AI APIからOrcaRouterに移行できますか？

APIを使用する際に、どのようなエラーハンドリングを期待すればよいですか？

Gemini 3.5 Flash は Gemini 3.5 Pro と比べてどうですか？

Gemini 3.5 FlashはGPT-4o Miniと比べてどうですか？

Gemini 3.5 Flash は Claude 3 Haiku とどのように比較されますか？

Gemini 3.5 Flashのオープンソースモデルに対する主な利点は何ですか？

コードサンプル

料金

パフォーマンス

公開ベンチマーク

google の他のモデル

よくある質問

このバッジを埋め込む

Gemini 3.5 Flash

モデル詳細

Gemini 3.5 Flashとは？

Gemini 3.5 Flashは誰が使うべきですか？

Gemini 3.5 Flash はどのような入力モダリティをサポートしていますか？

Gemini 3.5 FlashはOrcaRouterを通じてどのようにアクセスされますか？

Gemini 3.5 Flash はどのようなタスクに最適ですか？

いつ、Gemini 3.5 Flashよりも安いモデルを選ぶべきですか？

Gemini 3.5 Flashはストリーミングおよびリアルタイムの対話を処理できますか？

Gemini 3.5 Flashのコンテキストウィンドウを利用するためのベストプラクティスは何ですか？

Gemini 3.5 Flashの既知の強みは何ですか？

Gemini 3.5 Flashの正直な制限は何ですか？

他のモデルと比較してレイテンシはどうですか？

コードと構造化データに対するモデルの出力品質はどうですか？

Gemini 3.5 FlashのOrcaRouterでの価格はどうなっていますか？

入力トークンと出力トークンのコストトレードオフは何ですか？

OrcaRouterにはキャッシュ機能や割引機能がありますか？

OrcaRouter上の他のモデルと比べて、コストはどうですか？

Gemini 3.5 FlashをOrcaRouterのAPI経由で呼び出すにはどうすればよいですか？

Gemini 3.5 Flashではどのようなパラメータが利用可能ですか？

Google AIまたはVertex AI APIからOrcaRouterに移行できますか？

APIを使用する際に、どのようなエラーハンドリングを期待すればよいですか？

Gemini 3.5 Flash は Gemini 3.5 Pro と比べてどうですか？

Gemini 3.5 FlashはGPT-4o Miniと比べてどうですか？

Gemini 3.5 Flash は Claude 3 Haiku とどのように比較されますか？

Gemini 3.5 Flashのオープンソースモデルに対する主な利点は何ですか？

コードサンプル

料金

パフォーマンス

公開ベンチマーク

google の他のモデル

よくある質問

このバッジを埋め込む