Google Gemini 3 Flash Preview – نموذج متعدد الوسائط بسياق 1M رمز، 88.2 MMLU-Pro، يمكن الوصول إليه عبر OrcaRouter.
Google Gemini 3 Flash Preview هو نموذج متعدد الوسائط طورته Google، ومُحسَّن للسرعة ومعالجة السياقات الطويلة. يقبل الإدخال بتنسيقات النص والصورة والملف والصوت والفيديو، ويمكنه توليد ما يصل إلى 65,536 رمزًا (token) من المخرجات. يمتلك النموذج نافذة سياقية بسعة 1,048,576 رمزًا، مما يسمح له بالاستدلال عبر تسلسلات طويلة جدًا. سجل النموذج 88.2 على مقياس MMLU-Pro، مما يشير إلى أداء قوي عبر مجموعة واسعة من المهام الأكاديمية والاستدلالية. هذا الإصدار التجريبي متاح عبر واجهة برمجة التطبيقات (API) المتوافقة مع OpenAI من OrcaRouter تحت معرف النموذج google/gemini-3-flash-preview.
Gemini 3 Flash Preview يستهدف المطورين والمؤسسات التي تبني تطبيقات تتطلب تفكيرًا سريعًا متعدد الوسائط مع سياق كبير. إنه مناسب تمامًا لحالات الاستخدام مثل تحليل الفيديو، وتلخيص المستندات الطويلة، والفهم الصوتي-المرئي في الوقت الفعلي. تسعير النموذج — $0.50 لكل مليون رمز إدخال و $3.00 لكل مليون رمز إخراج — يجعله في متناول الشركات الناشئة والمؤسسات على حد سواء. ولأنه إصدار تجريبي، يمكن للمتبنين الأوائل تقييم قدراته قبل الإصدار المستقر. توفر OrcaRouter وصولاً سلسًا إلى هذا النموذج، بما في ذلك نقاط نهاية متوافقة مع OpenAI وبدون هامش ربح على أسعار المزود.
يدعم المعاينة الأولية لـ Gemini 3 Flash خمسة أنماط إدخال: النص، الصورة، الملف، الصوت، والفيديو. يمكن أن يكون النص عاديًا أو منظمًا؛ يمكن أن تشمل الصور الفوتوغرافيات والمخططات ولقطات الشاشة؛ تشمل الملفات تنسيقات مثل PDF والمستندات؛ يشمل الصوت الكلام والموسيقى؛ يمكن معالجة الفيديو باستخدام المسارات البصرية والصوتية معًا. يمكن للنموذج الجمع بين أنماط متعددة في موجه واحد - على سبيل المثال، تحليل فيديو مع قراءة ملف PDF مرفق. تسمح هذه المرونة له بالتعامل مع المهام المعقدة متعددة الوسائط دون الحاجة إلى خطوط أنابيب منفصلة. يتم حساب الرموز المدخلة بناءً على قواعد الرموز الخاصة بكل نمط.
Gemini 3 Flash Preview هو إصدار تجريبي من نموذج فلاش من الجيل الثالث لشركة Google. وبصفته إصدارًا تجريبيًا، قد يخضع لتغييرات في السلوك والأداء والتوفر. عادةً ما تقوم Google بتحديث النماذج التجريبية بناءً على ملاحظات المستخدمين، وقد تستبدل نقاط النهاية التجريبية بإصدارات مستقرة في النهاية. على الرغم من أن النموذج عملي ومناسب للاختبار والتطوير، يجب على عمليات الإنتاج مراقبة التحديثات. يعكس OrcaRouter نقطة نهاية المزوّد، مما يضمن أن أي تغييرات من Google تنعكس فورًا. سيبقى معرف النموذج google/gemini-3-flash-preview ثابتًا ما لم تغير Google تسميته.
يمكن للنموذج معالجة النصوص والصور معًا في مهام مثل التعليق على الصور، والإجابة على الأسئلة البصرية، واستخراج المستندات. يمكنه قراءة النصوص من المستندات الممسوحة ضوئيًا، وتفسير الرسوم البيانية، والإجابة عن أسئلة تتعلق بالمحتوى. بالنسبة للمدخلات النصية فقط، يدعم فهم اللغة والتلخيص والترجمة وتوليد الأكواد البرمجية. تسمح نافذة السياق الكبيرة (1,048,576 رمزًا) بمعالجة محادثات طويلة جدًا، أو كتب كاملة، أو قواعد أكواد برمجية واسعة النطاق. تشير درجة MMLU-Pro البالغة 88.2 إلى استدلال قوي عبر مجموعة واسعة من الموضوعات، بما في ذلك العلوم والرياضيات والعلوم الإنسانية.
يمكن أن يكون الإدخال الصوتي كلامًا مباشرًا أو تسجيلًا صوتيًا؛ حيث يمكن للنموذج نسخ المحتوى أو ترجمته أو تحليله. ويجمع الإدخال المرئي بين الإطارات المرئية والمسار الصوتي—وهو مناسب لتلخيص المحتوى المرئي، أو اكتشاف الأشياء، أو فهم المشاهد المصحوبة بتعليق صوتي. نافذة السياق تعني أنه يمكن استيعاب مقاطع الفيديو أو الملفات الصوتية الطويلة في جلسة واحدة، طالما أن عدد الرموز يقع ضمن الحد المسموح به. المخرجات نصية؛ ولا يُنتج النموذج صوتًا أو فيديوًا. تدعم واجهة OrcaRouter إرسال الملفات الصوتية (مثل MP3 وWAV) والملفات المرئية (مثل MP4) كجزء من محتوى الرسالة.
تم تحسين متغير Flash من حيث السرعة والتكلفة، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي: الترجمة الفورية، روبوتات المحادثة متعددة الوسائط التفاعلية، تلخيص المستندات السريع، والإشراف على المحتوى عبر أنواع الوسائط. كما أنه يتفوق في السيناريوهات التي تتطلب سياقًا كبيرًا، مثل تحليل نصوص الاجتماعات بأكملها أو معالجة الأوراق البحثية الطويلة مع الأشكال المضمنة. حالات الاستخدام التي تستفيد من كل من السرعة والتفكير متعدد الوسائط - مثل التعليق على الفيديو أو مراجعة المستندات القانونية - هي مناسبة تمامًا. ومع ذلك، بالنسبة للمهام التي تتطلب تفكيرًا أعمق في وسيلة واحدة (على سبيل المثال، إنشاء التعليمات البرمجية البحتة)، قد يكون نموذج متخصص أفضل أداءً.
تم تحديد سعر معاينة Gemini 3 Flash بـ 0.50 دولار لكل مليون رمز إدخال و3.00 دولار لكل مليون رمز إخراج، وهو سعر منخفض لنموذج متعدد الوسائط ولكنه ليس الأدنى المتاح. إذا كانت حالة استخدامك تقتصر على النصوص فقط وتتطلب زمن استجابة أو تكلفة أقل، ففكر في نماذج النصوص المخصصة مثل Gemini 2.0 Flash (إن كان متاحًا) أو البدائل المماثلة في السعر. من ناحية أخرى، إذا كنت بحاجة إلى تفوق في الاستدلال على المعايير المعقدة (مثل MATH وGPQA) ولديك ميزانية أكبر، فقد تختار نموذجًا أكبر مثل Gemini 3 Pro أو GPT-4o. بالنسبة لأحمال العمل عالية الحجم والحساسة لزمن الاستجابة ومتعددة الوسائط، يحقق نموذج Flash هذا توازنًا جيدًا.
MMLU-Pro هو نسخة موسعة من معيار فهم اللغة متعدد المهام الشامل (Massive Multitask Language Understanding)، ويغطي 57 موضوعًا مع أسئلة أكثر تحديًا. تشير درجة 88.2 إلى أن النموذج أجاب بشكل صحيح على 88.2% من الأسئلة، مما يضعه بين النماذج الأفضل أداءً في هذا التقييم. يعكس هذا معرفة قوية واستدلالًا عبر مجالات متنوعة، من القانون إلى الفيزياء. هذه الدرجة تنافسية مع النماذج الحدودية الأخرى، خاصةً بالنظر إلى أن نماذج Flash محسّنة للسرعة بدلاً من الدقة القصوى. الدرجة المقدمة هي حقيقة المعيار الرئيسية لهذا النموذج ويجب تفسيرها كمؤشر عام للقدرة، وليس ضمانًا لكل مهمة محددة.
على الرغم من عدم تقديم أرقام زمن الوصول المحددة، إلا أن نماذج Flash من Google مصممة لتحقيق إنتاجية عالية وزمن وصول منخفض. يُفترض أن يكون النموذج أسرع من النماذج الأكبر مثل Gemini 3 Pro، مما يجعله مناسبًا للتفاعلات في الوقت الفعلي. يمكن للمستخدمين توقع أوقات أقل لكل طلب مقارنةً بالإصدارات غير Flash، على الرغم من أن السرعة الفعلية تعتمد على عوامل مثل طول الإدخال وطول الإخراج والاستخدام المتزامن. لا يُضيف OrcaRouter أي زمن وصول إضافي يتجاوز API المزود. للحصول على أفضل أداء، اجعل الاستفسارات موجزة واستخدم الاستجابات المتدفقة. قد يؤدي حد الإخراج الكبير (65,536 رمزًا) إلى زيادة وقت التوليد للإجابات الأطول.
تشير نتيجة MMLU-Pro (88.2) إلى قدرة قوية على الاستدلال والمعرفة العامة. إن قدرة النموذج على معالجة سياق بحجم مليون رمز (1M-token) وإدخالات متعددة الوسائط (نص، صورة، ملف، صوت، فيديو) تمنحه أفضلية في المهام متعددة الوسائط مقارنة بالنماذج التي تدعم النص فقط. تتميز نماذج Flash تقليديًا بالسرعة وكفاءة التكلفة. يسمح الحد الأعلى لمخرجات الرموز البالغ 65,536 بإنشاء ملخصات طويلة أو تحليلات موسعة. هذه المزايا تجعله خيارًا متعدد الاستخدامات للتطبيقات التي تحتاج إلى معالجة أنواع متنوعة من البيانات بسرعة وعلى نطاق واسع.
كمعاينة Flash، قد لا تتطابق دقتها مع دقة النماذج الأكبر غير Flash في المعايير المتخصصة (مثل مسابقات البرمجة، والاستدلال الرياضي متعدد الخطوات). النموذج لا يُنشئ صورًا أو صوتًا—بل مخرجات نصية فقط. حالة المعاينة الخاصة به تعني أنه قد يكون متاحًا بشكل متقطع أو يغطي ميزات جزئيًا. أيضًا، على الرغم من أن نافذة السياق كبيرة، سيتم اقتطاع المدخلات الطويلة جدًا إذا تجاوزت 1,048,576 رمزًا. درجة MMLU-Pro هي نقطة بيانات واحدة؛ الأداء في العالم الحقيقي قد يختلف. بالنسبة للمهام التي تتطلب دقة مطلقة في مجالات متخصصة، يُوصى بالتحقق.
التسعير هو $0.50 لكل مليون رمز إدخال و $3.00 لكل مليون رمز إخراج. هذه الأسعار مقدمة من Google ويتم الفوترة بسعر المزود—لا يضيف OrcaRouter أي هامش ربح. تشمل رموز الإدخال جميع رموز النص والمرئيات/الصوت المشفرة من الملفات والصور والفيديو. رموز الإخراج هي فقط النص الذي يولده النموذج. لا توجد رسوم إضافية للوصول إلى واجهة برمجة التطبيقات عبر OrcaRouter تتجاوز تكاليف كل رمز. هذا التسعير الشفاف يتيح لك تقدير التكاليف بسهولة: على سبيل المثال، إدخال 1,000 رمز وإخراج 500 رمز سيكلف تقريبًا $0.0005 + $0.0015 = $0.002.
بسعر $0.50 لكل مليون رمز للإدخال و $3.00 لكل مليون رمز للإخراج، فإن Gemini 3 Flash Preview مسعّر بشكل تنافسي لنموذج متعدد الوسائط بسعة 1 مليون رمز للسياق. النماذج الأكبر مثل Gemini 3 Pro أو GPT-4o عادة ما تكلف أكثر لكل رمز، خاصة للإخراج. النماذج الأصغر للنصوص فقط قد تكون أرخص (مثل Gemini 2.0 Flash بسعر $0.10/$0.40 لكل مليون رمز، إن أمكن). بالنسبة للمهام متعددة الوسائط، يقدم هذا النموذج حل وسط فعال من حيث التكلفة. الهامش الصفري من OrcaRouter يضمن أنك تدفع بالضبط سعر Google. إذا كان استخدامك مرتفعًا، حتى الفرق الصغير لكل رمز يمكن أن يكون مهمًا، لذا قارن مع ملف الرموز الخاص بمهمتك المحددة.
لا تتضمن حقائق التسعير المقدمة أي خصومات على التخزين المؤقت أو مستويات الحجم. قد تقدم Google أسعارًا مخفضة للرموز المخزنة مؤقتًا في بعض النماذج، ولكن هذا غير مؤكد لـ Gemini 3 Flash Preview. يعكس تسعير OrcaRouter التكلفة الأولية لكل رمز بدون أي هامش ربح، لذا فأنت لا تدفع مبلغًا إضافيًا مقابل البوابة. بالنسبة للنشر على نطاق واسع، اتصل بـ Google مباشرة للحصول على اتفاقيات مؤسسية محتملة. تحقق دائمًا من أحدث الأسعار على صفحة تسعير OrcaRouter أو داخل لوحة التحكم الخاصة بحسابك، حيث أن الأسعار قابلة للتغيير من قبل المزود. حاليًا، الأسعار المذكورة لكل مليون رمز هي المطبقة.
أنت تستخدم واجهة برمجة التطبيقات المتوافقة مع OpenAI من OrcaRouter على عنوان URL الأساسي https://api.orcarouter.ai/v1. معرف النموذج هو "google/gemini-3-flash-preview". يتم التعامل مع المصادقة عبر مفتاح API من OrcaRouter. على سبيل المثال، باستخدام curl يمكنك إرسال طلب POST إلى /v1/chat/completions. يتبع تنسيق الطلب هيكل Chat Completions الخاص بـ OpenAI. يجب عليك تضمين معلمة النموذج مضبوطة على معرف النموذج بالضبط. يقوم OrcaRouter بتوجيه التوجيه إلى نقطة نهاية Google. تأكد من أن مفتاح API الخاص بك لديه الأذونات المناسبة. يتم دعم البث عن طريق تعيين stream: true في نص الطلب.
يمكنك استخدام معاملات OpenAI Chat Completions القياسية: model، messages (مع دور: system، user، assistant)، temperature، top_p، max_tokens (بحد أقصى 65,536)، stop sequences، frequency_penalty، presence_penalty، logit_bias، وstream. للرسائل متعددة الوسائط، قم بتضمين البيانات المشفرة بـ base64 أو معرفات الملفات في مصفوفة content. يكتشف النموذج تلقائيًا طريقة الإدخال. يُرجى ملاحظة أنه قد لا تكون جميع ميزات OpenAI (مثل function calling) مدعومة—تحقق من وثائق OrcaRouter. يتم تطبيق نافذة السياق البالغة 1,048,576 رمزًا على إجمالي عدد رموز الرسالة. إذا تم تجاوز ذلك، يتم اقتطاع أقدم الرسائل.
إذا كنت تستخدم بالفعل Vertex AI من Google أو Gemini API، فإن الانتقال يتطلب تغييرات طفيفة. قم بتعديل عنوان URL الأساسي لواجهة API إلى https://api.orcarouter.ai/v1، وأشر إلى معرف النموذج "google/gemini-3-flash-preview"، واستبدل مصادقة Google الخاصة بك بمفتاح API من OrcaRouter. تنسيق الرسالة مشابه—يقوم OrcaRouter بالترجمة بين صيغ OpenAI و Google. بالنسبة للمحتوى متعدد الوسائط، تأكد من اتباع إرشادات المرفقات الخاصة بـ OrcaRouter (مثل البيانات المشفرة بـ base64 مع أنواع MIME المناسبة). اختبر بعدد صغير من الطلبات لتأكيد التكافؤ. يوفر OrcaRouter وثائق دعم وأكواد أمثلة للغات مختلفة.
يتطابق هيكل الاستجابة مع تنسيق Chat Completion من OpenAI: كائن يحتوي على choices وusage وid. يتضمن كل choice كائن message مع role وcontent. يتم الإبلاغ عن استخدام الرموز المميزة (tokens) كـ prompt_tokens وcompletion_tokens. يشير حقل finish_reason إلى سبب توقف التوليد (stop أو length). تصدر استجابات البث (streaming) كائنات delta. إذا كنت تستخدم SDK من OpenAI، فأنت تحتاج فقط إلى تغيير مفتاح API وعنوان base URL. يعمل نقطة نهاية (endpoint) OrcaRouter مثل API OpenAI، مما يبسط التكامل. أي خصائص خاصة بنموذج Google (مثل مرشحات الأمان) تكون محفوظة؛ تحقق من الاستجابة بحثًا عن رسائل رفض محتملة.
معاينة Gemini 3 Flash هي الجيل التالي من نموذج Flash من Google، وتوفر نافذة سياق أكبر (1,048,576 مقابل 32 ألفًا إلى مليون سابقًا حسب الإصدار) ودعمًا محسّنًا للوسائط المتعددة بما في ذلك الفيديو. تشير نتيجة MMLU-Pro البالغة 88.2 لـ 3 Flash Preview إلى استدلال أفضل من النتائج المبلغ عنها لـ 2 Flash (غير متوفرة، ولكنها عادةً أقل). تسعير 2 Flash أقل لكل رمز، مما يجعله أكثر ملاءمة للميزانية للمهام البسيطة. معاينة Gemini 3 Flash أسرع وأكثر قدرة على الاستدلال المعقد متعدد الوسائط، لكن 2 Flash يظل بديلاً فعالاً من حيث التكلفة للمهام النصية فقط أو مهام الصور البسيطة.
يدعم GPT-4o من OpenAI أيضًا المدخلات متعددة الوسائط (نص، صورة، صوت) وله نافذة سياقية بحجم 128 ألف رمز (token)، وهي أصغر بكثير من 1 مليون رمز في Gemini 3 Flash Preview. تتفاوت أسعار GPT-4o ولكنها عمومًا أعلى لكل رمز (على سبيل المثال، $2.50/1M للمدخلات، $10/1M للمخرجات). التكلفة المنخفضة والسياق الأكبر في Gemini 3 Flash Preview يجعله أكثر ملاءمة للمهام متعددة الوسائط الطويلة أو ذات الحجم الكبير. ومع ذلك، قد يكون لـ GPT-4o نقاط قوة مختلفة في الكتابة الإبداعية أو توليد الأكواد البرمجية، كما أن معايير أدائه (مثل MMLU) قابلة للمقارنة. الاختيار يعتمد على احتياجات حجم السياق وتفضيلات التكامل.
ضمن تشكيلة جوجل، نموذج Gemini 3 Pro هو نموذج أكبر وأكثر تكلفة مصمم لأقصى درجات الدقة (درجات أعلى في اختبار MMLU-Pro). نموذج Flash هو الإصدار المحسَّن من حيث التكلفة والسرعة. نموذج Gemini 2 Flash أقدم وأرخص لكنه يأتي بسياق أصغر وربما درجات معيارية أقل. يقدم Gemini 3 Flash Preview حلاً وسطاً: استدلال قريب من مستوى Pro (88.2 MMLU-Pro) بتكلفة أقل بكثير. للمستخدمين الذين يحتاجون إلى أكبر سياق وأفضل سرعة، فإن 3 Flash Preview هو الخيار المثالي. للاستدلال المتميز على مدخلات أصغر، قد يكون 3 Pro أفضل. للمهام البسيطة، قد يكون 2 Flash أو نماذج خفيفة أخرى كافياً.
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3-flash-preview",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| الإدخال / 1M توكن | $0.500 |
| الإخراج / 1M توكن | $3.00 |
| قراءة الذاكرة المؤقتة / 1M | $0.050 |
| العملة | USD |