Google Gemini 3 Flash Preview – โมเดลหลายรูปแบบที่มีบริบท 1M โทเค็น, 88.2 MMLU-Pro, เข้าถึงได้ผ่าน OrcaRouter
Google Gemini 3 Flash Preview เป็นโมเดล multimodal ที่พัฒนาโดย Google ซึ่งถูกปรับให้เหมาะกับความเร็วและการประมวลผลบริบทขนาดใหญ่ โดยรองรับอินพุตในรูปแบบข้อความ รูปภาพ ไฟล์ เสียง และวิดีโอ และสามารถสร้างเอาต์พุตได้สูงสุด 65,536 โทเค็น โมเดลนี้มีหน้าต่างบริบทขนาด 1,048,576 โทเค็น ทำให้สามารถใช้เหตุผลกับลำดับข้อมูลที่ยาวมากได้ โดยได้คะแนน 88.2 ในการวัดผล MMLU-Pro ซึ่งบ่งชี้ถึงประสิทธิภาพที่แข็งแกร่งในงานวิชาการและงานใช้เหตุผลที่หลากหลาย เวอร์ชันพรีวิวนี้นี้สามารถใช้งานได้ผ่าน API ที่เข้ากันได้กับ OpenAI ของ OrcaRouter ภายใต้รหัสโมเดล google/gemini-3-flash-preview
Gemini 3 Flash Preview มุ่งเป้าไปที่นักพัฒนาและองค์กรที่สร้างแอปพลิเคชันที่ต้องการการให้เหตุผลแบบมัลติโมดัลที่รวดเร็วพร้อมบริบทขนาดใหญ่ เหมาะสำหรับกรณีการใช้งาน เช่น การวิเคราะห์วิดีโอ การสรุปเอกสารยาว และความเข้าใจเสียง-วิดีโอแบบเรียลไทม์ ราคาของโมเดล—$0.50 ต่อหนึ่งล้านโทเคนอินพุต และ $3.00 ต่อหนึ่งล้านโทเคนเอาต์พุต—ทำให้เข้าถึงได้ทั้งสตาร์ทอัพและองค์กรขนาดใหญ่ เนื่องจากเป็นพรีวิว ผู้ใช้งานกลุ่มแรกสามารถประเมินความสามารถก่อนการเปิดตัวเวอร์ชันเสถียร OrcaRouter ให้การเข้าถึงโมเดลนี้อย่างราบรื่น รวมถึงเอนด์พอยต์ที่เข้ากันได้กับ OpenAI และไม่มีส่วนเพิ่มจากราคาของผู้ให้บริการ
Gemini 3 Flash Preview รองรับรูปแบบอินพุต 5 รูปแบบ ได้แก่ ข้อความ รูปภาพ ไฟล์ เสียง และวิดีโอ ข้อความสามารถเป็นแบบข้อความธรรมดาหรือมีโครงสร้าง รูปภาพสามารถรวมถึงภาพถ่าย แผนภาพ และภาพหน้าจอ ไฟล์ครอบคลุมรูปแบบต่างๆ เช่น PDF และเอกสาร เสียงรวมถึงคำพูดและดนตรี วิดีโอสามารถประมวลผลได้ทั้งแทร็กภาพและเสียง โมเดลสามารถรวมหลายรูปแบบในพรอมต์เดียว เช่น วิเคราะห์วิดีโอไปพร้อมกับอ่านไฟล์ PDF ที่แนบมา ความสามารถรอบด้านนี้ช่วยให้จัดการงานมัลติมีเดียที่ซับซ้อนได้โดยไม่ต้องใช้ไปป์ไลน์แยกกัน โทเค็นอินพุตนับตามกฎของโทเค็นไนเซอร์เฉพาะของแต่ละรูปแบบ
Gemini 3 Flash Preview เป็นรุ่นก่อนวางจำหน่ายของโมเดล Flash รุ่นที่สามของ Google ในฐานะที่เป็นรุ่นพรีวิว อาจมีการเปลี่ยนแปลงในด้านพฤติกรรม ประสิทธิภาพ และความพร้อมใช้งาน โดยทั่วไปแล้ว Google จะอัปเดตรุ่นพรีวิวตามความคิดเห็นของผู้ใช้ และอาจแทนที่ปลายทางพรีวิวด้วยรุ่นเสถียรในที่สุด แม้ว่าโมเดลจะทำงานได้และเหมาะสำหรับการทดสอบและพัฒนา แต่การปรับใช้ในระบบผลิตควรติดตามการอัปเดต OrcaRouter สะท้อนปลายทางของผู้ให้บริการ ทำให้มั่นใจว่าการเปลี่ยนแปลงใดๆ จาก Google จะถูกสะท้อนอย่างรวดเร็ว รหัสโมเดล google/gemini-3-flash-preview จะยังคงสอดคล้องกัน เว้นแต่ Google จะเปลี่ยนชื่อเรียก
โมเดลสามารถประมวลผลข้อความและรูปภาพร่วมกันสำหรับงานต่างๆ เช่น การสร้างคำบรรยายภาพ การตอบคำถามเกี่ยวกับภาพ และการสกัดข้อมูลจากเอกสาร สามารถอ่านข้อความจากเอกสารที่สแกน ตีความแผนภูมิ และตอบคำถามเกี่ยวกับเนื้อหา สำหรับอินพุตที่เป็นข้อความเพียงอย่างเดียว รองรับการเข้าใจภาษา การสรุปความ การแปลภาษา และการสร้างโค้ด หน้าต่างบริบทขนาดใหญ่ (1,048,576 โทเคน) ช่วยให้สามารถจัดการกับการสนทนาที่ยาวมาก หนังสือทั้งเล่ม หรือฐานโค้ดที่กว้างขวางได้ คะแนน MMLU-Pro ที่ 88.2 บ่งชี้ถึงความสามารถในการให้เหตุผลที่แข็งแกร่งในหลากหลายวิชา รวมถึงวิทยาศาสตร์ คณิตศาสตร์ และมนุษยศาสตร์
อินพุตเสียงสามารถเป็นคำพูดโดยตรงหรือเสียงที่บันทึกไว้ โมเดลสามารถถอดความ แปล หรือวิเคราะห์เนื้อหาได้ อินพุตวิดีโอรวมเฟรมภาพและแทร็กเสียง—เหมาะสำหรับการสรุปเนื้อหาวิดีโอ ตรวจจับวัตถุ หรือทำความเข้าใจฉากที่มีการบรรยายพูด หน้าต่างบริบทหมายถึงวิดีโอหรือไฟล์เสียงที่ยาวสามารถนำเข้าได้ในครั้งเดียว ตราบใดที่จำนวนโทเค็นอยู่ภายในขีดจำกัด เอาต์พุตเป็นข้อความ โมเดลไม่สร้างเสียงหรือวิดีโอ API ของ OrcaRouter รองรับการส่งไฟล์เสียง (เช่น MP3, WAV) และไฟล์วิดีโอ (เช่น MP4) เป็นส่วนหนึ่งของเนื้อหาข้อความ
รูปแบบ Flash ได้รับการปรับให้เหมาะสมสำหรับความเร็วและต้นทุน ทำให้เหมาะสำหรับแอปพลิเคชันแบบเรียลไทม์: การถอดเสียงสด, แชทบอทหลายรูปแบบเชิงโต้ตอบ, การสรุปเอกสารอย่างรวดเร็ว, และการกลั่นกรองเนื้อหาข้ามประเภทสื่อ นอกจากนี้ยังมีความเป็นเลิศในสถานการณ์ที่ต้องการบริบทขนาดใหญ่ เช่น การวิเคราะห์บันทึกการประชุมทั้งหมดหรือการประมวลผลเอกสารวิจัยความยาวพร้อมรูปประกอบ กรณีการใช้งานที่ได้รับประโยชน์จากทั้งความเร็วและการให้เหตุผลหลายรูปแบบ—เช่น การทำคำบรรยายวิดีโอหรือการตรวจสอบเอกสารทางกฎหมาย—เหมาะสมอย่างยิ่ง อย่างไรก็ตาม สำหรับงานที่ต้องการการให้เหตุผลเชิงลึกในรูปแบบเดียว (เช่น การสร้างโค้ดล้วนๆ) โมเดลเฉพาะทางอาจทำงานได้ดีกว่า
Gemini 3 Flash Preview มีราคาอยู่ที่ $0.50/1M input และ $3.00/1M output ซึ่งถือว่าต่ำสำหรับโมเดล multimodal แต่ก็ไม่ใช่ราคาที่ต่ำที่สุดที่มี หากกรณีการใช้งานของคุณเป็นแบบข้อความล้วนและต้องการ latency หรือต้นทุนที่ต่ำยิ่งขึ้น ควรพิจารณาโมเดลข้อความเฉพาะอย่างเช่น Gemini 2.0 Flash (ถ้ามี) หรือทางเลือกที่มีราคาใกล้เคียงกัน ในทางกลับกัน หากคุณต้องการความสามารถในการให้เหตุผลที่เหนือกว่าใน benchmark ที่ซับซ้อน (เช่น MATH, GPQA) และมีงบประมาณที่มากกว่า คุณอาจเลือกใช้โมเดลที่ใหญ่กว่าเช่น Gemini 3 Pro หรือ GPT-4o สำหรับงาน multimodal ที่มีปริมาณสูงและไวต่อ latency โมเดล Flash นี้สร้างสมดุลที่ดี
MMLU-Pro เป็นเวอร์ชันขยายของเกณฑ์มาตรฐาน Massive Multitask Language Understanding ซึ่งครอบคลุม 57 หัวข้อพร้อมคำถามที่ท้าทายมากขึ้น คะแนน 88.2 บ่งชี้ว่าโมเดลตอบคำถามได้ถูกต้อง 88.2% ของคำถามทั้งหมด ส่งผลให้เป็นหนึ่งในโมเดลที่มีประสิทธิภาพสูงสุดในการประเมินนี้ สะท้อนถึงความรู้และการใช้เหตุผลที่แข็งแกร่งในหลากหลายโดเมน ตั้งแต่กฎหมายไปจนถึงฟิสิกส์ คะแนนนี้แข่งขันได้กับโมเดลชั้นนำอื่นๆ โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่า Flash models ถูกปรับให้เหมาะสมกับความเร็วมากกว่าความแม่นยำสูงสุด คะแนนที่ให้ไว้เป็นข้อมูลเกณฑ์มาตรฐานหลักของโมเดลนี้ และควรตีความเป็นตัวบ่งชี้ความสามารถทั่วไป ไม่ใช่การรับประกันสำหรับทุกงานเฉพาะ
แม้ว่าจะไม่ได้ระบุตัวเลขความหน่วงที่แน่นอน แต่โมเดล Flash จาก Google ได้รับการออกแบบมาให้มีปริมาณงานสูงและความหน่วงต่ำ โมเดลนี้ตั้งใจให้เร็วกว่าโมเดลขนาดใหญ่กว่าอย่าง Gemini 3 Pro ทำให้เหมาะสำหรับการโต้ตอบแบบเรียลไทม์ ผู้ใช้สามารถคาดหวังเวลาต่อคำขอที่ต่ำกว่าเมื่อเทียบกับรุ่นที่ไม่ใช่ Flash แม้ว่าความเร็วจริงจะขึ้นอยู่กับปัจจัยต่างๆ เช่น ความยาวอินพุต ความยาวเอาต์พุต และการใช้งานพร้อมกัน OrcaRouter ไม่ได้เพิ่มความหน่วงเกินกว่า API ของผู้ให้บริการ เพื่อประสิทธิภาพสูงสุด ให้เก็บพรอมต์ให้สั้นและใช้การตอบสนองแบบสตรีม ขีดจำกัดเอาต์พุตที่มาก (65,536 โทเคน) อาจเพิ่มเวลาในการสร้างสำหรับคำตอบที่ยาวขึ้น
คะแนน MMLU-Pro (88.2) บ่งบอกถึงความสามารถในการใช้เหตุผลและความรู้ทั่วไปที่แข็งแกร่ง ความสามารถของโมเดลในการจัดการกับบริบทขนาด 1M โทเค็นและรูปแบบอินพุตหลายรูปแบบ (ข้อความ รูปภาพ ไฟล์ เสียง วิดีโอ) ทำให้โมเดลนี้ได้เปรียบในงาน multimodal เหนือโมเดลที่รองรับเฉพาะข้อความ โมเดล Flash โดยดั้งเดิมมีความเป็นเลิศในด้านความเร็วและประสิทธิภาพด้านต้นทุน ขีดจำกัดของเอาต์พุตโทเค็นที่สูง (65,536) ช่วยให้สามารถสร้างสรุปแบบยาวหรือการวิเคราะห์ที่ขยายได้ จุดแข็งเหล่านี้ทำให้เป็นตัวเลือกที่หลากหลายสำหรับแอปพลิเคชันที่ต้องการประมวลผลข้อมูลประเภทต่างๆ อย่างรวดเร็วในระดับขนาดใหญ่
ในฐานะรุ่นพรีวิว Flash ความแม่นยำอาจไม่เทียบเท่ารุ่นที่ใหญ่กว่าที่ไม่ใช่ Flash ในการทดสอบเฉพาะทาง (เช่น การแข่งขันเขียนโค้ด การให้เหตุผลทางคณิตศาสตร์หลายขั้นตอน) โมเดลนี้ไม่สร้างภาพหรือเสียง—มีแต่ข้อความเอาต์พุตเท่านั้น สถานะพรีวิวหมายถึงอาจมีการใช้งานไม่ต่อเนื่องหรือการรองรับฟีเจอร์บางส่วน นอกจากนี้ แม้หน้าต่างบริบทจะมีขนาดใหญ่ แต่อินพุตที่ยาวมากจะถูกตัดทอนหากเกิน 1,048,576 โทเคน คะแนน MMLU-Pro เป็นจุดข้อมูลจุดเดียว ประสิทธิภาพในโลกจริงอาจแตกต่างกัน สำหรับงานที่ต้องการความแม่นยำสัมบูรณ์ในโดเมนเฉพาะ ขอแนะนำให้ตรวจสอบความถูกต้อง
ราคาคือ $0.50 ต่อล้านโทเคนนำเข้า และ $3.00 ต่อล้านโทเคนส่งออก อัตราเหล่านี้กำหนดโดย Google และคิดตามอัตราของผู้ให้บริการ—OrcaRouter ไม่คิดส่วนเพิ่มใดๆ โทเคนนำเข้ารวมถึงข้อความทั้งหมดและโทเคนภาพ/เสียงที่เข้ารหัสจากไฟล์ รูปภาพ และวิดีโอ โทเคนส่งออกเป็นเฉพาะข้อความที่สร้างโดยโมเดลเท่านั้น ไม่มีค่าใช้จ่ายเพิ่มเติมสำหรับการเข้าถึง API ผ่าน OrcaRouter นอกเหนือจากต้นทุนต่อโทเคน การตั้งราคาแบบโปร่งใสนี้ช่วยให้คุณประมาณต้นทุนได้ง่าย: ตัวอย่างเช่น โทเคนนำเข้า 1,000 โทเคนและโทเคนส่งออก 500 โทเคนจะมีต้นทุนประมาณ $0.0005 + $0.0015 = $0.002
ด้วยราคา $0.50/1M input และ $3.00/1M output, Gemini 3 Flash Preview มีราคาที่แข่งขันได้สำหรับโมเดล multimodal ที่มี context window 1M โมเดลขนาดใหญ่อย่าง Gemini 3 Pro หรือ GPT-4o มักจะมีราคาต่อ token สูงกว่า โดยเฉพาะ output โมเดลที่ใช้ข้อความอย่างเดียวขนาดเล็กอาจถูกกว่า (เช่น Gemini 2.0 Flash ที่ $0.10/$0.40 ต่อ 1M tokens ถ้าใช้ได้) สำหรับงาน multimodal โมเดลนี้เป็นจุดกึ่งกลางที่คุ้มค่า ค่า markup เป็นศูนย์จาก OrcaRouter ทำให้คุณจ่ายในอัตราของ Google เท่านั้น หากการใช้งานของคุณสูง แม้ความแตกต่างเล็กน้อยต่อ token ก็สามารถสำคัญได้ ดังนั้นควรเปรียบเทียบกับโปรไฟล์ token ของงานเฉพาะของคุณ
ข้อเท็จจริงด้านราคาที่ให้ไว้ไม่รวมส่วนลดการแคชหรือระดับปริมาณใดๆ Google อาจเสนออัตราที่ลดลงสำหรับโทเค็นที่ถูกแคชในบางโมเดล แต่ยังไม่ได้รับการยืนยันสำหรับ Gemini 3 Flash Preview ราคาของ OrcaRouter สะท้อนต้นทุนต่อโทเค็นดิบโดยไม่มีส่วนเพิ่ม ดังนั้นคุณจึงไม่ต้องจ่ายเพิ่มสำหรับเกตเวย์ สำหรับการปรับใช้ขนาดใหญ่ โปรดติดต่อ Google โดยตรงเพื่อข้อตกลงองค์กรที่อาจเป็นไปได้ ตรวจสอบราคาล่าสุดบนหน้าราคาของ OrcaRouter หรือภายในแดชบอร์ดบัญชีของคุณเสมอ เนื่องจากอัตราอาจมีการเปลี่ยนแปลงโดยผู้ให้บริการ ในปัจจุบัน อัตราที่ระบุต่อล้านโทเค็นคือสิ่งที่ใช้บังคับ
คุณใช้ API ที่รองรับ OpenAI ของ OrcaRouter ที่ URL ฐาน https://api.orcarouter.ai/v1 รุ่นโมเดลคือ "google/gemini-3-flash-preview" การตรวจสอบสิทธิ์ดำเนินการผ่านคีย์ API จาก OrcaRouter ตัวอย่างเช่น ด้วย curl คุณสามารถส่งคำขอ POST ไปยัง /v1/chat/completions รูปแบบคำขอเป็นไปตามโครงสร้าง Chat Completions ของ OpenAI คุณต้องรวมพารามิเตอร์ model ที่ตั้งค่าเป็นรุ่นโมเดลที่แน่นอน OrcaRouter จัดการการกำหนดเส้นทางไปยังปลายทางของ Google ตรวจสอบให้แน่ใจว่าคีย์ API ของคุณมีสิทธิ์ที่เหมาะสม รองรับการสตรีมโดยการตั้งค่า stream: true ในเนื้อหาคำขอ
คุณสามารถใช้พารามิเตอร์มาตรฐานของ OpenAI Chat Completions: model, messages (with role: system, user, assistant), temperature, top_p, max_tokens (capped at 65,536), stop sequences, frequency_penalty, presence_penalty, logit_bias, และ stream สำหรับข้อความมัลติโมดัล ให้รวมข้อมูลที่เข้ารหัส base64 หรือรหัสไฟล์ในอาร์เรย์ content โมเดลจะตรวจจับรูปแบบอินพุตโดยอัตโนมัติ โปรดทราบว่าฟีเจอร์ของ OpenAI บางอย่าง (เช่น function calling) อาจไม่รองรับ — ตรวจสอบเอกสารของ OrcaRouter ขอบเขตบริบทของ 1,048,576 โทเค็นจะถูกนำไปใช้กับจำนวนโทเค็นรวมของข้อความ หากเกิน ข้อความที่เก่าที่สุดจะถูกตัดออก
หากคุณกำลังใช้ Vertex AI หรือ Gemini API ของ Google อยู่ การย้ายระบบต้องการการเปลี่ยนแปลงเพียงเล็กน้อย ปรับ URL ฐาน API ของคุณเป็น https://api.orcarouter.ai/v1 ชี้ไปยังรหัสโมเดล "google/gemini-3-flash-preview" และแทนที่การยืนยันตัวตนของ Google ด้วยคีย์ API ของ OrcaRouter รูปแบบข้อความมีความคล้ายคลึงกัน—OrcaRouter จะแปลระหว่างรูปแบบ OpenAI และ Google สำหรับเนื้อหาหลายรูปแบบ (multimodal) ตรวจสอบให้แน่ใจว่าคุณปฏิบัติตามแนวทางการแนบไฟล์ของ OrcaRouter (เช่น ข้อมูลที่เข้ารหัส base64 กับประเภท MIME ที่เหมาะสม) ทดสอบด้วยคำขอจำนวนเล็กน้อยเพื่อยืนยันความสอดคล้องกัน OrcaRouter มีเอกสารสนับสนุนและโค้ดตัวอย่างสำหรับภาษาต่างๆ
โครงสร้างการตอบสนองสอดคล้องกับรูปแบบ Chat Completion ของ OpenAI: ออบเจ็กต์ที่มี choices, usage และ id แต่ละ choice รวมถึงออบเจ็กต์ข้อความที่มี role และ content การใช้ token จะรายงานเป็น `prompt_tokens` และ `completion_tokens` ฟิลด์ `finish_reason` บ่งชี้ว่าทำไมการสร้างจึงหยุด (`stop`, `length`) การตอบสนองแบบสตรีมมิ่งจะปล่อย `delta` objects หากคุณใช้ OpenAI SDK คุณเพียงแค่ต้องเปลี่ยน API key และ base URL จุดสิ้นสุดของ OrcaRouter มีพฤติกรรมเหมือน OpenAI API ทำให้การรวมระบบง่ายขึ้น ความแปลกประหลาดใดๆ ที่เฉพาะเจาะจงกับโมเดลของ Google (เช่น ตัวกรองความปลอดภัย) จะถูกคงไว้ ตรวจสอบการตอบสนองเพื่อหาข้อความที่อาจปฏิเสธ
Gemini 3 Flash Preview คือรุ่นถัดไปของโมเดล Flash ของ Google ที่มีหน้าต่างบริบทที่ใหญ่ขึ้น (1,048,576 เทียบกับ 32K–1M ก่อนหน้านี้ขึ้นอยู่กับเวอร์ชัน) และรองรับมัลติโมดัลที่ดีขึ้นรวมถึงวิดีโอ คะแนน MMLU-Pro ที่ 88.2 สำหรับ 3 Flash Preview บ่งบอกถึงความสามารถในการใช้เหตุผลที่ดีกว่าคะแนนที่รายงานสำหรับ 2 Flash (ไม่ได้ระบุ แต่โดยทั่วไปต่ำกว่า) ราคาสำหรับ 2 Flash ต่ำกว่าต่อโทเค็น ทำให้คุ้มค่ากว่าสำหรับงานง่ายๆ Gemini 3 Flash Preview เร็วกว่าและมีความสามารถมากกว่าสำหรับการใช้เหตุผลแบบมัลติโมดัลที่ซับซ้อน แต่ 2 Flash ยังคงเป็นทางเลือกที่คุ้มค่าสำหรับงานที่ใช้ข้อความหรือรูปภาพอย่างง่าย
GPT-4o จาก OpenAI รองรับการป้อนข้อมูลแบบหลายรูปแบบ (ข้อความ, รูปภาพ, เสียง) และมีหน้าต่างบริบทขนาด 128K โทเค็น ซึ่งเล็กกว่า 1M โทเค็นของ Gemini 3 Flash Preview อย่างมาก ราคาของ GPT-4o แตกต่างกันไป แต่โดยทั่วไปสูงกว่าต่อโทเค็น (เช่น $2.50/1M input, $10/1M output) ต้นทุนที่ต่ำกว่าและบริบทที่ใหญ่กว่าของ Gemini 3 Flash Preview ทำให้เหมาะสำหรับงานหลายรูปแบบที่ยาวหรือมีปริมาณมาก อย่างไรก็ตาม GPT-4o อาจมีจุดแข็งที่แตกต่างกันในการเขียนเชิงสร้างสรรค์หรือการสร้างโค้ด และเกณฑ์มาตรฐานของมัน (เช่น MMLU) ก็เปรียบเทียบได้ การเลือกขึ้นอยู่กับความต้องการขนาดบริบทและความชอบในการผสานรวม
ในผลิตภัณฑ์ของ Google นั้น Gemini 3 Pro เป็นรุ่นที่ใหญ่กว่าและมีราคาแพงกว่า ออกแบบมาเพื่อความแม่นยำสูงสุด (คะแนน MMLU-Pro ที่สูงกว่า) ส่วน Flash เป็นรุ่นที่เน้นความคุ้มค่าและความเร็ว Gemini 2 Flash เป็นรุ่นเก่าและราคาถูกกว่า แต่มีบริบทที่เล็กกว่าและคะแนนมาตรฐานที่อาจต่ำกว่า Gemini 3 Flash Preview เป็นทางเลือกกลาง: ให้ความสามารถในการคิดเชิงตรรกะใกล้เคียงกับ Pro (MMLU-Pro 88.2) ในราคาเพียงเศษเสี้ยว สำหรับผู้ใช้ที่ต้องการบริบทที่ใหญ่ที่สุดและความเร็วที่ดีที่สุด 3 Flash Preview ถือว่าเหมาะสม สำหรับงานที่ต้องการการคิดเชิงตรรกะระดับสูงในรูปแบบที่สั้นกว่า 3 Pro อาจดีกว่า สำหรับงานง่ายๆ 2 Flash หรือรุ่นน้ำหนักเบาอื่นๆ ก็เพียงพอ
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3-flash-preview",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| อินพุต / 1M โทเค็น | $0.500 |
| เอาต์พุต / 1M โทเค็น | $3.00 |
| อ่านแคช / 1M | $0.050 |
| สกุลเงิน | USD |