Google Gemini 3.1 Pro Preview: โมเดล multimodal เรือธงที่มีหน้าต่างบริบท 1M และคะแนน 95.6 τ²-Bench ซึ่งเข้าถึงได้ผ่าน OrcaRouter API
Google Gemini 3.1 Pro Preview เป็นโมเดลเรือธงจาก Google ที่เปิดให้ใช้งานในรูปแบบตัวอย่าง เป็นโมเดลแบบมัลติโมดัลที่สามารถประมวลผลอินพุตข้อความ รูปภาพ วิดีโอ เสียง และไฟล์ได้ โมเดลนี้ถูกจัดอยู่ในระดับเรือธง ซึ่งบ่งชี้ว่าออกแบบมาสำหรับแอปพลิเคชันที่มีความต้องการสูงและซับซ้อนซึ่งประสิทธิภาพและความจุเป็นสิ่งสำคัญ เนื่องจากเป็นรุ่นตัวอย่าง อาจมีข้อจำกัดในด้านเสถียรภาพหรือความพร้อมใช้งานเมื่อเปรียบเทียบกับรุ่นที่เสถียร การเข้าถึงทำผ่าน OrcaRouter API
โมเดลนี้ถูกออกแบบมาสำหรับนักพัฒนาและองค์กรที่ต้องการจัดการหน้าต่างบริบทขนาดใหญ่สูงสุดถึง 1,048,688 โทเค็น และต้องการความสามารถในการเข้าใจข้อมูลแบบมัลติโมดัล กรณีการใช้งานรวมถึงการวิเคราะห์เอกสารยาว การกลั่นกรองวิดีโอ แชทบอทขั้นสูงที่จดจำประวัติการสนทนาทั้งหมด และการดึงข้อมูลที่ซับซ้อนจากสื่อผสม สถานะพรีวิวทำให้เหมาะสำหรับการทดลองและบูรณาการในระยะแรก แต่การนำไปใช้งานจริงควรประเมินความเสถียร นอกจากนี้ยังเหมาะสำหรับทีมที่ใช้ API ที่เข้ากันได้กับ OpenAI ของ OrcaRouter อยู่แล้ว ซึ่งต้องการทดสอบความสามารถล่าสุดของ Google
โมเดลรองรับหน้าต่างบริบท (context window) ขนาด 1,048,576 โทเค็น (input) และเอาต์พุตสูงสุด 65,536 โทเค็น รองรับอินพุตหลายรูปแบบ: เสียง, ไฟล์ (เช่น PDF, ไฟล์โค้ด), รูปภาพ, ข้อความ, และวิดีโอ คะแนน benchmark หลักคือ 95.6 บน τ²-Bench ซึ่งเป็นเมตริกที่วัดประสิทธิภาพการทำงานให้สำเร็จ โมเดลนี้ถูกจัดอยู่ในระดับ flagship tier โดยผู้ให้บริการ Google สามารถเข้าถึงได้ผ่าน API ของ OrcaRouter ที่ base URL https://api.orcarouter.ai/v1 ด้วย model ID "google/gemini-3.1-pro-preview"
ในฐานะรุ่นพรีวิวของ Gemini 3.1 Pro โมเดลนี้อยู่ในอันดับสูงสุดของไลน์อัปปัจจุบันของ Google ในกลุ่มรุ่นพรีวิว มีหน้าต่างบริบทที่ใหญ่กว่าอย่างมีนัยสำคัญ (1M โทเค็น) และขีดจำกัดเอาต์พุตที่สูงกว่า (65K โทเค็น) เมื่อเทียบกับรุ่นก่อนอย่าง Gemini 2.0 หรือรุ่นพรีวิว Gemini 3.0 คะแนน τ²-Bench ที่ 95.6 เป็นเกณฑ์มาตรฐานเชิงปริมาณสำหรับประสิทธิภาพที่มุ่งเน้นงาน เมื่อเทียบกับรุ่นพรีวิวอื่นๆ จาก Google รุ่นนี้มุ่งเป้าไปที่กรณีการใช้งานที่ต้องการทั้งความกว้างของบริบทและความลึกของการใช้เหตุผล
Gemini 3.1 Pro Preview เป็นระบบมัลติโมดัลที่สามารถประมวลผลข้อมูลเสียง ไฟล์ (รวมถึงเอกสาร โค้ด และสเปรดชีต) รูปภาพ ข้อความ และวิดีโอ ทำให้สามารถใช้เหตุผลข้ามประเภทข้อมูลที่แตกต่างกันภายในบทสนทนาเดียว ตัวอย่างเช่น คุณสามารถอัปโหลดรูปภาพพร้อมกับข้อความแจ้งที่ถามเกี่ยวกับเนื้อหา หรือวิเคราะห์วิดีโอพร้อมกับบทถอดความ โหมดการป้อนข้อมูลไฟล์รองรับข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง ทำให้มีประโยชน์สำหรับงานวิเคราะห์เอกสารและดึงข้อมูล
โมเดลนี้รองรับหน้าต่างบริบทสูงสุด 1,048,576 โทเค็นสำหรับอินพุต ซึ่งเป็นหนึ่งในหน้าต่างบริบทที่ใหญ่ที่สุดที่มีในโมเดลระดับเรือธง ช่วยให้สามารถประมวลผลเอกสารยาวๆ โค้ดเบสทั้งหมด หรือบันทึกวิดีโอหลายชั่วโมงในคำขอเดียวได้ เมื่อรวมกับขีดจำกัดเอาต์พุตสูงสุด 65,536 โทเค็น ทำให้สามารถสร้างรายงาน บทสรุป หรือสายโซ่การให้เหตุผลแบบหลายขั้นตอนได้อย่างกว้างขวาง โดยไม่ต้องแบ่งหน้า หรือแบ่งอินพุตเป็นส่วนย่อยๆ
กรณีการใช้งานที่เหมาะสมได้แก่ การสรุปเอกสารยาว ๆ เอเจนต์สนทนาแบบหลายรอบที่มีความจำประวัติผู้ใช้ทั้งหมด การวิเคราะห์เนื้อหาวิดีโอ การแยกข้อมูลที่ซับซ้อนจากสื่อผสม และงานเอเจนต์ที่ต้องการความแม่นยำสูง (ตามที่สะท้อนในคะแนน τ²-Bench) โมเดลยังทำงานได้ดีเยี่ยมในงานที่รวมอินพุตหลายประเภท เช่น การวิเคราะห์แผนภูมิในภาพพร้อมกับอ่านข้อความที่เกี่ยวข้อง สำหรับงานที่ง่ายกว่า โมเดลที่ถูกกว่าอาจคุ้มค่ากว่า แต่โอเวอร์เฮดของบริบทขนาดใหญ่นั้นสมเหตุสมผลสำหรับแอปพลิเคชันที่ซับซ้อน
สำหรับงานที่ต้องการเพียงการสร้างข้อความสั้น การจำแนกประเภทอย่างง่าย หรือการตอบสนองที่มีความหน่วงต่ำ การใช้โมเดลที่มีขนาดเล็กกว่าหรือไม่ใช่รุ่นเรือธงอาจเหมาะสมกว่า Gemini 3.1 Pro Preview มีหน้าต่างบริบทขนาดใหญ่และความสามารถหลายรูปแบบที่มาพร้อมกับต้นทุนการคำนวณที่สูงกว่าต่อคำขอ หากกรณีการใช้งานของคุณไม่จำเป็นต้องใช้บริบทเต็ม 1M โทเค็น หรือเอาต์พุต 65K โทเค็น ให้พิจารณาใช้โมเดลที่เบากว่าซึ่งมีให้ผ่าน OrcaRouter เช่น Gemini 2.0 Flash หรือทางเลือกอื่นที่คุ้มค่าด้านต้นทุน ควรประเมินการแลกเปลี่ยนระหว่างต้นทุนและประสิทธิภาพตามการใช้งานโทเค็นอินพุตและเอาต์พุตเฉลี่ยของคุณเสมอ
โมเดลได้คะแนน 95.6 บน τ²-Bench τ²-Bench เป็นเกณฑ์มาตรฐานที่ประเมินประสิทธิภาพในการทำงานให้สำเร็จในงานที่หลากหลายซึ่งเกี่ยวข้องกับ agentic, reasoning และ planning tasks คะแนน 95.6 บ่งชี้ถึงความแม่นยำในระดับสูงในการทำงานดังกล่าวให้สำเร็จ แม้ว่าจะไม่ได้ระบุองค์ประกอบที่แน่นอนของ τ²-Bench แต่คะแนนนี้ทำให้โมเดลนี้เป็นผู้เล่นที่แข็งแกร่งสำหรับการตัดสินใจเชิงโครงสร้างและความท้าทายด้านการให้เหตุผลแบบหลายขั้นตอน มันทำหน้าที่เป็นตัวบ่งชี้เชิงปริมาณของความสามารถของโมเดลเมื่อเทียบกับโมเดลขนาดใหญ่อื่นๆ
รายละเอียดความหน่วงสำหรับ Gemini 3.1 Pro Preview ไม่ได้ระบุไว้ในข้อเท็จจริงที่มีอยู่ อย่างไรก็ตาม เมื่อพิจารณาจากรุ่นเรือธงและหน้าต่างบริบทขนาดใหญ่ (1M โทเค็น) และขีดจำกัดเอาต์พุต (65K โทเค็น) เวลาในการตอบสนองจะแตกต่างกันไปตามความยาวอินพุต เอาต์พุตที่ร้องขอ และโหลดเซิร์ฟเวอร์ การประมวลผลอินพุตที่ยาวมากหรือการสร้างเอาต์พุตขนาดใหญ่จะใช้เวลานานกว่าเมื่อเทียบกับโมเดลขนาดเล็ก สำหรับแอปพลิเคชันแบบเรียลไทม์ ให้พิจารณาใช้โมเดลที่เร็วกว่า API ของ OrcaRouter ไม่ได้รับประกันความหน่วงเฉพาะสำหรับโมเดลตัวอย่างนี้
จุดแข็งของโมเดล ซึ่งอนุมานจากข้อกำหนดเฉพาะของมัน ประกอบด้วย ความจุบริบทขนาดใหญ่มาก (1,048,576 โทเคน) ขีดจำกัดผลลัพธ์สูง (65,536 โทเคน) การรองรับข้อมูลนำเข้าหลายรูปแบบ และคะแนน τ²-Bench ที่แข็งแกร่ง (95.6) คุณสมบัติเหล่านี้ทำให้เหมาะสำหรับงานที่ซับซ้อนซึ่งต้องใช้การคิดเชิงเหตุผลในบริบทที่ยาวและข้อมูลหลายประเภท สถานะตัวอย่างอาจอนุญาตให้เข้าถึงความสามารถขั้นสูงก่อนการเปิดตัวเสถียร การจัดลำดับชั้นระดับธงชาติบ่งชี้ว่าได้รับการออกแบบสำหรับการใช้งานที่มีความต้องการสูง
ในฐานะโมเดลตัวอย่าง Gemini 3.1 Pro Preview อาจไม่มีความเสถียร ความพร้อมใช้งาน หรือการสนับสนุนเทียบเท่ากับรุ่นที่เผยแพร่เสถียร อาจมีการเปลี่ยนแปลงหรือเลิกใช้งานโดยไม่แจ้งให้ทราบล่วงหน้า ไม่มีการระบุตัวเลข latency หรือ throughput ที่เฉพาะเจาะจง ดังนั้นประสิทธิภาพภายใต้ภาระงานจึงไม่ทราบแน่ชัด คะแนน benchmark บน τ²-Bench เป็นเมตริกเดียวและอาจไม่สะท้อนประสิทธิภาพในทุกงาน นอกจากนี้ หน้าต่างบริบทขนาดใหญ่อาจเพิ่มต้นทุนและเวลาในการตอบสนอง ผู้ใช้ควรทดสอบอย่างละเอียดก่อนใช้งานในการผลิต
ไม่มีรายละเอียดราคาสำหรับ Gemini 3.1 Pro Preview ในข้อเท็จจริงที่มีอยู่ ในฐานะที่เป็น flagship model โดยทั่วไปจะมีราคาสูงกว่ารุ่นเล็กหรือรุ่นที่ไม่ใช่ flagship โดยค่าใช้จ่ายมักขึ้นอยู่กับจำนวน input และ output tokens หน้าต่างบริบทขนาดใหญ่ (1M tokens) และขีดจำกัด output (65K tokens) อาจทำให้มีการใช้งาน tokens ต่อคำขอจำนวนมาก OrcaRouter อาจใช้การคิดราคาต่อ token ทั้ง input และ output โดยอาจมีค่าใช้จ่ายเพิ่มเติมสำหรับ multimodal inputs ผู้ใช้ควรตรวจสอบหน้าราคาของ OrcaRouter สำหรับอัตราปัจจุบัน
เมื่อใช้ Gemini 3.1 Pro Preview ตัวขับต้นทุนที่ใหญ่ที่สุดคือการบริโภคโทเคน คำขอเดียวที่ใช้บริบท 1M โทเคนเต็มจะทำให้เกิดต้นทุนโทเคนอินพุตสูง ในทำนองเดียวกัน การสร้างโทเคนเอาต์พุตสูงสุดถึง 65K จะเพิ่มต้นทุนเอาต์พุต สำหรับกรณีการใช้งานที่ไม่ต้องการบริบทหรือเอาต์พุตเต็ม ผู้ใช้อาจสามารถลดต้นทุนได้โดยการตัดทอนอินพุตหรือตั้งค่า max_tokens ต่ำลง การแคช (หาก OrcaRouter รองรับ) อาจลดต้นทุนอินพุตที่ซ้ำซ้อน แต่ไม่ได้ให้รายละเอียดการแคช ประเมินรูปแบบการใช้งานโดยเฉลี่ยเพื่อตัดสินใจว่าโมเดลที่ถูกกว่ามีความคุ้มค่าหรือไม่
ข้อเท็จจริงที่มีอยู่ไม่ได้ระบุว่า OrcaRouter มีการแคชสำหรับ Gemini 3.1 Pro Preview หรือไม่ ผู้ให้บริการ API หลายรายมีบริการแคชโทเค็นสำหรับคำนำหน้าอินพุตที่ใช้ซ้ำ ซึ่งสามารถลดต้นทุนและปรับปรุงเวลาแฝง หากมีการแคช จะเป็นประโยชน์สำหรับกรณีการใช้งานที่ต้องมีคำสั่งซ้ำหรือพรอมต์ระบบบ่อยครั้ง ผู้ใช้ควรตรวจสอบเอกสารของ OrcaRouter เกี่ยวกับการรองรับการแคช หากไม่มีการแคช ต้นทุนเต็มของโทเค็นอินพุตจะเกิดขึ้นในแต่ละคำขอ
ไม่มีการเปรียบเทียบราคาเฉพาะเจาะจง โดยทั่วไปแล้วโมเดลระดับแฟล็กชิปมีราคาต่อโทเคนแพงกว่าโมเดลขนาดเล็ก Gemini 3.1 Pro Preview ซึ่งเป็นพรีวิวระดับแฟล็กชิป น่าจะมีต้นทุนต่อโทเคนสูงกว่า Gemini 2.0 Flash หรือ Gemini 2.0 Pro อย่างไรก็ตาม เนื่องจากเป็นรุ่นพรีวิว ราคาอาจเป็นโปรโมชั่นหรืออาจมีการเปลี่ยนแปลง ผู้ใช้ควรเปรียบเทียบราคาที่ OrcaRouter แสดงไว้สำหรับโมเดล Google แต่ละรุ่นเพื่อเลือกตัวเลือกที่คุ้มค่าที่สุดสำหรับปริมาณงานของตน
หากต้องการใช้ Gemini 3.1 Pro Preview บน OrcaRouter ให้ส่งคำขอไปยัง OpenAI-compatible API endpoint ที่ https://api.orcarouter.ai/v1/chat/completions ตั้งค่า parameter model เป็น "google/gemini-3.1-pro-preview" API รองรับ parameter มาตรฐาน เช่น messages, max_tokens, temperature และ top_p สำหรับอินพุตแบบ multimodal ให้ใช้ content array พร้อม type ที่เหมาะสม (text, image_url ฯลฯ) ตัวอย่างโค้ดและ SDKs มีอยู่ในเอกสารของ OrcaRouter
คุณสามารถกำหนดจำนวนโทเค็นเอาต์พุตสูงสุดได้ถึง 65,536 โดยใช้พารามิเตอร์ max_tokens โมเดลรองรับพารามิเตอร์การสุ่มตัวอย่างทั่วไป เช่น temperature, top_p และอื่นๆ สำหรับอินพุตแบบหลายรูปแบบ (multimodal) ให้ระบุประเภทเนื้อหาใน messages array หน้าต่างบริบท (context window) ขนาด 1,048,576 โทเค็นจะใช้กับโทเค็นอินพุตทั้งหมดรวมกัน พารามิเตอร์ทั้งหมดเป็นไปตามข้อกำหนด OpenAI chat completions โปรดดูเอกสารอ้างอิง API ของ OrcaRouter สำหรับข้อจำกัดเฉพาะของโมเดลหรือพารามิเตอร์เพิ่มเติม
การย้ายไปใช้ OrcaRouter นั้นตรงไปตรงมาเนื่องจากใช้ API ที่เข้ากันได้กับ OpenAI เพียงเปลี่ยน base URL เป็น https://api.orcarouter.ai/v1 และอัปเดต model ID เป็น "google/gemini-3.1-pro-preview" วิธีการตรวจสอบสิทธิ์ (API key) นั้นคล้ายคลึงกัน หากคุณเคยใช้โมเดล Google อื่น คุณอาจต้องปรับเปลี่ยนตามความสามารถที่แตกต่างกัน (เช่น ขนาดหน้าต่างบริบท การจัดการหลายรูปแบบ) ทดสอบด้วยคำขอตัวอย่างเพื่อให้แน่ใจว่าสามารถทำงานร่วมกันได้ เอกสารประกอบของ OrcaRouter มีคู่มือการย้ายข้อมูลสำหรับการตั้งค่าทั่วไป
ในฐานะโมเดลตัวอย่าง Gemini 3.1 Pro Preview อาจมีข้อจำกัดด้านอัตราการใช้งานที่ต่ำกว่า ความน่าเชื่อถือน้อยกว่า หรืออาจมีการเปลี่ยนแปลงโดยไม่แจ้งให้ทราบล่วงหน้า มีไว้สำหรับการทดสอบและประเมินผล หากคุณต้องการโมเดลที่เสถียรสำหรับการผลิต ให้พิจารณาใช้โมเดลที่ไม่ใช่ตัวอย่าง API อาจส่งคืนการตอบสนองเร็วหรือช้าขึ้นอยู่กับโหลด ติดตามประสิทธิภาพและมีโมเดลสำรอง OrcaRouter อาจอัปเดตรหัสโมเดลหรือยกเลิกเวอร์ชันตัวอย่าง วางแผนตามนั้น
เมื่อเทียบกับโมเดล Google รุ่นก่อนหน้าอย่าง Gemini 2.0 Pro ตัวอย่างพรีวิวนี้นำเสนอหน้าต่างบริบทที่ใหญ่กว่าอย่างมาก (1M เทียบกับ 32K โทเค็น) และขีดจำกัดเอาต์พุตที่สูงกว่า (65K เทียบกับ 8K โทเค็น) นอกจากนี้ยังรองรับรูปแบบอินพุตเพิ่มเติม เช่น วิดีโอและไฟล์ ในลักษณะที่บูรณาการมากขึ้น คะแนน τ²-Bench ที่ 95.6 เป็นค่าที่เฉพาะเจาะจงสำหรับโมเดลนี้ และบ่งชี้ถึงประสิทธิภาพด้านงานที่แข็งแกร่ง อย่างไรก็ตาม ในฐานะพรีวิว โมเดลนี้อาจขาดความเสถียรของรุ่นเสถียร Gemini 2.0 หรือ Gemini 3.0 ระดับเรือธงทำให้โมเดลนี้อยู่เหนือ Gemini 2.0 Flash ในด้านความสามารถและต้นทุน
ไม่มีการเปรียบเทียบเกณฑ์มาตรฐานโดยตรง หน้าต่างบริบท 1M โทเค็นของโมเดลนี้เป็นหนึ่งในขนาดที่ใหญ่ที่สุดที่มีอยู่ แข่งขันหรือเกินกว่าคู่แข่งหลายราย การรองรับอินพุตแบบมัลติมอดัลนั้นกว้าง (เสียง ไฟล์ รูปภาพ ข้อความ วิดีโอ) คะแนน τ²-Bench ที่ 95.6 เป็นจุดเปรียบเทียบสำหรับงานเชิงเอเจนต์ แต่หากไม่มีคะแนนของโมเดลอื่นบนเกณฑ์มาตรฐานเดียวกัน การเปรียบเทียบอย่างสมบูรณ์ก็ไม่สามารถทำได้ ผู้ใช้ควรประเมินตามความต้องการเฉพาะกรณีการใช้งานของตน
เลือกโมเดลนี้เมื่องานของคุณต้องการหน้าต่างบริบทที่ใหญ่ที่สุดเท่าที่เป็นไปได้ (สูงสุด 1M tokens) และการสร้างเอาต์พุตสูง (สูงสุด 65K tokens) นอกจากนี้ยังเป็นตัวเลือกที่ดีที่สุดเมื่อคุณต้องการจัดการกับอินพุตหลายรูปแบบ – โดยเฉพาะไฟล์และวิดีโอ – ในการประมวลผลเหตุผลครั้งเดียว คะแนน τ²-Bench ที่สูงบ่งบอกว่าโมเดลนี้โดดเด่นในงานที่ซับซ้อนแบบ agentic หากคุณกำลังใช้ OrcaRouter อยู่แล้วและต้องการทดสอบความสามารถเรือธงล่าสุดของ Google ตัวอย่างนี้เป็นจุดเริ่มต้นที่ดี
เลือกใช้ทางเลือกอื่นหากคุณต้องการโมเดลที่เสถียรและผ่านการตรวจสอบสำหรับการผลิต (เนื่องจากนี่เป็นรุ่นตัวอย่าง) หากกรณีการใช้งานของคุณมีความต้องการด้านเวลาแฝงต่ำหรือการใช้โทเค็นน้อย โมเดลที่ราคาถูกกว่าเช่น Gemini 2.0 Flash หรือโมเดลที่ไม่ใช่ของ Google อาจคุ้มค่ากว่า นอกจากนี้ หากงานของคุณไม่ต้องการบริบท 1M โทเค็นเต็มรูปแบบหรืออินพุตแบบมัลติโมดัล โมเดลขนาดเล็กอาจให้การตอบสนองที่เร็วและถูกกว่า ประเมินการแลกเปลี่ยนระหว่างความสามารถ ต้นทุน และความน่าเชื่อถือสำหรับแอปพลิเคชันเฉพาะของคุณ
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| ระดับ | อินพุต / 1M โทเค็น | เอาต์พุต / 1M โทเค็น | อ่านแคช / 1M | เขียนแคช / 1M |
|---|---|---|---|---|
| ≤ 200K | $2.00 | $12.00 | $0.200 | $0.375 |
| ≤ ∞ | $4.00 | $18.00 | $0.400 | $0.375 |
| เลือกระดับชั้นตามจำนวนโทเค็นอินพุตของแต่ละคำขอ | ||||