Google Gemini 3.1 Pro Preview Custom Tools – บริบท 1M, 95.6 τ²-Bench, หลายรูปแบบผ่าน OrcaRouter.
Google Gemini 3.1 Pro Preview Custom Tools เป็นโมเดลภาษาขนาดใหญ่ในระยะพรีวิวที่พัฒนาโดย Google ออกแบบมาสำหรับงานที่ต้องการการให้เหตุผลแบบยาว หน้าต่างบริบทยาว และการบูรณาการกับเครื่องมือภายนอก โมเดลนี้รองรับอินพุตในรูปแบบข้อความ เสียง รูปภาพ วิดีโอ และไฟล์ ทำให้เป็นโซลูชันแบบมัลติโมดัลสำหรับทั้งการทำความเข้าใจและการสร้างเนื้อหา ผ่าน OrcaRouter คุณสามารถเรียกใช้โมเดลนี้โดยใช้ API ที่เข้ากันได้กับ OpenAI ที่ URL พื้นฐาน https://api.orcarouter.ai/v1 พร้อมรหัสโมเดล "google/gemini-3.1-pro-preview-customtools" ความเข้ากันได้นี้ช่วยให้การบูรณาการราบรื่นสำหรับทีมที่คุ้นเคยกับ SDK ของ OpenAI หรือไคลเอนต์ที่คล้ายกัน เนื่องจากเป็นโมเดลพรีวิว อาจมีข้อจำกัดด้านความพร้อมใช้งานหรือประสิทธิภาพเมื่อเทียบกับรุ่นที่เสถียร
โมเดลนี้เหมาะสำหรับนักพัฒนา นักวิทยาศาสตร์ข้อมูล และทีมองค์กรที่ต้องการประมวลผลเอกสารที่ยาวมาก (สูงสุดถึง 1 ล้านโทเคน) หรือรวมหลายรูปแบบของข้อมูลนำเข้า (ข้อความ เสียง รูปภาพ วิดีโอ ไฟล์) ไว้ในขั้นตอนการใช้เหตุผลเดียว โดยเฉพาะอย่างยิ่งมีค่าสำหรับงานที่เกี่ยวข้องกับการใช้เครื่องมือแบบกำหนดเอง—ซึ่งโมเดลต้องตัดสินใจว่าจะเรียกใช้ฟังก์ชันภายนอกหรือ API เมื่อใดและอย่างไร ทีมที่ทำงานด้านการวิจัย การวิเคราะห์ทางกฎหมาย การประมวลผลสื่อ หรือระบบอัตโนมัติขั้นสูง จะพบว่าบริบทที่กว้างและสมรรถนะการวัดมาตรฐานที่แข็งแกร่งนี้มีประโยชน์ เนื่องจากเป็นรุ่นตัวอย่าง จึงอาจเหมาะสำหรับการสร้างต้นแบบและการประเมินผล มากกว่าระบบการผลิตที่ต้องรับประกันเวลาทำงานหรือเวลาแฝง
โมเดลนี้มีหน้าต่างบริบท (context window) ขนาด 1,048,576 โทเคน และสามารถส่งออกได้สูงสุด 65,536 โทเคน รูปแบบอินพุตครอบคลุมข้อความ เสียง ภาพ วิดีโอ และการอัปโหลดไฟล์ คะแนนเกณฑ์มาตรฐานหลักคือ 95.6 ใน τ²-Bench ซึ่งเป็นการทดสอบการใช้เครื่องมือในการให้เหตุผล ราคาคือ $4.00 ต่อ 1M โทเคนอินพุต และ $18.00 ต่อ 1M โทเคนเอาต์พุต โดยไม่มีส่วนเพิ่มเมื่อเข้าถึงผ่าน OrcaRouter API เข้ากันได้กับ OpenAI และรหัสโมเดลคือ "google/gemini-3.1-pro-preview-customtools" ในฐานะรุ่นตัวอย่าง มันสะท้อนความสามารถล่าสุดแต่อาจมีการเปลี่ยนแปลง
Gemini 3.1 Pro Preview Custom Tools รองรับอินพุตในรูปแบบข้อความ เสียง รูปภาพ วิดีโอ และไฟล์ สิ่งนี้ช่วยให้คุณสามารถรวมการบันทึกเสียง ภาพถ่าย คลิปวิดีโอ และเอกสารที่อัปโหลด พร้อมกับข้อความแจ้งเตือนในคำขอเดียว โมเดลสามารถใช้เหตุผลข้ามรูปแบบสื่อเหล่านี้เพื่อสร้างเอาต์พุตที่เป็นข้อความ ความสามารถแบบหลายรูปแบบนี้ทำให้สามารถอธิบายรูปภาพและถามคำถามเกี่ยวกับมัน ถอดเสียงเสียงขณะทำการวิเคราะห์ หรือรวมวิดีโอกับคำสั่งที่เป็นข้อความ ขีดจำกัดความละเอียด ตัวแปลงสัญญาณ หรือขนาดไฟล์ที่แน่นอนไม่ได้ระบุไว้ในข้อเท็จจริงที่มีอยู่ แต่โมเดลสามารถรับสื่อที่หลากหลายได้โดยตรง
การกำหนด "Custom Tools" หมายความว่าโมเดลได้รับการปรับให้เหมาะสมสำหรับการเรียกใช้ฟังก์ชันหรือ API ที่ผู้ใช้กำหนดขึ้น ซึ่งเป็นส่วนหนึ่งของกระบวนการคิดของโมเดล ในขั้นตอนการทำงานทั่วไป คุณจะให้ชุดคำจำกัดความของฟังก์ชัน (รวมถึงชื่อ พารามิเตอร์ และคำอธิบาย) และโมเดลจะตัดสินใจว่าจะเรียกใช้ฟังก์ชันใดเมื่อใดเพื่อตอบสนองคำขอ ความสามารถนี้ช่วยให้เกิดขั้นตอนการทำงานแบบอัตโนมัติ เช่น การสืบค้นฐานข้อมูล การส่งอีเมล หรือการเรียกใช้โค้ดบางส่วน โมเดลสามารถเรียกใช้เครื่องมือต่างๆ ต่อเนื่องกันได้ คะแนน τ²-Bench ที่สูง (95.6) แสดงถึงประสิทธิภาพที่แข็งแกร่งในงานที่ต้องมีการวางแผนและการประสานงานเครื่องมือ
โมเดลนี้รองรับหน้าต่างบริบทขนาด 1,048,576 โทเค็น (ประมาณเทียบเท่า 1 ล้านโทเค็น) ทำให้คุณสามารถป้อนหนังสือทั้งเล่ม ชุดโค้ดที่ยาว การสนทนาหลายรอบ หรือบันทึกข้อมูลขนาดใหญ่เป็นบริบทได้ ผลลัพธ์สูงสุดคือ 65,536 โทเค็นต่อคำขอ ขนาดเหล่านี้จัดเป็นหนึ่งในขนาดที่ใหญ่ที่สุดที่มีอยู่ในภูมิทัศน์โมเดลปัจจุบัน บริบทขนาดใหญ่มีประโยชน์สำหรับงานต่างๆ เช่น การสรุปบันทึกการสนทนาทั้งหมด การตอบคำถามจากชุดเอกสารขนาดใหญ่ หรือการคงประวัติการสนทนาที่ยาวมากโดยไม่ต้องตัดทอน
เนื่องจาก Gemini 3.1 Pro Preview Custom Tools มีราคาอยู่ที่ $4.00 ต่อ 1M โทเค็นอินพุต และ $18.00 ต่อ 1M โทเค็นเอาต์พุต จึงเป็นบริการระดับพรีเมียม สำหรับงานที่ง่ายกว่า—เช่น การจำแนกข้อความแบบสั้น การสรุปความเบื้องต้น หรือการแชทแบบเทิร์นเดียว—โมเดลที่เล็กกว่าและถูกกว่าอาจจะคุ้มค่ากว่า พิจารณาทางเลือกจาก OrcaRouter เช่น Gemini 1.5 Flash (ต้นทุนต่ำกว่า เวลาแฝงต่ำกว่า) หรือโมเดลน้ำหนักเบาอื่นๆ หากคุณไม่จำเป็นต้องใช้หน้าต่างบริบท 1M อินพุตแบบหลายโหมด หรือประสิทธิภาพในเกณฑ์วัดการใช้เครื่องมือ ใช้โมเดลนี้เมื่อความซับซ้อนของงานสมเหตุสมผลกับต้นทุนต่อโทเค็นที่สูงกว่า
โมเดลได้คะแนนเด่นที่ 95.6 บน τ²-Bench (τ²-Bench) เกณฑ์วัดนี้ประเมินความสามารถของโมเดลในการใช้เหตุผลในการใช้เครื่องมือ: การวางแผนและดำเนินลำดับการเรียกฟังก์ชันเพื่อทำงานจริงให้สำเร็จ คะแนนสูงนี้บ่งชี้ถึงความสามารถที่แข็งแกร่งในการทำงานอัตโนมัติและการตัดสินใจ τ²-Bench เป็นเกณฑ์วัดที่ใหม่กว่าซึ่งเน้นความซับซ้อนของสถานการณ์ในโลกจริง คะแนน 95.6 ถือว่าสูงมาก อย่างไรก็ตาม ควรทราบว่าไม่มีเกณฑ์วัดใดเกณฑ์หนึ่งที่สามารถจับภาพคุณภาพของโมเดลได้ครบทุกด้าน โมเดลอาจมีประสิทธิภาพที่แตกต่างกันบนเกณฑ์วัดอื่นๆ ที่ไม่ได้ระบุไว้ที่นี่
จากผลลัพธ์ของ τ²-Bench แบบจำลองนี้มีความโดดเด่นในงานที่ต้องการการคิดเชิงโครงสร้างและการประสานเครื่องมือ ซึ่งรวมถึงการเรียกค้นข้อมูลแบบหลายขั้นตอน การเปลี่ยนรูปข้อมูล และการเรียกใช้ API หน้าต่างบริบทที่กว้างช่วยให้สามารถจัดการกับคำสั่งที่ยาวมากหรือข้อมูลภายนอกโดยไม่สูญเสียความสอดคล้อง ความสามารถในการรับข้อมูลแบบหลายรูปแบบเป็นอีกหนึ่งจุดแข็ง ซึ่งช่วยให้สามารถให้เหตุผลข้ามประเภทสื่อต่างๆ สำหรับกรณีการใช้งาน เช่น การวิเคราะห์คลิปวิดีโอและตอบคำถามเกี่ยวกับคลิปนั้น หรือการประมวลผลไฟล์เสียงควบคู่ไปกับข้อความค้นหา แบบจำลองนี้มีตำแหน่งที่ได้เปรียบเมื่อเทียบกับทางเลือกที่เป็นข้อความเท่านั้น
ไม่มีเกณฑ์มาตรฐานหรือโมเดลใดที่สมบูรณ์แบบ คะแนน τ²-Bench ที่ 95.6 ไม่ได้รับประกันประสิทธิภาพเดียวกันในทุกงานในโลกจริง โดยเฉพาะอย่างยิ่งงานที่อยู่นอกขอบเขตของเกณฑ์มาตรฐาน โมเดลอาจทำงานได้ต่ำกว่ามาตรฐานในงานที่ต้องใช้ความรู้เฉพาะด้านหรือการประเมินที่เน้นความปลอดภัยซึ่ง τ²-Bench ไม่ครอบคลุม ในฐานะโมเดลตัวอย่าง อาจมีความหน่วงสูงกว่าหรือความน่าเชื่อถือต่ำกว่าโมเดลที่เปิดตัวอย่างเต็มรูปแบบ ข้อเท็จจริงที่มีอยู่ไม่มีตัวเลขความหน่วง ดังนั้นคุณควรทดสอบกับภาระงานของคุณเอง นอกจากนี้ หน้าต่างบริบทขนาดใหญ่อาจเพิ่มเวลาและต้นทุนในการประมวลผล และไม่ใช่ทุกงานที่จะได้รับประโยชน์จากความจุหนึ่งล้านโทเค็นเต็มรูปแบบ
ไม่มีตัวเลขเวลาแฝงที่แน่นอนในข้อมูลที่มีให้สำหรับ Gemini 3.1 Pro Preview Custom Tools โดยทั่วไปแล้ว โมเดลที่มีหน้าต่างบริบทขนาดใหญ่มาก (มากกว่า 1M โทเค็น) อาจใช้เวลานานกว่าในการประมวลผลคำขอ โดยเฉพาะคำขอที่ใช้บริบทเต็มรูปแบบ เวลาแฝงยังขึ้นอยู่กับความซับซ้อนของคำขอ จำนวนการเรียกใช้เครื่องมือ และโหลดของเซิร์ฟเวอร์ในปัจจุบัน OrcaRouter อาจเสนอการตอบกลับแบบสตรีมมิ่งเพื่อลดเวลาจนถึงโทเค็นแรก สำหรับแอปพลิเคชันแบบเรียลไทม์ คุณอาจต้องการเปรียบเทียบประสิทธิภาพกับโมเดลที่มีขนาดเล็กกว่า พิจารณาทดสอบเวลาแฝงด้วยตัวเองโดยใช้พรอมพ์ทั่วไปเพื่อพิจารณาว่าความเร็วตรงตามความต้องการของคุณหรือไม่
ราคาสำหรับ Gemini 3.1 Pro Preview Custom Tools คือ $4.00 ต่อ 1 ล้าน input tokens และ $18.00 ต่อ 1 ล้าน output tokens อัตรานี้คิดตามอัตราของผู้ให้บริการโดยไม่มี markup เพิ่มเติมเมื่อเข้าถึงผ่าน OrcaRouter หมายความว่าราคาที่คุณเห็นคือราคาที่ Google คิด โดยไม่มีค่าธรรมเนียมเพิ่มเติมจาก OrcaRouter Input tokens ประกอบด้วย tokens ทั้งหมดใน prompt (text tokens, image tokens, audio tokens ฯลฯ) ส่วน output tokens คือคำตอบที่สร้างขึ้น ผลลัพธ์สูงสุดของโมเดลคือ 65,536 tokens ดังนั้นคำขอเดียวอาจมีค่าใช้จ่ายสูงถึง 65,536 / 1,000,000 * 18.00 = ประมาณ $1.18 ในส่วนของ output tokens บวกกับค่าใช้จ่าย input tokens
"Zero markup" หมายความว่า OrcaRouter ส่งผ่านต้นทุนต่อโทเคนที่แน่นอนจากผู้ให้บริการ (Google) ถึงคุณ โดยไม่เพิ่มค่าธรรมเนียมใดๆ คุณจ่าย $4.00 ต่อ 1M อินพุตโทเคน และ $18.00 ต่อ 1M เอาต์พุตโทเคน ซึ่งเป็นอัตราเดียวกับที่คุณเรียกใช้ API ของ Google โดยตรง OrcaRouter อาจมีค่าสมัครสมาชิกหรือค่าธรรมเนียมการใช้งานแยกต่างหากสำหรับบริการเกตเวย์ แต่ราคาต่อโทเคนของโมเดลไม่ได้ถูกปรับขึ้น โครงสร้างราคานี้โปร่งใสและช่วยให้คุณจัดงบประมาณได้อย่างแม่นยำ ควรตรวจสอบข้อกำหนดปัจจุบันของ OrcaRouter สำหรับค่าธรรมเนียมเพิ่มเติมใดๆ เสมอ
ค่าใช้จ่ายสูงต่อโทเคนหมายความว่าคุณควรประมาณการใช้งานอย่างรอบคอบ สำหรับพรอมต์ที่ใช้หน้าต่างบริบท 1M เต็ม ต้นทุนอินพุตอาจสูงถึง $4.00 ต่อคำขอ หากงานของคุณสามารถทำได้ด้วยบริบทที่เล็กกว่า ให้พิจารณาตัดทอนหรือใช้โมเดลที่ถูกกว่า การแคชไม่ได้ถูกกล่าวถึงในข้อเท็จจริงที่มี; หาก OrcaRouter เสนอการแคชพรอมต์ อาจช่วยลดต้นทุนสำหรับอินพุตที่ซ้ำกัน นอกจากนี้ เนื่องจากโมเดลเป็นรุ่นพรีวิว ราคาอาจเปลี่ยนแปลงเมื่อมีการเผยแพร่เวอร์ชันเสถียร ประเมินจำนวนโทเคนทั่วไปของเวิร์กโหลดของคุณเพื่อตัดสินใจว่าคุ้มค่าหรือไม่
คุณสามารถเข้าถึงโมเดลผ่าน API ที่เข้ากันได้กับ OpenAI ของ OrcaRouter ตั้งค่า base URL ของคุณเป็น `https://api.orcarouter.ai/v1` และใช้ model ID `google/gemini-3.1-pro-preview-customtools` API รองรับรูปแบบคำขอแบบ OpenAI มาตรฐาน ตัวอย่างการใช้ไลบรารี openai ของ Python: ``` import openai client = openai.OpenAI(base_url="https://api.orcarouter.ai/v1", api_key="YOUR_ORCAROUTER_KEY") response = client.chat.completions.create( model="google/gemini-3.1-pro-preview-customtools", messages=[{"role": "user", "content": "Hello"}] ) ``` คุณต้องมีคีย์ API OrcaRouter ที่ถูกต้อง การรับรองความถูกต้องทำผ่าน header `Authorization`
เนื่องจาก API รองรับมาตรฐานของ OpenAI คุณจึงสามารถใช้พารามิเตอร์มาตรฐาน เช่น `temperature`, `top_p`, `max_tokens`, `stop`, `frequency_penalty`, `presence_penalty` และ `stream` ได้ สำหรับคำขอแบบมัลติโมดัล คุณสามารถรวมรูปภาพ เสียง วิดีโอ หรือไฟล์ในเนื้อหาข้อความโดยใช้รูปแบบอาร์เรย์ สำหรับการใช้เครื่องมือ ให้กำหนดฟังก์ชันในพารามิเตอร์ `tools` เป็นรายการของออบเจ็กต์ JSON โมเดลอาจส่งคืน `tool_calls` ในการตอบกลับ พารามิเตอร์เฉพาะของ API ของ Google (เช่น `safetySettings`) อาจมีหรือไม่มีให้บริการ โปรดดูเอกสารของ OrcaRouter สำหรับรายละเอียด การรองรับพารามิเตอร์ที่แน่นอนอาจแตกต่างกันสำหรับโมเดลตัวอย่าง
การย้ายจาก OpenAI API มาตรฐานนั้นตรงไปตรงมา เพียงเปลี่ยน `base_url` เป็น `https://api.orcarouter.ai/v1` และอัปเดตพารามิเตอร์ `model` เป็น `google/gemini-3.1-pro-preview-customtools` แทนที่คีย์ API ของคุณด้วยคีย์ OrcaRouter โค้ดส่วนใหญ่ที่ใช้ `openai.ChatCompletion.create` หรือรูปแบบใหม่ `client.chat.completions.create` จะทำงานได้โดยมีการเปลี่ยนแปลงเพียงเล็กน้อย หากคุณใช้การเรียกฟังก์ชัน (tool calls) รูปแบบจะเหมือนกับของ OpenAI ทุกประการ อย่างไรก็ตาม โปรดทราบว่าโมเดลนี้มี tokenizer ที่แตกต่างกัน และอาจให้ผลลัพธ์ที่ต่างไปจากพรอมต์เดียวกัน คุณควรทดสอบอย่างละเอียดก่อนเปลี่ยน
OrcaRouter ใช้การตรวจสอบสิทธิ์ด้วย API key ใส่คีย์ของคุณในส่วนหัวของคำขอเป็น `Authorization: Bearer YOUR_ORCAROUTER_API_KEY` คุณจะได้รับคีย์เมื่อลงทะเบียนใช้งาน OrcaRouter คีย์ควรถูกเก็บเป็นความลับและไม่เปิดเผยในโค้ดฝั่งไคลเอ็นต์ วิธีการตรวจสอบสิทธิ์ที่แน่นอนอาจแตกต่างกันไป โปรดดูเอกสาร API ปัจจุบันของ OrcaRouter เสมอ บางเอนด์พอยต์อาจรองรับวิธีการตรวจสอบสิทธิ์เพิ่มเติม แต่เอนด์พอยต์ที่เข้ากันได้กับ OpenAI ใช้รูปแบบ bearer token มาตรฐาน ตรวจสอบให้แน่ใจว่าคำขอของคุณถูกส่งผ่าน HTTPS
Gemini 1.5 Pro รองรับหน้าต่างบริบท 1M โทเค็นและการป้อนข้อมูลแบบหลายรูปแบบ (multimodal) เช่นกัน แต่ 3.1 Pro Preview Custom Tools ทำคะแนน τ²-Bench ได้ 95.6 ซึ่งเป็นการปรับปรุงที่สำคัญเหนือซีรีส์ 1.5 (ไม่ได้ระบุตัวเลขที่แน่นอนสำหรับ 1.5) การเพิ่มประสิทธิภาพ "Custom Tools" เป็นจุดแตกต่างหลัก ซึ่งบ่งชี้ถึงประสิทธิภาพที่ดีกว่าในงานที่ใช้เครื่องมือ (tool‑use tasks) ราคาสูงกว่าสำหรับรุ่นพรีวิว: โดยทั่วไป Gemini 1.5 Pro จะถูกกว่า หากคุณไม่ต้องการประสิทธิภาพการใช้เครื่องมือล่าสุด Gemini 1.5 Pro อาจเป็นทางเลือกที่คุ้มค่ากว่า เนื่องจาก 3.1 Pro เป็นรุ่นพรีวิว จึงอาจมีการรับประกันความเสถียรหรือเวลาทำงานที่น้อยกว่ารุ่น 1.5 Pro ที่เสถียร
GPT‑4o ยังรองรับอินพุตหลายรูปแบบ (multimodal) และการใช้เครื่องมือ แต่หน้าต่างบริบท (context window) โดยทั่วไปคือ 128k โทเค็น ซึ่งเล็กกว่าโทเค็น 1M ของโมเดลนี้มาก คะแนน τ²-Bench สำหรับ GPT‑4o ไม่มีอยู่ในข้อเท็จจริงที่มี ดังนั้นจึงไม่สามารถเปรียบเทียบโดยตรงได้ โดยทั่วไปแล้ว Gemini 3.1 Pro Preview Custom Tools มีหน้าต่างบริบทที่ใหญ่กว่าอย่างมีนัยสำคัญ ทำให้เหมาะสมกับงานเอกสารยาวมากกว่า GPT‑4o อาจมีประสิทธิภาพที่ดีกว่าในการวัดมาตรฐานภาษาบางรายการ หรือการสนับสนุนระบบนิเวศที่กว้างกว่า ราคาสำหรับ GPT‑4o ก็แตกต่างกันด้วย เปรียบเทียบต้นทุนต่อโทเค็น แต่โปรดทราบว่าต้นทุนเอาต์พุตของโมเดลนี้ ($18/M) ค่อนข้างสูง
Claude 3 Opus รองรับคอนเท็กซ์วินโดว์ขนาด 200k โทเค็น ซึ่งน้อยกว่า 1M ของ Gemini 3.1 Pro Preview มาก เบนช์มาร์กอย่าง τ²-Bench มักไม่ถูกรายงานสำหรับ Claude ดังนั้นการเปรียบเทียบโดยตรงจึงเป็นเพียงการคาดเดา Claude ขึ้นชื่อในด้านการให้เหตุผลที่แข็งแกร่งและการทำตามคำแนะนำ การเลือกระหว่างทั้งสองขึ้นอยู่กับความต้องการของคุณสำหรับคอนเท็กซ์ขนาด 1M และอินพุตแบบมัลติโมดัล เทียบกับจุดแข็งเฉพาะด้านความปลอดภัย รูปแบบการเขียน หรือระบบนิเวศ หากกรณีการใช้งานของคุณต้องการประมวลผลเอกสารขนาดใหญ่มากหรือสื่อหลายประเภท คอนเท็กซ์ที่ใหญ่กว่าและการรองรับมัลติโมดัลของโมเดล Gemini ก็เป็นข้อได้เปรียบ ต้นทุนและความพร้อมใช้งานผ่าน OrcaRouter ก็เป็นปัจจัยเช่นกัน
from openai import OpenAI
client = OpenAI(
base_url="https://api.orcarouter.ai/v1",
api_key="$ORCAROUTER_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview-customtools",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)| อินพุต / 1M โทเค็น | $4.00 |
| เอาต์พุต / 1M โทเค็น | $18.00 |
| อ่านแคช / 1M | $0.400 |
| สกุลเงิน | USD |