Gemini 3.5 Flash

Name: Gemini 3.5 Flash API
Brand: google

google/gemini-3.5-flash

โดย google · 2026-05-23

โมเดลมัลติโหมดที่มีประสิทธิภาพของ Google พร้อมบริบท 1M ผลผลิตสูง และราคาที่คุ้มค่าผ่าน OrcaRouter

เอนด์พอยต์:/v1/chat/completions /v1beta/models/{model}:generateContent

ctx1.05M โทเค็น

อินพุตtext + image + video + file + audio

เอาต์พุตtext

p50 TTFT10.00 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

INPUT$1.50/ 1M โทเค็น

OUTPUT$9.00/ 1M โทเค็น

p50 TTFT10.00 s7 วัน

p95 TTFT10.00 s7 วัน

ทราฟฟิก4.5Mโทเค็น / 7วัน

รับ API ของ Gemini 3.5 Flash →▶ ลองใน playground </> ใช้ผ่าน API

Gemini 3.5 Flash คืออะไร?

Gemini 3.5 Flash เป็นโมเดลภาษาขนาดใหญ่ที่พัฒนาโดย Google ซึ่งถูกปรับแต่งมาเพื่อความเร็วและประสิทธิภาพ โดยเป็นส่วนหนึ่งของตระกูล Gemini และถูกออกแบบมาให้รองรับอินพุตแบบมัลติโมดัล ได้แก่ ข้อความ รูปภาพ วิดีโอ ไฟล์ และเสียง พร้อมให้การตอบสนองที่รวดเร็ว โมเดลนี้รองรับหน้าต่างบริบท (context window) ขนาด 1,048,576 โทเคน ทำให้สามารถประมวลผลลำดับที่ยาวมาก เช่น หนังสือทั้งเล่ม วิดีโอความยาวหนึ่งชั่วโมง หรือคลังโค้ดขนาดใหญ่ ความยาวเอาต์พุตสูงสุด 65,536 โทเคน ช่วยให้สามารถสร้างเนื้อหาที่ยาวได้ เช่น รายงานฉบับสมบูรณ์หรือไฟล์โค้ดที่ยาว Gemini 3.5 Flash สามารถเข้าถึงได้ผ่าน API ที่เข้ากันได้กับ OpenAI ของ OrcaRouter ซึ่งหมายความว่าคุณสามารถรวมเข้ากับแอปพลิเคชันที่มีอยู่ได้โดยการเปลี่ยนแปลงโค้ดเพียงเล็กน้อย

ใครควรใช้ Gemini 3.5 Flash?

Gemini 3.5 Flash เหมาะสำหรับนักพัฒนาและองค์กรที่ต้องการความสมดุลระหว่างปริมาณงานสูง เวลาแฝงต่ำ และต้นทุน โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมการผลิตที่ความเร็วในการอนุมานมีความสำคัญ เช่น แชทบอทแบบเรียลไทม์ ท่อไปป์ไลน์การกลั่นกรองเนื้อหา หรือการสนับสนุนลูกค้าอัตโนมัติ หน้าต่างบริบทที่กว้างขวางเป็นประโยชน์ต่อผู้ใช้ที่ต้องการวิเคราะห์ชุดข้อมูลขนาดใหญ่ เอกสารยาว หรือประวัติการสนทนาที่กว้างขวางโดยไม่ต้องแบ่งส่วน นอกจากนี้ ทีมที่สร้างแอปพลิเคชันแบบหลายโมดัล — เช่น การบรรยายภาพ การสรุปวิดีโอ หรือการถอดเสียง — สามารถใช้ประโยชน์จากการรองรับอินพุตหลายประเภทแบบเนทีฟ หากปริมาณงานของคุณต้องการความสามารถในการให้เหตุผลที่สูงมากหรือคณิตศาสตร์ที่ซับซ้อน ให้พิจารณาใช้โมเดลที่ทรงพลังกว่าแต่ช้ากว่าแทน

Gemini 3.5 Flash รองรับรูปแบบการป้อนข้อมูลใดบ้าง?

Gemini 3.5 Flash รองรับอินพุตห้าโมดอลิตี้: ข้อความ, รูปภาพ, วิดีโอ, ไฟล์, และเสียง อินพุตข้อความสามารถเป็นสตริงธรรมดาหรือข้อความที่มีโครงสร้าง รูปภาพสามารถส่งเป็นข้อมูลที่เข้ารหัส base64 หรือ URL; โมเดลสามารถตีความเนื้อหาภาพเช่น แผนภูมิ, ไดอะแกรม, หรือภาพถ่าย อินพุตวิดีโอรองรับเป็นลำดับเฟรมหรือไฟล์วิดีโอที่ถูกบีบอัด ทำให้โมเดลสามารถวิเคราะห์การเคลื่อนไหวและการเปลี่ยนแปลงตามเวลา อินพุตไฟล์ครอบคลุมรูปแบบทั่วไปเช่น PDF, DOCX หรือไฟล์โค้ด; โมเดลสามารถดึงข้อมูลและให้เหตุผลเกี่ยวกับเนื้อหา อินพุตเสียงสามารถเป็นแบบ raw หรือบีบอัด (เช่น MP3, WAV) ทำให้สามารถถอดเสียงพูดและวิเคราะห์เสียงได้ ทั้งหมดสามารถรวมกันในคำขอเดียว ทำให้ Gemini 3.5 Flash เป็นเครื่องมือที่หลากหลายสำหรับงานหลายโมดอล

Gemini 3.5 Flash เข้าถึงผ่าน OrcaRouter ได้อย่างไร?

OrcaRouter เปิดเผย Gemini 3.5 Flash ผ่าน API ที่เข้ากันได้กับ OpenAI URL ฐานคือ https://api.orcarouter.ai/v1 และรหัสโมเดลเฉพาะคือ "google/gemini-3.5-flash" คุณสามารถเรียกใช้โดยใช้ OpenAI SDK ใดๆ หรือคำขอ HTTP โดยตรง เพียงแค่เปลี่ยน URL ฐานและชื่อโมเดล การตรวจสอบสิทธิ์จะจัดการผ่านคีย์ API ที่ OrcaRouter จัดหาให้ API รองรับจุดสิ้นสุดการสนทนาแบบสมบูรณ์มาตรฐาน การสตรีม และพารามิเตอร์เสริม เช่น temperature, top_p และ max_tokens OrcaRouter ไม่บวกกำไรเพิ่มจากอัตราของผู้ให้บริการ ดังนั้นคุณจ่ายตรง $1.50 ต่อ 1M input tokens และ $9.00 ต่อ 1M output tokens ไม่มีค่าธรรมเนียมเกตเวย์เพิ่มเติม

ตัวอย่างโค้ด

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

ราคา

อินพุต / 1M โทเค็น	$1.50
เอาต์พุต / 1M โทเค็น	$9.00
อ่านแคช / 1M	$0.150
เขียนแคช / 1M	$0.083
สกุลเงิน	USD

ประสิทธิภาพ

7 วันที่ผ่านมา

p50 TTFT

10.00 s

ความเร็วเอาต์พุต

10766 tok/s

p95 TTFT

10.00 s

อัตราข้อผิดพลาด

0.44%

เกณฑ์มาตรฐานสาธารณะ

ประเมินล่าสุด 2026-06-25

49.0

AA Coding

ดีกว่า 68% ของโมเดลที่เปรียบเทียบ

47.0

AA Intelligence

ดีกว่า 58% ของโมเดลที่เปรียบเทียบ

51.0

AA Math

ดีกว่า 27% ของโมเดลที่เปรียบเทียบ

GPQA Diamond

45.0 index

MMLU-Pro

59.0 index

τ²-Bench

42.0 index

แหล่งที่มา: artificialanalysis.ai

เพิ่มเติมจาก google

ดูโมเดลทั้งหมดจาก google →

Gemini 3.1 Pro Previewเรือธง

google/gemini-3.1-pro-preview

$2.00 เข้า · $12.00 ออก / 1M

1.05M ctx· คุณภาพ 10/10

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 เข้า · $18.00 ออก / 1M

1.05M ctx· คุณภาพ 10/10

Gemini 3 Flash Previewถูกที่สุด

google/gemini-3-flash-preview

$0.50 เข้า · $3.00 ออก / 1M

1.05M ctx· คุณภาพ 9/10

FAQ

ราคา Gemini 3.5 Flash บน OrcaRouter เท่าไหร่?

โทเค็นอินพุตมีค่าใช้จ่าย $1.50 ต่อ 1 ล้านโทเค็น; โทเค็นเอาต์พุตมีค่าใช้จ่าย $9.00 ต่อ 1 ล้านโทเค็น OrcaRouter คิดค่าบริการตามอัตราของผู้ให้บริการโดยไม่มีมาร์กอัป ไม่มีค่าธรรมเนียมเพิ่มเติม

ขนาดหน้าต่างบริบทของ Gemini 3.5 Flash คือเท่าใด

รองรับหน้าต่างบริบทขนาด 1,048,576 โทเคน (ประมาณ 1 ล้านโทเคน) ซึ่งรวมทั้งโทเคนอินพุตและเอาต์พุตเข้าไว้ด้วยกัน

จุดแข็งหลักของ Gemini 3.5 Flash คืออะไร?

มันถูกปรับแต่งให้เหมาะสำหรับค่า latency ต่ำ, throughput สูง, และประสิทธิภาพด้านต้นทุน มันรองรับอินพุตแบบ multimodal (ข้อความ, รูปภาพ, วิดีโอ, ไฟล์, เสียง) และหน้าต่างบริบทขนาดใหญ่ ทำให้เหมาะสำหรับแอปพลิเคชันแบบเรียลไทม์และการประมวลผลเอกสารยาว

Gemini 3.5 Flash เปรียบเทียบกับ Gemini 3.5 Pro อย่างไร?

Flash เร็วกว่าและถูกกว่า แต่มีประสิทธิภาพด้านการวัด benchmark ที่ต่ำกว่าในการทำงานที่ซับซ้อนด้านการใช้เหตุผลและคณิตศาสตร์ ส่วน Pro มีความแม่นยำมากกว่าแต่ช้าและแพงกว่า Flash เหมาะกับแอปพลิเคชันที่ต้องการปริมาณสูงและไวต่อความหน่วง

เมื่อใช้ Gemini 3.5 Flash ผ่าน OrcaRouter ข้อมูลจะถูกจัดการอย่างไร?

OrcaRouter ทำหน้าที่เป็นพร็อกซีและไม่จัดเก็บข้อมูลของคุณ อย่างไรก็ตาม นโยบายการจัดการข้อมูลของ Google มีผลกับโมเดลพื้นฐาน OrcaRouter แนะนำให้ตรวจสอบข้อกำหนดของ Google เกี่ยวกับการเก็บรักษาข้อมูลและความเป็นส่วนตัว

ฉันจะเรียกใช้ Gemini 3.5 Flash โดยใช้ API ที่เข้ากันได้กับ OpenAI ได้อย่างไร

ใช้ base URL https://api.orcarouter.ai/v1, model ID "google/gemini-3.5-flash", และส่ง OrcaRouter API key ในส่วนหัว Authorization API รองรับการแชทแบบมาตรฐานและการสตรีม

Gemini 3.5 Flash สามารถสร้างความยาวเอาต์พุตได้เท่าใด

มันสามารถสร้างได้สูงสุด 65,536 โทเคนต่อการตอบกลับ ซึ่งมากกว่าโมเดลหลายตัวอย่างมีนัยสำคัญ ทำให้สามารถสร้างเนื้อหาแบบยาว โค้ด หรือการให้เหตุผลที่ขยายความได้

มีส่วนลดสำหรับโทเค็นที่ถูกใช้ซ้ำหรือถูกแคชหรือไม่?

จากข้อเท็จจริงที่ให้มา OrcaRouter ไม่มีการเสนอแคชหรือส่วนลดตามปริมาณ แต่ละโทเคนจะถูกเรียกเก็บเงินในอัตรามาตรฐานโดยไม่คำนึงถึงการใช้งานซ้ำ

ฝังป้ายนี้

วางลงในโพสต์บล็อกของคุณ

Gemini 3.5 Flash•$1.50/M in•10000ms p50•ผ่าน OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.5-flash" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg" alt="Gemini 3.5 Flash บน OrcaRouter" /> </a>

Markdown [![Gemini 3.5 Flash](https://www.orcarouter.ai/embed/google/gemini-3.5-flash.svg)](https://www.orcarouter.ai/models/google/gemini-3.5-flash)

Gemini 3.5 Flash

Gemini 3.5 Flash คืออะไร?

ใครควรใช้ Gemini 3.5 Flash?

Gemini 3.5 Flash รองรับรูปแบบการป้อนข้อมูลใดบ้าง?

Gemini 3.5 Flash เข้าถึงผ่าน OrcaRouter ได้อย่างไร?

Gemini 3.5 Flash เหมาะที่สุดกับงานประเภทใด?

เมื่อใดที่คุณควรเลือกโมเดลที่ราคาถูกกว่าแทน Gemini 3.5 Flash?

Gemini 3.5 Flash สามารถจัดการกับการสตรีมและการโต้ตอบแบบเรียลไทม์ได้หรือไม่?

แนวทางปฏิบัติที่ดีที่สุดสำหรับการใช้หน้าต่างบริบทของ Gemini 3.5 Flash คืออะไร?

Gemini 3.5 Flash มีจุดแข็งที่ทราบกันดีอะไรบ้าง?

ข้อจำกัดที่แท้จริงของ Gemini 3.5 Flash คืออะไร

ความหน่วงเทียบกับรุ่นอื่นๆ เป็นอย่างไร

คุณภาพของผลลัพธ์ของโมเดลสำหรับโค้ดและข้อมูลที่มีโครงสร้างคืออะไร?

Gemini 3.5 Flash มีการคิดราคาอย่างไรบน OrcaRouter?

ข้อแลกเปลี่ยนด้านต้นทุนระหว่างโทเคนอินพุตและเอาต์พุตมีอะไรบ้าง?

OrcaRouter มีฟังก์ชันแคชหรือส่วนลดหรือไม่?

ราคาเปรียบเทียบกับรุ่นอื่นๆ บน OrcaRouter อย่างไร

ฉันจะเรียก Gemini 3.5 Flash ผ่าน API ของ OrcaRouter ได้อย่างไร?

มีพารามิเตอร์อะไรบ้างสำหรับ Gemini 3.5 Flash?

ฉันสามารถย้ายจาก Google AI หรือ Vertex AI API ไปยัง OrcaRouter ได้หรือไม่?

เมื่อใช้ API ฉันควรคาดหวังการจัดการข้อผิดพลาดแบบใด

Gemini 3.5 Flash เปรียบเทียบกับ Gemini 3.5 Pro อย่างไร?

Gemini 3.5 Flash เปรียบเทียบกับ GPT-4o Mini อย่างไร?

Gemini 3.5 Flash เปรียบเทียบกับ Claude 3 Haiku อย่างไร?

ข้อได้เปรียบหลักของ Gemini 3.5 Flash เหนือโมเดลโอเพนซอร์สคืออะไร?

ตัวอย่างโค้ด

ราคา

ประสิทธิภาพ

เกณฑ์มาตรฐานสาธารณะ

เพิ่มเติมจาก google

FAQ

ฝังป้ายนี้

Gemini 3.5 Flash

รายละเอียดโมเดล

Gemini 3.5 Flash คืออะไร?

ใครควรใช้ Gemini 3.5 Flash?

Gemini 3.5 Flash รองรับรูปแบบการป้อนข้อมูลใดบ้าง?

Gemini 3.5 Flash เข้าถึงผ่าน OrcaRouter ได้อย่างไร?

Gemini 3.5 Flash เหมาะที่สุดกับงานประเภทใด?

เมื่อใดที่คุณควรเลือกโมเดลที่ราคาถูกกว่าแทน Gemini 3.5 Flash?

Gemini 3.5 Flash สามารถจัดการกับการสตรีมและการโต้ตอบแบบเรียลไทม์ได้หรือไม่?

แนวทางปฏิบัติที่ดีที่สุดสำหรับการใช้หน้าต่างบริบทของ Gemini 3.5 Flash คืออะไร?

Gemini 3.5 Flash มีจุดแข็งที่ทราบกันดีอะไรบ้าง?

ข้อจำกัดที่แท้จริงของ Gemini 3.5 Flash คืออะไร

ความหน่วงเทียบกับรุ่นอื่นๆ เป็นอย่างไร

คุณภาพของผลลัพธ์ของโมเดลสำหรับโค้ดและข้อมูลที่มีโครงสร้างคืออะไร?

Gemini 3.5 Flash มีการคิดราคาอย่างไรบน OrcaRouter?

ข้อแลกเปลี่ยนด้านต้นทุนระหว่างโทเคนอินพุตและเอาต์พุตมีอะไรบ้าง?

OrcaRouter มีฟังก์ชันแคชหรือส่วนลดหรือไม่?

ราคาเปรียบเทียบกับรุ่นอื่นๆ บน OrcaRouter อย่างไร

ฉันจะเรียก Gemini 3.5 Flash ผ่าน API ของ OrcaRouter ได้อย่างไร?

มีพารามิเตอร์อะไรบ้างสำหรับ Gemini 3.5 Flash?

ฉันสามารถย้ายจาก Google AI หรือ Vertex AI API ไปยัง OrcaRouter ได้หรือไม่?

เมื่อใช้ API ฉันควรคาดหวังการจัดการข้อผิดพลาดแบบใด

Gemini 3.5 Flash เปรียบเทียบกับ Gemini 3.5 Pro อย่างไร?

Gemini 3.5 Flash เปรียบเทียบกับ GPT-4o Mini อย่างไร?

Gemini 3.5 Flash เปรียบเทียบกับ Claude 3 Haiku อย่างไร?

ข้อได้เปรียบหลักของ Gemini 3.5 Flash เหนือโมเดลโอเพนซอร์สคืออะไร?

ตัวอย่างโค้ด

ราคา

ประสิทธิภาพ

เกณฑ์มาตรฐานสาธารณะ

เพิ่มเติมจาก google

FAQ

ฝังป้ายนี้