Gemini 3.1 Pro Preview

Name: Google: Gemini 3.1 Pro Preview API
Brand: Google

google/gemini-3.1-pro-preview

Hàng đầuNổi bật

bởi Google · 2026-02-19

Google Gemini 3.1 Pro Preview: mô hình đa phương thức chủ lực với cửa sổ ngữ cảnh 1M và điểm số τ²-Bench 95.6, truy cập qua OrcaRouter API.

Điểm cuối:/v1/chat/completions /v1beta/models/{model}:generateContent

ngữ cảnh1.05M token

Đầu vàoaudio + file + image + text + video

Đầu ratext

TTFT p505.71 s

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

ĐẦU VÀO$2.00/ 1M token

ĐẦU RA$12.00/ 1M token

TTFT p505.71 s7 ngày

p95 TTFT10.00 s7 ngày

LƯU LƯỢNG5.1Mtokens / 7 ngày

Lấy API Gemini 3.1 Pro Preview →▶ Thử trong Playground </> Dùng qua API

Google Gemini 3.1 Pro Preview là gì?

Google Gemini 3.1 Pro Preview là một mô hình chủ lực của Google, được cung cấp dưới dạng xem trước. Đây là một mô hình đa phương thức có khả năng xử lý đầu vào văn bản, hình ảnh, video, âm thanh và tệp. Mô hình được phân loại ở cấp độ chủ lực, cho thấy nó được thiết kế cho các ứng dụng phức tạp, có nhu cầu cao, nơi hiệu suất và dung lượng là rất quan trọng. Là một bản xem trước, nó có thể có những hạn chế về độ ổn định hoặc khả năng sẵn có so với các bản phát hành ổn định. Quyền truy cập được cung cấp thông qua OrcaRouter API.

Ai nên sử dụng mô hình này?

Mô hình này được thiết kế dành cho các nhà phát triển và doanh nghiệp cần xử lý các cửa sổ ngữ cảnh lớn lên đến 1.048.576 token và yêu cầu khả năng hiểu đa phương thức. Các trường hợp sử dụng bao gồm phân tích tài liệu dài, kiểm duyệt video, chatbot nâng cao có khả năng ghi nhớ toàn bộ cuộc hội thoại và trích xuất dữ liệu phức tạp từ nội dung hỗn hợp. Trạng thái xem trước khiến mô hình phù hợp cho việc thử nghiệm và tích hợp sớm, nhưng triển khai sản xuất cần đánh giá độ ổn định. Mô hình cũng lý tưởng cho các nhóm đã sử dụng API tương thích OpenAI của OrcaRouter muốn thử nghiệm các khả năng hàng đầu mới nhất của Google.

Các thông số kỹ thuật chính là gì?

Mô hình hỗ trợ cửa sổ ngữ cảnh 1,048,576 token (đầu vào) và tối đa đầu ra 65,536 token. Nó chấp nhận đầu vào đa phương thức: âm thanh, tệp (ví dụ: PDF, tệp mã nguồn), hình ảnh, văn bản và video. Điểm chuẩn chính là 95.6 trên τ²-Bench, một chỉ số đo lường hiệu suất hoàn thành tác vụ. Mô hình được nhà cung cấp Google phân loại là cấp độ hàng đầu. Nó được truy cập qua API của OrcaRouter tại base URL https://api.orcarouter.ai/v1 với model ID "google/gemini-3.1-pro-preview".

So với các bản xem trước Gemini khác thì thế nào?

Là một phiên bản xem trước của Gemini 3.1 Pro, mô hình này đứng đầu trong số các bản phát hành xem trước hiện tại của Google. Nó cung cấp cửa sổ ngữ cảnh lớn hơn đáng kể (1M token) và giới hạn đầu ra cao hơn (65K token) so với các mô hình Gemini 2.0 trước đây hoặc các bản xem trước Gemini 3.0. Điểm τ²-Bench 95.6 cung cấp một chuẩn định lượng cho hiệu suất hướng nhiệm vụ. So với các mô hình xem trước khác của Google, mô hình này nhắm đến các trường hợp sử dụng đòi hỏi khắt khe nhất, nơi cần cả bề rộng ngữ cảnh lẫn chiều sâu suy luận.

Mã ví dụ

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Giá

Bậc	Đầu vào / 1M tokens	Đầu ra / 1M tokens	Đọc cache / 1M	Ghi cache / 1M
≤ 200K	$2.00	$12.00	$0.200	$0.375
≤ ∞	$4.00	$18.00	$0.400	$0.375
Bậc được chọn theo số token đầu vào của mỗi yêu cầu

Hiệu suất

7 ngày gần đây

TTFT p50

5.71 s

Tốc độ đầu ra

429 tok/s

p95 TTFT

10.00 s

Tỷ lệ lỗi

Benchmark công khai

Đánh giá gần nhất 2026-02-19

55.5

AA Coding

Tốt hơn 75% số mô hình được so sánh

57.2

AA Intelligence

Tốt hơn 80% số mô hình được so sánh

GPQA Diamond

94.1

Humanity's Last Exam

44.7

IFBench

77.1

Long-Context Recall

72.7

SciCode

58.9

TerminalBench Hard

53.8

τ²-Bench

95.6

Nguồn: artificialanalysis.ai

Thêm từ Google

Xem tất cả mô hình google →

Gemini 3.1 Pro Preview Custom Tools

google/gemini-3.1-pro-preview-customtools

$4.00 đầu vào · $18.00 đầu ra / 1M

1.05M ngữ cảnh· chất lượng 10/10

Gemini 3 Flash PreviewRẻ nhất

google/gemini-3-flash-preview

$0.50 đầu vào · $3.00 đầu ra / 1M

1.05M ngữ cảnh· chất lượng 9/10

Gemini 3.5 Flash

google/gemini-3.5-flash

$1.50 đầu vào · $9.00 đầu ra / 1M

1.05M ngữ cảnh· chất lượng 9/10

Câu hỏi thường gặp

Chi phí sử dụng Gemini 3.1 Pro Preview trên OrcaRouter là bao nhiêu?

Thông tin chi tiết về giá không được cung cấp trong các dữ kiện có sẵn. Là một mô hình chủ lực, nó thường có giá cao hơn trên mỗi token so với các mô hình nhỏ hơn. Chi phí phụ thuộc vào việc sử dụng token đầu vào và đầu ra. Hãy kiểm tra trang giá hiện tại của OrcaRouter để biết mức giá chính xác.

Cửa sổ ngữ cảnh có kích thước bao nhiêu?

Mô hình hỗ trợ cửa sổ ngữ cảnh lên đến 1.048.576 token (đầu vào). Điều này có nghĩa là bạn có thể gửi các tài liệu rất dài, mã nguồn hoặc lịch sử hội thoại trong một yêu cầu duy nhất. Đầu ra tối đa là 65.536 token.

Các điểm mạnh chính của mô hình này là gì?

Các điểm mạnh chính của nó bao gồm cửa sổ ngữ cảnh khổng lồ (1M token), giới hạn đầu ra cao (65K token), đầu vào đa phương thức (âm thanh, tệp tin, hình ảnh, văn bản, video) và điểm số τ²-Bench mạnh mẽ là 95.6, cho thấy độ chính xác cao trong các tác vụ tác tử.

Gemini 3.1 Pro Preview so sánh như thế nào với các mô hình Gemini 2.0?

Nó cung cấp một cửa sổ ngữ cảnh lớn hơn nhiều (1M so với tối đa 32K) và giới hạn đầu ra cao hơn (65K so với 8K). Nó cũng hỗ trợ nhiều phương thức đầu vào hơn. Tuy nhiên, đây là phiên bản xem trước và có thể kém ổn định hơn so với các bản phát hành ổn định của Gemini 2.0.

OrcaRouter có xử lý quyền riêng tư dữ liệu cho các yêu cầu không?

Các chính sách xử lý dữ liệu không được chỉ định trong các dữ kiện được cung cấp. Người dùng nên xem lại tài liệu về xử lý dữ liệu và quyền riêng tư của OrcaRouter để hiểu cách dữ liệu đầu vào và đầu ra được xử lý.

Làm thế nào để gọi mô hình này thông qua API tương thích với OpenAI?

Sử dụng URL cơ sở https://api.orcarouter.ai/v1 và đặt ID mô hình là "google/gemini-3.1-pro-preview". API tuân theo định dạng hoàn chỉnh chat tiêu chuẩn của OpenAI. Xác thực yêu cầu khóa API từ OrcaRouter.

Điểm τ²-Bench là gì và tại sao nó quan trọng?

Mô hình đạt điểm 95.6 trên τ²-Bench, một chuẩn đánh giá đo lường hiệu suất hoàn thành tác vụ. Chỉ số định lượng này phản ánh khả năng của mô hình trong việc xử lý chính xác các tác vụ phức tạp, nhiều bước.

Tôi có thể sử dụng mô hình này cho sản xuất không?

Là một mô hình xem trước, nó được thiết kế để kiểm tra và thử nghiệm. Nó có thể có giới hạn tốc độ thấp hơn, độ tin cậy thấp hơn, và các thay đổi liên tục. Đối với sản xuất, hãy cân nhắc sử dụng một mô hình ổn định, không phải xem trước.

Những phương thức nhập liệu nào được hỗ trợ?

Mô hình hỗ trợ đầu vào âm thanh, tệp tin (ví dụ: PDF, tệp mã nguồn), hình ảnh, văn bản và video. Tất cả có thể được bao gồm trong một yêu cầu duy nhất để suy luận đa phương thức.

Mô hình có hỗ trợ phản hồi trực tuyến không?

Các dữ kiện hiện có không xác định hỗ trợ phát trực tuyến. API của OrcaRouter có khả năng hỗ trợ phát trực tuyến cho các mô hình tương thích, nhưng để xem trước này, hãy kiểm tra tài liệu về khả năng có sẵn tham số stream.

Nhúng huy hiệu này

Dán vào bài blog

Google: Gemini 3.1 Pro Preview•$2.00/M in•5707ms p50•qua OrcaRouter

HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview trên OrcaRouter" /> </a>

Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)

Gemini 3.1 Pro Preview

Google Gemini 3.1 Pro Preview là gì?

Ai nên sử dụng mô hình này?

Các thông số kỹ thuật chính là gì?

So với các bản xem trước Gemini khác thì thế nào?

Nó xử lý những phương thức đầu vào nào?

Nó cung cấp cửa sổ ngữ cảnh lớn đến đâu?

Các trường hợp sử dụng tốt nhất cho mô hình này là gì?

Khi nào nên sử dụng một mô hình rẻ hơn thay thế?

Điểm số τ²-Bench là gì và nó có nghĩa là gì?

Điều gì được biết về tốc độ và độ trễ?

Những điểm mạnh của mô hình dựa trên dữ liệu hiện có là gì?

Những hạn chế trung thực nào cần cân nhắc?

Cấu trúc giá cho mô hình này trên OrcaRouter như thế nào?

Người dùng nên cân nhắc những sự đánh đổi nào về chi phí?

Có hỗ trợ caching để giảm chi phí không?

Chi phí dự kiến so với các mô hình Google khác là bao nhiêu?

Làm thế nào để gọi mô hình qua API của OrcaRouter?

Những tham số nào tôi có thể cấu hình?

Làm thế nào tôi có thể di chuyển từ nhà cung cấp khác sang OrcaRouter?

Tôi cần biết gì về trạng thái xem trước khi sử dụng API?