Gemini 3.1 Pro Preview

google/gemini-3.1-pro-preview
Hàng đầuNổi bật
bởi Google · 2026-02-19

Google Gemini 3.1 Pro Preview: mô hình đa phương thức chủ lực với cửa sổ ngữ cảnh 1M và điểm số τ²-Bench 95.6, truy cập qua OrcaRouter API.

ngữ cảnh1.05M token
Đầu vàoaudio + file + image + text + video
Đầu ratext
TTFT p505.71 s
ĐẦU VÀO$2.00/ 1M token
ĐẦU RA$12.00/ 1M token
TTFT p505.71 s7 ngày
p95 TTFT10.00 s7 ngày
LƯU LƯỢNG5.1Mtokens / 7 ngày

Chi tiết mô hình

Google Gemini 3.1 Pro Preview là gì?

Google Gemini 3.1 Pro Preview là một mô hình chủ lực của Google, được cung cấp dưới dạng xem trước. Đây là một mô hình đa phương thức có khả năng xử lý đầu vào văn bản, hình ảnh, video, âm thanh và tệp. Mô hình được phân loại ở cấp độ chủ lực, cho thấy nó được thiết kế cho các ứng dụng phức tạp, có nhu cầu cao, nơi hiệu suất và dung lượng là rất quan trọng. Là một bản xem trước, nó có thể có những hạn chế về độ ổn định hoặc khả năng sẵn có so với các bản phát hành ổn định. Quyền truy cập được cung cấp thông qua OrcaRouter API.

Ai nên sử dụng mô hình này?

Mô hình này được thiết kế dành cho các nhà phát triển và doanh nghiệp cần xử lý các cửa sổ ngữ cảnh lớn lên đến 1.048.576 token và yêu cầu khả năng hiểu đa phương thức. Các trường hợp sử dụng bao gồm phân tích tài liệu dài, kiểm duyệt video, chatbot nâng cao có khả năng ghi nhớ toàn bộ cuộc hội thoại và trích xuất dữ liệu phức tạp từ nội dung hỗn hợp. Trạng thái xem trước khiến mô hình phù hợp cho việc thử nghiệm và tích hợp sớm, nhưng triển khai sản xuất cần đánh giá độ ổn định. Mô hình cũng lý tưởng cho các nhóm đã sử dụng API tương thích OpenAI của OrcaRouter muốn thử nghiệm các khả năng hàng đầu mới nhất của Google.

Các thông số kỹ thuật chính là gì?

Mô hình hỗ trợ cửa sổ ngữ cảnh 1,048,576 token (đầu vào) và tối đa đầu ra 65,536 token. Nó chấp nhận đầu vào đa phương thức: âm thanh, tệp (ví dụ: PDF, tệp mã nguồn), hình ảnh, văn bản và video. Điểm chuẩn chính là 95.6 trên τ²-Bench, một chỉ số đo lường hiệu suất hoàn thành tác vụ. Mô hình được nhà cung cấp Google phân loại là cấp độ hàng đầu. Nó được truy cập qua API của OrcaRouter tại base URL https://api.orcarouter.ai/v1 với model ID "google/gemini-3.1-pro-preview".

So với các bản xem trước Gemini khác thì thế nào?

Là một phiên bản xem trước của Gemini 3.1 Pro, mô hình này đứng đầu trong số các bản phát hành xem trước hiện tại của Google. Nó cung cấp cửa sổ ngữ cảnh lớn hơn đáng kể (1M token) và giới hạn đầu ra cao hơn (65K token) so với các mô hình Gemini 2.0 trước đây hoặc các bản xem trước Gemini 3.0. Điểm τ²-Bench 95.6 cung cấp một chuẩn định lượng cho hiệu suất hướng nhiệm vụ. So với các mô hình xem trước khác của Google, mô hình này nhắm đến các trường hợp sử dụng đòi hỏi khắt khe nhất, nơi cần cả bề rộng ngữ cảnh lẫn chiều sâu suy luận.

Mã ví dụ

from openai import OpenAI

client = OpenAI(
    base_url="https://api.orcarouter.ai/v1",
    api_key="$ORCAROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)

Giá

BậcĐầu vào / 1M tokensĐầu ra / 1M tokensĐọc cache / 1MGhi cache / 1M
200K$2.00$12.00$0.200$0.375
$4.00$18.00$0.400$0.375
Bậc được chọn theo số token đầu vào của mỗi yêu cầu

Hiệu suất

TTFT p50
5.71 s
Tốc độ đầu ra
429 tok/s
p95 TTFT
10.00 s
Tỷ lệ lỗi
0%

Benchmark công khai

55.5
AA Coding
Tốt hơn 75% số mô hình được so sánh
57.2
AA Intelligence
Tốt hơn 80% số mô hình được so sánh
GPQA Diamond
94.1
Humanity's Last Exam
44.7
IFBench
77.1
Long-Context Recall
72.7
SciCode
58.9
TerminalBench Hard
53.8
τ²-Bench
95.6
Nguồn: artificialanalysis.ai

Câu hỏi thường gặp

Chi phí sử dụng Gemini 3.1 Pro Preview trên OrcaRouter là bao nhiêu?
Thông tin chi tiết về giá không được cung cấp trong các dữ kiện có sẵn. Là một mô hình chủ lực, nó thường có giá cao hơn trên mỗi token so với các mô hình nhỏ hơn. Chi phí phụ thuộc vào việc sử dụng token đầu vào và đầu ra. Hãy kiểm tra trang giá hiện tại của OrcaRouter để biết mức giá chính xác.
Cửa sổ ngữ cảnh có kích thước bao nhiêu?
Mô hình hỗ trợ cửa sổ ngữ cảnh lên đến 1.048.576 token (đầu vào). Điều này có nghĩa là bạn có thể gửi các tài liệu rất dài, mã nguồn hoặc lịch sử hội thoại trong một yêu cầu duy nhất. Đầu ra tối đa là 65.536 token.
Các điểm mạnh chính của mô hình này là gì?
Các điểm mạnh chính của nó bao gồm cửa sổ ngữ cảnh khổng lồ (1M token), giới hạn đầu ra cao (65K token), đầu vào đa phương thức (âm thanh, tệp tin, hình ảnh, văn bản, video) và điểm số τ²-Bench mạnh mẽ là 95.6, cho thấy độ chính xác cao trong các tác vụ tác tử.
Gemini 3.1 Pro Preview so sánh như thế nào với các mô hình Gemini 2.0?
Nó cung cấp một cửa sổ ngữ cảnh lớn hơn nhiều (1M so với tối đa 32K) và giới hạn đầu ra cao hơn (65K so với 8K). Nó cũng hỗ trợ nhiều phương thức đầu vào hơn. Tuy nhiên, đây là phiên bản xem trước và có thể kém ổn định hơn so với các bản phát hành ổn định của Gemini 2.0.
OrcaRouter có xử lý quyền riêng tư dữ liệu cho các yêu cầu không?
Các chính sách xử lý dữ liệu không được chỉ định trong các dữ kiện được cung cấp. Người dùng nên xem lại tài liệu về xử lý dữ liệu và quyền riêng tư của OrcaRouter để hiểu cách dữ liệu đầu vào và đầu ra được xử lý.
Làm thế nào để gọi mô hình này thông qua API tương thích với OpenAI?
Sử dụng URL cơ sở https://api.orcarouter.ai/v1 và đặt ID mô hình là "google/gemini-3.1-pro-preview". API tuân theo định dạng hoàn chỉnh chat tiêu chuẩn của OpenAI. Xác thực yêu cầu khóa API từ OrcaRouter.
Điểm τ²-Bench là gì và tại sao nó quan trọng?
Mô hình đạt điểm 95.6 trên τ²-Bench, một chuẩn đánh giá đo lường hiệu suất hoàn thành tác vụ. Chỉ số định lượng này phản ánh khả năng của mô hình trong việc xử lý chính xác các tác vụ phức tạp, nhiều bước.
Tôi có thể sử dụng mô hình này cho sản xuất không?
Là một mô hình xem trước, nó được thiết kế để kiểm tra và thử nghiệm. Nó có thể có giới hạn tốc độ thấp hơn, độ tin cậy thấp hơn, và các thay đổi liên tục. Đối với sản xuất, hãy cân nhắc sử dụng một mô hình ổn định, không phải xem trước.
Những phương thức nhập liệu nào được hỗ trợ?
Mô hình hỗ trợ đầu vào âm thanh, tệp tin (ví dụ: PDF, tệp mã nguồn), hình ảnh, văn bản và video. Tất cả có thể được bao gồm trong một yêu cầu duy nhất để suy luận đa phương thức.
Mô hình có hỗ trợ phản hồi trực tuyến không?
Các dữ kiện hiện có không xác định hỗ trợ phát trực tuyến. API của OrcaRouter có khả năng hỗ trợ phát trực tuyến cho các mô hình tương thích, nhưng để xem trước này, hãy kiểm tra tài liệu về khả năng có sẵn tham số stream.

Nhúng huy hiệu này

Google: Gemini 3.1 Pro Preview$2.00/M in5707ms p50qua OrcaRouter
HTML <a href="https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview" target="_blank"> <img src="https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg" alt="Google: Gemini 3.1 Pro Preview trên OrcaRouter" /> </a>
Markdown [![Google: Gemini 3.1 Pro Preview](https://www.orcarouter.ai/embed/google/gemini-3.1-pro-preview.svg)](https://www.orcarouter.ai/models/google/gemini-3.1-pro-preview)