Giới hạn số lượng yêu cầu

Giới hạn về tốc độ điều chỉnh số lượng yêu cầu mà bạn có thể gửi đến Gemini API trong một khoảng thời gian nhất định. Các giới hạn này giúp duy trì việc sử dụng hợp lý, ngăn chặn hành vi sai trái và giúp duy trì hiệu suất hệ thống cho tất cả người dùng.

Cách hoạt động của hạn mức

Giới hạn về tốc độ thường được đo lường theo 3 phương diện:

  • Số yêu cầu mỗi phút (RPM)
  • Số mã thông báo mỗi phút (đầu vào) (TPM)
  • Số yêu cầu mỗi ngày (RPD)

Mức sử dụng của bạn được đánh giá dựa trên từng giới hạn và việc vượt quá bất kỳ giới hạn nào trong số đó sẽ kích hoạt lỗi giới hạn tốc độ. Ví dụ: nếu giới hạn RPM của bạn là 20, thì việc đưa ra 21 yêu cầu trong vòng một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá giới hạn TPM hoặc các giới hạn khác.

Hạn mức sử dụng được áp dụng cho mỗi dự án, chứ không phải cho mỗi khoá API.

Hạn mức số yêu cầu mỗi ngày (RPD) được đặt lại vào lúc nửa đêm theo giờ Thái Bình Dương.

Hạn mức sẽ khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số hạn mức chỉ áp dụng cho một số mô hình cụ thể. Ví dụ: Số hình ảnh mỗi phút (IPM) chỉ được tính cho các mô hình có khả năng tạo hình ảnh (Imagen 3), nhưng về mặt khái niệm thì tương tự như số mã thông báo mỗi phút (TPM). Các mô hình khác có thể có giới hạn về số lượng mã thông báo mỗi ngày (TPD).

Các mô hình thử nghiệm và mô hình xem trước có giới hạn về tốc độ nghiêm ngặt hơn.

Cấp sử dụng

Hạn mức về tốc độ được gắn với cấp sử dụng của dự án. Khi mức sử dụng và mức chi tiêu API tăng lên, bạn sẽ có thể nâng cấp lên cấp cao hơn với hạn mức tốc độ cao hơn.

Điều kiện để đạt được Cấp 2 và Cấp 3 dựa trên tổng mức chi tiêu tích luỹ cho các dịch vụ của Google Cloud (bao gồm nhưng không giới hạn ở Gemini API) đối với tài khoản thanh toán được liên kết với dự án của bạn.

Bậc Điều kiện ứng tuyển
Miễn phí Người dùng ở các quốc gia đủ điều kiện
Cấp 1 Tài khoản thanh toán được liên kết với dự án
Cấp 2 Tổng mức chi tiêu: > 2.500.000 VND và ít nhất 30 ngày kể từ khi thanh toán thành công
Cấp 3 Tổng mức chi tiêu: > 1.000 USD và ít nhất 30 ngày kể từ khi thanh toán thành công

Khi bạn yêu cầu nâng cấp, hệ thống tự động bảo vệ khỏi hành vi sai trái của chúng tôi sẽ thực hiện các bước kiểm tra bổ sung. Mặc dù việc đáp ứng các tiêu chí đủ điều kiện đã nêu thường là đủ để được phê duyệt, nhưng trong một số trường hợp hiếm gặp, yêu cầu nâng cấp có thể bị từ chối dựa trên các yếu tố khác được xác định trong quá trình xem xét.

Hệ thống này giúp duy trì tính bảo mật và tính toàn vẹn của nền tảng Gemini API cho tất cả người dùng.

Giới hạn tiêu chuẩn về tốc độ yêu cầu API

Bảng sau đây liệt kê hạn mức cho tất cả các lệnh gọi API Gemini tiêu chuẩn.

Bậc miễn phí

Mô hình RPM TPM RPD
Mô hình xoá văn bản
Gemini 2.5 Pro 5 250.000 100
Gemini 2.5 Flash 10 250.000 250
Gemini 2.5 Flash-Lite 15 250.000 1.000
Gemini 2.0 Flash 15 1.000.000 200
Gemini 2.0 Flash-Lite 30 1.000.000 200
Live API
Gemini 2.5 Flash Live 3 phiên 1.000.000
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) 1 buổi 25.000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 buổi 10.000 5
Gemini 2.0 Flash Live 3 phiên 1.000.000
Mô hình tạo nội dung đa phương thức
Bản xem trước Gemini 2.5 Flash TTS 3 10.000 15
Gemini 2.5 Pro Preview TTS
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh 10 200.000 100
Imagen 3
Veo 2
Các mẫu xe khác
Gemma 3 và 3n 30 15.000 14.400
Gemini Embedding 100 30.000 1.000
Mô hình không dùng nữa
Gemini 1.5 Flash (Không dùng nữa) 15 250.000 50
Gemini 1.5 Flash-8B (Không dùng nữa) 15 250.000 50
Gemini 1.5 Pro (Không dùng nữa)

Cấp 1

Mô hình RPM TPM RPD Mã thông báo được xếp hàng theo lô
Mô hình xoá văn bản
Gemini 2.5 Pro 150 2.000.000 10.000 5.000.000
Gemini 2.5 Flash 1.000 1.000.000 10.000 3.000.000
Gemini 2.5 Flash-Lite 4.000 4.000.000 Không giới hạn 10.000.000
Gemini 2.0 Flash 2.000 4.000.000 Không giới hạn 10.000.000
Gemini 2.0 Flash-Lite 4.000 4.000.000 Không giới hạn 10.000.000
Live API
Gemini 2.5 Flash Live 50 phiên 4.000.000
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) 3 phiên 50.000 50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 buổi 25.000 50
Gemini 2.0 Flash Live 50 phiên 4.000.000
Mô hình tạo nội dung đa phương thức
Bản xem trước Gemini 2.5 Flash TTS 10 10.000 100
Gemini 2.5 Pro Preview TTS 10 10.000 50
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh 1.000 1.000.000 10.000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
Các mẫu xe khác
Gemma 3 và 3n 30 15.000 14.400
Gemini Embedding 3.000 1.000.000
Mô hình không dùng nữa
Gemini 1.5 Flash (Không dùng nữa) 2.000 4.000.000
Gemini 1.5 Flash-8B (Không dùng nữa) 4.000 4.000.000
Gemini 1.5 Pro (Không dùng nữa) 1.000 4.000.000

Cấp 2

Mô hình RPM TPM RPD Mã thông báo được xếp hàng theo lô
Mô hình xoá văn bản
Gemini 2.5 Pro 1.000 5.000.000 50.000 500.000.000
Gemini 2.5 Flash 2.000 3.000.000 100.000 400.000.000
Gemini 2.5 Flash-Lite 10.000 10.000.000 Không giới hạn 500.000.000
Gemini 2.0 Flash 10.000 10.000.000 Không giới hạn 1.000.000.000
Gemini 2.0 Flash-Lite 20.000 10.000.000 Không giới hạn 1.000.000.000
Live API
Gemini 2.5 Flash Live 1.000 phiên 10.000.000
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) 100 phiên 1.000.000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 buổi 25.000 50
Gemini 2.0 Flash Live 1.000 phiên 10.000.000
Mô hình tạo nội dung đa phương thức
Bản xem trước Gemini 2.5 Flash TTS 1.000 100.000 10.000
Gemini 2.5 Pro Preview TTS 100 25.000 1.000
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh 2.000 3.000.000 100.000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
Các mẫu xe khác
Gemma 3 và 3n 30 15.000 14.400
Gemini Embedding 5.000 5.000.000 -- --
Mô hình không dùng nữa
Gemini 1.5 Flash (Không dùng nữa) 2.000 4.000.000
Gemini 1.5 Flash-8B (Không dùng nữa) 4.000 4.000.000
Gemini 1.5 Pro (Không dùng nữa) 1.000 4.000.000

Cấp 3

Mô hình RPM TPM RPD Mã thông báo được xếp hàng theo lô
Mô hình xoá văn bản
Gemini 2.5 Pro 2.000 8.000.000 Không giới hạn 1.000.000.000
Gemini 2.5 Flash 10.000 8.000.000 Không giới hạn 1.000.000.000
Gemini 2.5 Flash-Lite 30.000 30.000.000 Không giới hạn 1.000.000.000
Gemini 2.0 Flash 30.000 30.000.000 Không giới hạn 5.000.000.000
Gemini 2.0 Flash-Lite 30.000 30.000.000 Không giới hạn 5.000.000.000
Live API
Gemini 2.5 Flash Live 1.000 phiên 10.000.000
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) 100 phiên 1.000.000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 buổi 25.000 50
Gemini 2.0 Flash Live 1.000 phiên 10.000.000
Mô hình tạo nội dung đa phương thức
Bản xem trước Gemini 2.5 Flash TTS 1.000 1.000.000
Gemini 2.5 Pro Preview TTS 100 1.000.000
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh 5.000 5.000.000
Imagen 4 Standard 20 15.000
Imagen 4 Ultra 15 5.000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
Các mẫu xe khác
Gemma 3 và 3n 30 15.000 14.400
Gemini Embedding 10.000 10.000.000 -- --
Mô hình không dùng nữa
Gemini 1.5 Flash (Không dùng nữa) 2.000 4.000.000
Gemini 1.5 Flash-8B (Không dùng nữa) 4.000 4.000.000
Gemini 1.5 Pro (Không dùng nữa) 1.000 4.000.000

Hạn mức tốc độ được chỉ định không được đảm bảo và dung lượng thực tế có thể khác.

Giới hạn tốc độ ở Chế độ hàng loạt

Các yêu cầu ở Chế độ hàng loạt phải tuân theo giới hạn tốc độ riêng, tách biệt với các lệnh gọi API ở chế độ không hàng loạt.

  • Số yêu cầu theo lô đồng thời: 100
  • Giới hạn kích thước tệp đầu vào: 2 GB
  • Hạn mức lưu trữ tệp: 20 GB
  • Số lượng mã thông báo được xếp hàng đợi cho mỗi mô hình: Cột Số lượng mã thông báo được xếp hàng đợi theo lô trong bảng hạn mức tốc độ liệt kê số lượng mã thông báo tối đa có thể được xếp hàng đợi để xử lý theo lô trên tất cả các lô công việc đang hoạt động của bạn cho một mô hình nhất định. Xem trong bảng giới hạn tốc độ API tiêu chuẩn.

Cách nâng cấp lên cấp độ tiếp theo

Gemini API sử dụng Cloud Billing cho tất cả các dịch vụ thanh toán. Để chuyển từ Bậc miễn phí sang một bậc có tính phí, trước tiên, bạn phải bật dịch vụ Thanh toán trên đám mây cho dự án của mình trên Google Cloud.

Sau khi dự án của bạn đáp ứng các tiêu chí được chỉ định, dự án đó sẽ đủ điều kiện nâng cấp lên cấp độ tiếp theo. Để yêu cầu nâng cấp, hãy làm theo các bước sau:

Sau khi xác thực nhanh, dự án sẽ được nâng cấp lên cấp tiếp theo.

Yêu cầu tăng giới hạn tốc độ

Mỗi biến thể mô hình đều có một hạn mức liên kết (số yêu cầu mỗi phút, RPM). Để biết thông tin chi tiết về các giới hạn tốc độ đó, hãy xem phần Các mô hình Gemini.

Yêu cầu tăng giới hạn tốc độ của cấp có tính phí

Chúng tôi không đảm bảo sẽ tăng hạn mức sử dụng cho bạn, nhưng chúng tôi sẽ cố gắng hết sức để xem xét yêu cầu của bạn.