Giới hạn về tốc độ điều chỉnh số lượng yêu cầu mà bạn có thể gửi đến Gemini API trong một khoảng thời gian nhất định. Các giới hạn này giúp duy trì việc sử dụng hợp lý, ngăn chặn hành vi sai trái và giúp duy trì hiệu suất hệ thống cho tất cả người dùng.
Cách hoạt động của hạn mức
Giới hạn về tốc độ thường được đo lường theo 3 phương diện:
- Số yêu cầu mỗi phút (RPM)
- Số mã thông báo mỗi phút (đầu vào) (TPM)
- Số yêu cầu mỗi ngày (RPD)
Mức sử dụng của bạn được đánh giá dựa trên từng giới hạn và việc vượt quá bất kỳ giới hạn nào trong số đó sẽ kích hoạt lỗi giới hạn tốc độ. Ví dụ: nếu giới hạn RPM của bạn là 20, thì việc đưa ra 21 yêu cầu trong vòng một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá giới hạn TPM hoặc các giới hạn khác.
Hạn mức sử dụng được áp dụng cho mỗi dự án, chứ không phải cho mỗi khoá API.
Hạn mức số yêu cầu mỗi ngày (RPD) được đặt lại vào lúc nửa đêm theo giờ Thái Bình Dương.
Hạn mức sẽ khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số hạn mức chỉ áp dụng cho một số mô hình cụ thể. Ví dụ: Số hình ảnh mỗi phút (IPM) chỉ được tính cho các mô hình có khả năng tạo hình ảnh (Imagen 3), nhưng về mặt khái niệm thì tương tự như số mã thông báo mỗi phút (TPM). Các mô hình khác có thể có giới hạn về số lượng mã thông báo mỗi ngày (TPD).
Các mô hình thử nghiệm và mô hình xem trước có giới hạn về tốc độ nghiêm ngặt hơn.
Cấp sử dụng
Hạn mức về tốc độ được gắn với cấp sử dụng của dự án. Khi mức sử dụng và mức chi tiêu API tăng lên, bạn sẽ có thể nâng cấp lên cấp cao hơn với hạn mức tốc độ cao hơn.
Điều kiện để đạt được Cấp 2 và Cấp 3 dựa trên tổng mức chi tiêu tích luỹ cho các dịch vụ của Google Cloud (bao gồm nhưng không giới hạn ở Gemini API) đối với tài khoản thanh toán được liên kết với dự án của bạn.
Bậc | Điều kiện ứng tuyển |
---|---|
Miễn phí | Người dùng ở các quốc gia đủ điều kiện |
Cấp 1 | Tài khoản thanh toán được liên kết với dự án |
Cấp 2 | Tổng mức chi tiêu: > 2.500.000 VND và ít nhất 30 ngày kể từ khi thanh toán thành công |
Cấp 3 | Tổng mức chi tiêu: > 1.000 USD và ít nhất 30 ngày kể từ khi thanh toán thành công |
Khi bạn yêu cầu nâng cấp, hệ thống tự động bảo vệ khỏi hành vi sai trái của chúng tôi sẽ thực hiện các bước kiểm tra bổ sung. Mặc dù việc đáp ứng các tiêu chí đủ điều kiện đã nêu thường là đủ để được phê duyệt, nhưng trong một số trường hợp hiếm gặp, yêu cầu nâng cấp có thể bị từ chối dựa trên các yếu tố khác được xác định trong quá trình xem xét.
Hệ thống này giúp duy trì tính bảo mật và tính toàn vẹn của nền tảng Gemini API cho tất cả người dùng.
Giới hạn tiêu chuẩn về tốc độ yêu cầu API
Bảng sau đây liệt kê hạn mức cho tất cả các lệnh gọi API Gemini tiêu chuẩn.
Bậc miễn phí
Mô hình | RPM | TPM | RPD |
---|---|---|---|
Mô hình xoá văn bản | |||
Gemini 2.5 Pro | 5 | 250.000 | 100 |
Gemini 2.5 Flash | 10 | 250.000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250.000 | 1.000 |
Gemini 2.0 Flash | 15 | 1.000.000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1.000.000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 phiên | 1.000.000 | |
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) | 1 buổi | 25.000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 buổi | 10.000 | 5 |
Gemini 2.0 Flash Live | 3 phiên | 1.000.000 | |
Mô hình tạo nội dung đa phương thức | |||
Bản xem trước Gemini 2.5 Flash TTS | 3 | 10.000 | 15 |
Gemini 2.5 Pro Preview TTS | |||
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh | 10 | 200.000 | 100 |
Imagen 3 | |||
Veo 2 | |||
Các mẫu xe khác | |||
Gemma 3 và 3n | 30 | 15.000 | 14.400 |
Gemini Embedding | 100 | 30.000 | 1.000 |
Mô hình không dùng nữa | |||
Gemini 1.5 Flash (Không dùng nữa) | 15 | 250.000 | 50 |
Gemini 1.5 Flash-8B (Không dùng nữa) | 15 | 250.000 | 50 |
Gemini 1.5 Pro (Không dùng nữa) |
Cấp 1
Mô hình | RPM | TPM | RPD | Mã thông báo được xếp hàng theo lô |
---|---|---|---|---|
Mô hình xoá văn bản | ||||
Gemini 2.5 Pro | 150 | 2.000.000 | 10.000 | 5.000.000 |
Gemini 2.5 Flash | 1.000 | 1.000.000 | 10.000 | 3.000.000 |
Gemini 2.5 Flash-Lite | 4.000 | 4.000.000 | Không giới hạn | 10.000.000 |
Gemini 2.0 Flash | 2.000 | 4.000.000 | Không giới hạn | 10.000.000 |
Gemini 2.0 Flash-Lite | 4.000 | 4.000.000 | Không giới hạn | 10.000.000 |
Live API | ||||
Gemini 2.5 Flash Live | 50 phiên | 4.000.000 | ||
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) | 3 phiên | 50.000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 buổi | 25.000 | 50 | |
Gemini 2.0 Flash Live | 50 phiên | 4.000.000 | ||
Mô hình tạo nội dung đa phương thức | ||||
Bản xem trước Gemini 2.5 Flash TTS | 10 | 10.000 | 100 | |
Gemini 2.5 Pro Preview TTS | 10 | 10.000 | 50 | |
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh | 1.000 | 1.000.000 | 10.000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
Các mẫu xe khác | ||||
Gemma 3 và 3n | 30 | 15.000 | 14.400 | |
Gemini Embedding | 3.000 | 1.000.000 | ||
Mô hình không dùng nữa | ||||
Gemini 1.5 Flash (Không dùng nữa) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (Không dùng nữa) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (Không dùng nữa) | 1.000 | 4.000.000 |
Cấp 2
Mô hình | RPM | TPM | RPD | Mã thông báo được xếp hàng theo lô |
---|---|---|---|---|
Mô hình xoá văn bản | ||||
Gemini 2.5 Pro | 1.000 | 5.000.000 | 50.000 | 500.000.000 |
Gemini 2.5 Flash | 2.000 | 3.000.000 | 100.000 | 400.000.000 |
Gemini 2.5 Flash-Lite | 10.000 | 10.000.000 | Không giới hạn | 500.000.000 |
Gemini 2.0 Flash | 10.000 | 10.000.000 | Không giới hạn | 1.000.000.000 |
Gemini 2.0 Flash-Lite | 20.000 | 10.000.000 | Không giới hạn | 1.000.000.000 |
Live API | ||||
Gemini 2.5 Flash Live | 1.000 phiên | 10.000.000 | ||
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) | 100 phiên | 1.000.000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 buổi | 25.000 | 50 | |
Gemini 2.0 Flash Live | 1.000 phiên | 10.000.000 | ||
Mô hình tạo nội dung đa phương thức | ||||
Bản xem trước Gemini 2.5 Flash TTS | 1.000 | 100.000 | 10.000 | |
Gemini 2.5 Pro Preview TTS | 100 | 25.000 | 1.000 | |
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh | 2.000 | 3.000.000 | 100.000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
Các mẫu xe khác | ||||
Gemma 3 và 3n | 30 | 15.000 | 14.400 | |
Gemini Embedding | 5.000 | 5.000.000 | -- | -- |
Mô hình không dùng nữa | ||||
Gemini 1.5 Flash (Không dùng nữa) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (Không dùng nữa) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (Không dùng nữa) | 1.000 | 4.000.000 |
Cấp 3
Mô hình | RPM | TPM | RPD | Mã thông báo được xếp hàng theo lô |
---|---|---|---|---|
Mô hình xoá văn bản | ||||
Gemini 2.5 Pro | 2.000 | 8.000.000 | Không giới hạn | 1.000.000.000 |
Gemini 2.5 Flash | 10.000 | 8.000.000 | Không giới hạn | 1.000.000.000 |
Gemini 2.5 Flash-Lite | 30.000 | 30.000.000 | Không giới hạn | 1.000.000.000 |
Gemini 2.0 Flash | 30.000 | 30.000.000 | Không giới hạn | 5.000.000.000 |
Gemini 2.0 Flash-Lite | 30.000 | 30.000.000 | Không giới hạn | 5.000.000.000 |
Live API | ||||
Gemini 2.5 Flash Live | 1.000 phiên | 10.000.000 | ||
Hộp thoại âm thanh gốc của Gemini 2.5 Flash (bản xem trước) | 100 phiên | 1.000.000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 buổi | 25.000 | 50 | |
Gemini 2.0 Flash Live | 1.000 phiên | 10.000.000 | ||
Mô hình tạo nội dung đa phương thức | ||||
Bản xem trước Gemini 2.5 Flash TTS | 1.000 | 1.000.000 | ||
Gemini 2.5 Pro Preview TTS | 100 | 1.000.000 | ||
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh | 5.000 | 5.000.000 | ||
Imagen 4 Standard | 20 | 15.000 | ||
Imagen 4 Ultra | 15 | 5.000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
Các mẫu xe khác | ||||
Gemma 3 và 3n | 30 | 15.000 | 14.400 | |
Gemini Embedding | 10.000 | 10.000.000 | -- | -- |
Mô hình không dùng nữa | ||||
Gemini 1.5 Flash (Không dùng nữa) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (Không dùng nữa) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (Không dùng nữa) | 1.000 | 4.000.000 |
Hạn mức tốc độ được chỉ định không được đảm bảo và dung lượng thực tế có thể khác.
Giới hạn tốc độ ở Chế độ hàng loạt
Các yêu cầu ở Chế độ hàng loạt phải tuân theo giới hạn tốc độ riêng, tách biệt với các lệnh gọi API ở chế độ không hàng loạt.
- Số yêu cầu theo lô đồng thời: 100
- Giới hạn kích thước tệp đầu vào: 2 GB
- Hạn mức lưu trữ tệp: 20 GB
- Số lượng mã thông báo được xếp hàng đợi cho mỗi mô hình: Cột Số lượng mã thông báo được xếp hàng đợi theo lô trong bảng hạn mức tốc độ liệt kê số lượng mã thông báo tối đa có thể được xếp hàng đợi để xử lý theo lô trên tất cả các lô công việc đang hoạt động của bạn cho một mô hình nhất định. Xem trong bảng giới hạn tốc độ API tiêu chuẩn.
Cách nâng cấp lên cấp độ tiếp theo
Gemini API sử dụng Cloud Billing cho tất cả các dịch vụ thanh toán. Để chuyển từ Bậc miễn phí sang một bậc có tính phí, trước tiên, bạn phải bật dịch vụ Thanh toán trên đám mây cho dự án của mình trên Google Cloud.
Sau khi dự án của bạn đáp ứng các tiêu chí được chỉ định, dự án đó sẽ đủ điều kiện nâng cấp lên cấp độ tiếp theo. Để yêu cầu nâng cấp, hãy làm theo các bước sau:
- Chuyển đến trang khoá API trong AI Studio.
- Tìm dự án mà bạn muốn nâng cấp rồi nhấp vào "Nâng cấp". Lựa chọn "Nâng cấp" sẽ chỉ xuất hiện đối với những dự án đáp ứng các điều kiện của cấp tiếp theo.
Sau khi xác thực nhanh, dự án sẽ được nâng cấp lên cấp tiếp theo.
Yêu cầu tăng giới hạn tốc độ
Mỗi biến thể mô hình đều có một hạn mức liên kết (số yêu cầu mỗi phút, RPM). Để biết thông tin chi tiết về các giới hạn tốc độ đó, hãy xem phần Các mô hình Gemini.
Yêu cầu tăng giới hạn tốc độ của cấp có tính phí
Chúng tôi không đảm bảo sẽ tăng hạn mức sử dụng cho bạn, nhưng chúng tôi sẽ cố gắng hết sức để xem xét yêu cầu của bạn.