頻率限制會控管您在特定時間範圍內可向 Gemini API 發出的要求數量。這些限制有助於維持公平使用原則、防範濫用行為,以及確保所有使用者都能享有良好的系統效能。
速率限制的運作方式
頻率限制通常會從三個面向進行測量:
- 每分鐘要求數 (RPM)
- 每分鐘權杖數 (輸入) (TPM)
- 每日要求數 (RPD)
系統會根據各項限制評估您的用量,如果超過任何限制,就會觸發速率限制錯誤。舉例來說,如果 RPM 上限為 20,即使您未超過 TPM 或其他限制,在一分鐘內提出 21 個要求仍會導致錯誤。
頻率限制適用於專案,而非 API 金鑰。
系統會在太平洋時間午夜重設每日要求數 (RPD) 配額。
限制會因使用的特定模型而異,部分限制僅適用於特定模型。舉例來說,每分鐘圖像數 (IPM) 只會針對可生成圖像的模型 (Imagen 3) 計算,但概念上與每分鐘權杖數 (TPM) 相似。其他模型可能設有每日符記數上限 (TPD)。
實驗和預先發布版模型的速率限制較嚴格。
用量層級
頻率限制與專案的使用層級相關。隨著 API 使用量和支出增加,您可以選擇升級至較高的層級,享有更高的速率限制。
第 2 級和第 3 級的資格條件,是根據連結至專案的帳單帳戶,在 Google Cloud 服務 (包括但不限於 Gemini API) 的累計總支出而定。
級別 | 資格條件 |
---|---|
免費 | 適用國家/地區的使用者 |
級別 1 | 連結至專案的帳單帳戶 |
級別 2 | 總支出:超過 $250 美元,且成功付款至少 30 天 |
階層 3 | 總支出:超過 $1,000 美元,且成功付款至少 30 天 |
要求升級時,系統會執行額外檢查,一般而言,只要符合上述資格條件,升級要求通常就會獲得核准。但少數情況下,我們可能會根據審查過程中發現的其他因素,拒絕升級要求。
這個系統有助於維護 Gemini API 平台安全和完整性,確保所有使用者都能安心使用。
標準 API 頻率限制
下表列出所有標準 Gemini API 呼叫的速率限制。
免費方案
模型 | RPM | TPM | RPD |
---|---|---|---|
文字輸出模型 | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 個工作階段 | 1,000,000 | |
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | 1 次 | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 次 | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 個工作階段 | 1,000,000 | |
多模態生成模型 | |||
Gemini 2.5 Flash 預先發布版 TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro 預先發布版 TTS | |||
Gemini 2.0 Flash 預覽圖片生成功能 | 10 | 200,000 | 100 |
Imagen 3 | |||
Veo 2 | |||
其他模型 | |||
Gemma 3 和 3n | 30 | 15,000 | 14,400 |
Gemini Embedding | 100 | 30,000 | 1,000 |
已淘汰的模型 | |||
Gemini 1.5 Flash (已淘汰) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (已淘汰) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (已淘汰) |
級別 1
模型 | RPM | TPM | RPD | 批次加入佇列的權杖 |
---|---|---|---|---|
文字輸出模型 | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | 不限 | 10,000,000 |
Gemini 2.0 Flash | 2,000 | 4,000,000 | 不限 | 10,000,000 |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | 不限 | 10,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 50 個工作階段 | 4,000,000 | ||
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | 3 個工作階段 | 50,000 次 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 次 | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 個工作階段 | 4,000,000 | ||
多模態生成模型 | ||||
Gemini 2.5 Flash 預先發布版 TTS | 10 | 10,000 | 100 | |
Gemini 2.5 Pro 預先發布版 TTS | 10 | 10,000 | 50 | |
Gemini 2.0 Flash 預覽圖片生成功能 | 1,000 | 1,000,000 | 10,000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
其他模型 | ||||
Gemma 3 和 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 3,000 | 1,000,000 | ||
已淘汰的模型 | ||||
Gemini 1.5 Flash (已淘汰) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (已淘汰) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (已淘汰) | 1,000 | 4,000,000 |
級別 2
模型 | RPM | TPM | RPD | 批次加入佇列的權杖 |
---|---|---|---|---|
文字輸出模型 | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 次 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | 不限 | 500,000,000 |
Gemini 2.0 Flash | 10,000 | 10,000,000 | 不限 | 1,000,000,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | 不限 | 1,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 個工作階段 | 10,000,000 | ||
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | 100 個工作階段 | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 次 | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 個工作階段 | 10,000,000 | ||
多模態生成模型 | ||||
Gemini 2.5 Flash 預先發布版 TTS | 1,000 | 100,000 | 10,000 | |
Gemini 2.5 Pro 預先發布版 TTS | 100 | 25,000 | 1,000 | |
Gemini 2.0 Flash 預覽圖片生成功能 | 2,000 | 3,000,000 | 100,000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
其他模型 | ||||
Gemma 3 和 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 5,000 | 5,000,000 | -- | -- |
已淘汰的模型 | ||||
Gemini 1.5 Flash (已淘汰) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (已淘汰) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (已淘汰) | 1,000 | 4,000,000 |
階層 3
模型 | RPM | TPM | RPD | 批次加入佇列的權杖 |
---|---|---|---|---|
文字輸出模型 | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | 不限 | 1,000,000,000 |
Gemini 2.5 Flash | 10,000 | 8,000,000 | 不限 | 1,000,000,000 |
Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | 不限 | 1,000,000,000 |
Gemini 2.0 Flash | 30,000 | 30,000,000 | 不限 | 5,000,000,000 |
Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | 不限 | 5,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 個工作階段 | 10,000,000 | ||
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | 100 個工作階段 | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 次 | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 個工作階段 | 10,000,000 | ||
多模態生成模型 | ||||
Gemini 2.5 Flash 預先發布版 TTS | 1,000 | 1,000,000 | ||
Gemini 2.5 Pro 預先發布版 TTS | 100 | 1,000,000 | ||
Gemini 2.0 Flash 預覽圖片生成功能 | 5,000 | 5,000,000 | ||
Imagen 4 Standard | 20 | 15,000 | ||
Imagen 4 Ultra | 15 | 5,000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
其他模型 | ||||
Gemma 3 和 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 10,000 | 10,000,000 | -- | -- |
已淘汰的模型 | ||||
Gemini 1.5 Flash (已淘汰) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (已淘汰) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (已淘汰) | 1,000 | 4,000,000 |
我們無法保證一定會達到指定的速率限制,實際容量可能有所不同。
批次模式的頻率限制
批次模式要求有自己的速率限制,與非批次模式 API 呼叫不同。
- 並行批次要求:100 個
- 輸入檔案大小上限:2 GB
- 檔案儲存空間上限:20 GB
- 每個模型排入佇列的權杖數:速率限制表格中的「批次排入佇列的權杖數」欄,列出特定模型所有有效批次工作可排入佇列的權杖數上限,用於批次處理。請參閱標準 API 使用頻率限制表。
如何升級至下一個等級
Gemini API 會使用 Cloud Billing 處理所有帳單服務。如要從免費方案改用付費方案,請先為 Google Cloud 專案啟用 Cloud Billing。
專案符合指定條件後,即可升級至下一個級別。如要申請升級,請按照下列步驟操作:
通過快速驗證後,專案就會升級至下一個層級。
要求提高速率限制
每個模型變體都有相關聯的速率限制 (每分鐘要求數,RPM)。如要瞭解這些頻率限制的詳細資訊,請參閱「Gemini 模型」一文。
我們無法保證會提高速率限制,但會盡力審查您的要求。