頻率限制

頻率限制會控管您在特定時間範圍內可向 Gemini API 發出的要求數量。這些限制有助於維持公平使用原則、防範濫用行為,以及確保所有使用者都能享有良好的系統效能。

速率限制的運作方式

頻率限制通常會從三個面向進行測量:

  • 每分鐘要求數 (RPM)
  • 每分鐘權杖數 (輸入) (TPM)
  • 每日要求數 (RPD)

系統會根據各項限制評估您的用量,如果超過任何限制,就會觸發速率限制錯誤。舉例來說,如果 RPM 上限為 20,即使您未超過 TPM 或其他限制,在一分鐘內提出 21 個要求仍會導致錯誤。

頻率限制適用於專案,而非 API 金鑰。

系統會在太平洋時間午夜重設每日要求數 (RPD) 配額。

限制會因使用的特定模型而異,部分限制僅適用於特定模型。舉例來說,每分鐘圖像數 (IPM) 只會針對可生成圖像的模型 (Imagen 3) 計算,但概念上與每分鐘權杖數 (TPM) 相似。其他模型可能設有每日符記數上限 (TPD)。

實驗和預先發布版模型的速率限制較嚴格。

用量層級

頻率限制與專案的使用層級相關。隨著 API 使用量和支出增加,您可以選擇升級至較高的層級,享有更高的速率限制。

第 2 級和第 3 級的資格條件,是根據連結至專案的帳單帳戶,在 Google Cloud 服務 (包括但不限於 Gemini API) 的累計總支出而定。

級別 資格條件
免費 適用國家/地區的使用者
級別 1 連結至專案的帳單帳戶
級別 2 總支出:超過 $250 美元,且成功付款至少 30 天
階層 3 總支出:超過 $1,000 美元,且成功付款至少 30 天

要求升級時,系統會執行額外檢查,一般而言,只要符合上述資格條件,升級要求通常就會獲得核准。但少數情況下,我們可能會根據審查過程中發現的其他因素,拒絕升級要求。

這個系統有助於維護 Gemini API 平台安全和完整性,確保所有使用者都能安心使用。

標準 API 頻率限制

下表列出所有標準 Gemini API 呼叫的速率限制。

免費方案

模型 RPM TPM RPD
文字輸出模型
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 個工作階段 1,000,000
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 1 次 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 10,000 5
Gemini 2.0 Flash Live 3 個工作階段 1,000,000
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 3 10,000 15
Gemini 2.5 Pro 預先發布版 TTS
Gemini 2.0 Flash 預覽圖片生成功能 10 200,000 100
Imagen 3
Veo 2
其他模型
Gemma 3 和 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 15 250,000 50
Gemini 1.5 Flash-8B (已淘汰) 15 250,000 50
Gemini 1.5 Pro (已淘汰)

級別 1

模型 RPM TPM RPD 批次加入佇列的權杖
文字輸出模型
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 不限 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 不限 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 不限 10,000,000
Live API
Gemini 2.5 Flash Live 50 個工作階段 4,000,000
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 3 個工作階段 50,000 次 50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 25,000 50
Gemini 2.0 Flash Live 50 個工作階段 4,000,000
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 10 10,000 100
Gemini 2.5 Pro 預先發布版 TTS 10 10,000 50
Gemini 2.0 Flash 預覽圖片生成功能 1,000 1,000,000 10,000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
其他模型
Gemma 3 和 3n 30 15,000 14,400
Gemini Embedding 3,000 1,000,000
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 2,000 4,000,000
Gemini 1.5 Flash-8B (已淘汰) 4,000 4,000,000
Gemini 1.5 Pro (已淘汰) 1,000 4,000,000

級別 2

模型 RPM TPM RPD 批次加入佇列的權杖
文字輸出模型
Gemini 2.5 Pro 1,000 5,000,000 50,000 次 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 不限 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 不限 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 不限 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 個工作階段 10,000,000
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 100 個工作階段 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 25,000 50
Gemini 2.0 Flash Live 1,000 個工作階段 10,000,000
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 1,000 100,000 10,000
Gemini 2.5 Pro 預先發布版 TTS 100 25,000 1,000
Gemini 2.0 Flash 預覽圖片生成功能 2,000 3,000,000 100,000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
其他模型
Gemma 3 和 3n 30 15,000 14,400
Gemini Embedding 5,000 5,000,000 -- --
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 2,000 4,000,000
Gemini 1.5 Flash-8B (已淘汰) 4,000 4,000,000
Gemini 1.5 Pro (已淘汰) 1,000 4,000,000

階層 3

模型 RPM TPM RPD 批次加入佇列的權杖
文字輸出模型
Gemini 2.5 Pro 2,000 8,000,000 不限 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 不限 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 不限 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 不限 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 不限 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 個工作階段 10,000,000
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 100 個工作階段 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 25,000 50
Gemini 2.0 Flash Live 1,000 個工作階段 10,000,000
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 1,000 1,000,000
Gemini 2.5 Pro 預先發布版 TTS 100 1,000,000
Gemini 2.0 Flash 預覽圖片生成功能 5,000 5,000,000
Imagen 4 Standard 20 15,000
Imagen 4 Ultra 15 5,000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
其他模型
Gemma 3 和 3n 30 15,000 14,400
Gemini Embedding 10,000 10,000,000 -- --
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 2,000 4,000,000
Gemini 1.5 Flash-8B (已淘汰) 4,000 4,000,000
Gemini 1.5 Pro (已淘汰) 1,000 4,000,000

我們無法保證一定會達到指定的速率限制,實際容量可能有所不同。

批次模式的頻率限制

批次模式要求有自己的速率限制,與非批次模式 API 呼叫不同。

  • 並行批次要求:100 個
  • 輸入檔案大小上限:2 GB
  • 檔案儲存空間上限:20 GB
  • 每個模型排入佇列的權杖數:速率限制表格中的「批次排入佇列的權杖數」欄,列出特定模型所有有效批次工作可排入佇列的權杖數上限,用於批次處理。請參閱標準 API 使用頻率限制表

如何升級至下一個等級

Gemini API 會使用 Cloud Billing 處理所有帳單服務。如要從免費方案改用付費方案,請先為 Google Cloud 專案啟用 Cloud Billing。

專案符合指定條件後,即可升級至下一個級別。如要申請升級,請按照下列步驟操作:

  • 前往 AI Studio 的「API 金鑰」頁面。
  • 找出要升級的專案,然後按一下「升級」。只有符合下一層級資格的專案,才會顯示「升級」選項。

通過快速驗證後,專案就會升級至下一個層級。

要求提高速率限制

每個模型變體都有相關聯的速率限制 (每分鐘要求數,RPM)。如要瞭解這些頻率限制的詳細資訊,請參閱「Gemini 模型」一文。

申請提高付費層級的速率限制

我們無法保證會提高速率限制,但會盡力審查您的要求。