Limites de débit

Les limites de débit régissent le nombre de requêtes que vous pouvez envoyer à l'API Gemini au cours d'une période donnée. Ces limites permettent de maintenir une utilisation équitable, de se protéger contre les utilisations abusives et de préserver les performances du système pour tous les utilisateurs.

Fonctionnement des limites de fréquence

Les limites de débit sont généralement mesurées selon trois dimensions :

  • Requêtes par minute (RPM)
  • Jetons par minute (entrée) (TPM)
  • Requêtes par jour (RPJ)

Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur de limitation du débit se déclenche. Par exemple, si votre limite de requêtes par minute est de 20, une erreur se produira si vous effectuez 21 requêtes en une minute, même si vous n'avez pas dépassé votre limite de requêtes par période ou d'autres limites.

Les limites de débit sont appliquées par projet, et non par clé API.

Les quotas de requêtes par jour (RPJ) sont réinitialisés à minuit (heure du Pacifique).

Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à certains modèles. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Imagen 3), mais sont conceptuellement similaires aux TPM. D'autres modèles peuvent avoir une limite de jetons par jour (TPD).

Les limites de débit sont plus strictes pour les modèles expérimentaux et en version preview.

Niveaux d'utilisation

Les limites de débit sont liées au niveau d'utilisation du projet. À mesure que votre utilisation et vos dépenses d'API augmentent, vous aurez la possibilité de passer à un niveau supérieur avec des limites de débit plus élevées.

Les critères d'éligibilité aux niveaux 2 et 3 sont basés sur les dépenses cumulées totales pour les services Google Cloud (y compris, mais sans s'y limiter, l'API Gemini) pour le compte de facturation associé à votre projet.

Niveau Qualifications
Gratuit Utilisateurs dans les pays éligibles
Niveau 1 Compte de facturation associé au projet
Niveau 2 Dépenses totales : > 250 $ et au moins 30 jours depuis le paiement réussi
Catégorie 3 Dépenses totales : > 1 000 $ et au moins 30 jours depuis le paiement réussi

Lorsque vous demandez une mise à niveau, notre système automatisé de protection contre les utilisations abusives effectue des vérifications supplémentaires. Bien que le respect des critères d'éligibilité indiqués soit généralement suffisant pour l'approbation, il peut arriver, dans de rares cas, qu'une demande de mise à niveau soit refusée en fonction d'autres facteurs identifiés lors de la procédure d'examen.

Ce système permet de préserver la sécurité et l'intégrité de la plate-forme Gemini API pour tous les utilisateurs.

Limites de débit standards des API

Le tableau suivant répertorie les limites de débit pour tous les appels standards à l'API Gemini.

Version gratuite

Modèle RPM TPM RPD
Modèles de sortie de texte
Gemini 2.5 Pro 5 250 000 100
Gemini 2.5 Flash 10 250 000 250
Gemini 2.5 Flash-Lite 15 250 000 1 000
Gemini 2.0 Flash 15 1 000 000 200
Gemini 2.0 Flash-Lite 30 1 000 000 200
API Live
Gemini 2.5 Flash Live 3 sessions 1 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash 1 séance 25 000 5
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental 1 séance 10 000 5
Gemini 2.0 Flash Live 3 sessions 1 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS 3 10 000 15
TTS Gemini 2.5 Pro (preview)
Génération d'images Gemini 2.0 Flash (preview) 10 200 000 100
Imagen 3
Veo 2
Autres modèles
Gemma 3 et 3n 30 15 000 14 400
Embedding Gemini 100 30 000 1 000
Modèles obsolètes
Gemini 1.5 Flash (obsolète) 15 250 000 50
Gemini 1.5 Flash-8B (obsolète) 15 250 000 50
Gemini 1.5 Pro (obsolète)

Niveau 1

Modèle RPM TPM RPD Jetons mis en file d'attente par lots
Modèles de sortie de texte
Gemini 2.5 Pro 150 2 000 000 10 000 5 000 000
Gemini 2.5 Flash 1 000 1 000 000 10 000 3 000 000
Gemini 2.5 Flash-Lite 4 000 4 000 000 Aucune limite 10 000 000
Gemini 2.0 Flash 2 000 4 000 000 Aucune limite 10 000 000
Gemini 2.0 Flash-Lite 4 000 4 000 000 Aucune limite 10 000 000
API Live
Gemini 2.5 Flash Live 50 sessions 4 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash 3 sessions 50 000 50
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental 1 séance 25 000 50
Gemini 2.0 Flash Live 50 sessions 4 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS 10 10 000 100
TTS Gemini 2.5 Pro (preview) 10 10 000 50
Génération d'images Gemini 2.0 Flash (preview) 1 000 1 000 000 10 000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
Autres modèles
Gemma 3 et 3n 30 15 000 14 400
Embedding Gemini 3 000 1 000 000
Modèles obsolètes
Gemini 1.5 Flash (obsolète) 2 000 4 000 000
Gemini 1.5 Flash-8B (obsolète) 4 000 4 000 000
Gemini 1.5 Pro (obsolète) 1 000 4 000 000

Niveau 2

Modèle RPM TPM RPD Jetons mis en file d'attente par lots
Modèles de sortie de texte
Gemini 2.5 Pro 1 000 5 000 000 50 000 500 000 000
Gemini 2.5 Flash 2 000 3 000 000 100 000 400 000 000
Gemini 2.5 Flash-Lite 10 000 10 000 000 Aucune limite 500 000 000
Gemini 2.0 Flash 10 000 10 000 000 Aucune limite 1 000 000 000
Gemini 2.0 Flash-Lite 20 000 10 000 000 Aucune limite 1 000 000 000
API Live
Gemini 2.5 Flash Live 1 000 sessions 10 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash 100 sessions 1 000 000
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental 1 séance 25 000 50
Gemini 2.0 Flash Live 1 000 sessions 10 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS 1 000 100 000 10 000
TTS Gemini 2.5 Pro (preview) 100 25 000 1 000
Génération d'images Gemini 2.0 Flash (preview) 2 000 3 000 000 100 000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
Autres modèles
Gemma 3 et 3n 30 15 000 14 400
Embedding Gemini 5 000 5 000 000 -- --
Modèles obsolètes
Gemini 1.5 Flash (obsolète) 2 000 4 000 000
Gemini 1.5 Flash-8B (obsolète) 4 000 4 000 000
Gemini 1.5 Pro (obsolète) 1 000 4 000 000

Catégorie 3

Modèle RPM TPM RPD Jetons mis en file d'attente par lots
Modèles de sortie de texte
Gemini 2.5 Pro 2 000 8 000 000 Aucune limite 1 000 000 000
Gemini 2.5 Flash 10 000 8 000 000 Aucune limite 1 000 000 000
Gemini 2.5 Flash-Lite 30 000 30 000 000 Aucune limite 1 000 000 000
Gemini 2.0 Flash 30 000 30 000 000 Aucune limite 5 000 000 000
Gemini 2.0 Flash-Lite 30 000 30 000 000 Aucune limite 5 000 000 000
API Live
Gemini 2.5 Flash Live 1 000 sessions 10 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash 100 sessions 1 000 000
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental 1 séance 25 000 50
Gemini 2.0 Flash Live 1 000 sessions 10 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS 1 000 1 000 000
TTS Gemini 2.5 Pro (preview) 100 1 000 000
Génération d'images Gemini 2.0 Flash (preview) 5 000 5 000 000
Imagen 4 Standard 20 15 000
Imagen 4 Ultra 15 5 000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
Autres modèles
Gemma 3 et 3n 30 15 000 14 400
Embedding Gemini 10 000 10 000 000 -- --
Modèles obsolètes
Gemini 1.5 Flash (obsolète) 2 000 4 000 000
Gemini 1.5 Flash-8B (obsolète) 4 000 4 000 000
Gemini 1.5 Pro (obsolète) 1 000 4 000 000

Les limites de débit spécifiées ne sont pas garanties et la capacité réelle peut varier.

Limites de débit du mode batch

Les requêtes en mode batch sont soumises à leurs propres limites de fréquence, distinctes de celles des appels d'API en mode non batch.

  • Requêtes par lot simultanées : 100
  • Taille maximale du fichier d'entrée : 2 Go
  • Limite de stockage de fichiers : 20 Go
  • Jetons mis en file d'attente par modèle : la colonne Jetons mis en file d'attente par lot du tableau des limites de débit indique le nombre maximal de jetons pouvant être mis en file d'attente pour le traitement par lot dans tous vos jobs par lot actifs pour un modèle donné. Consultez le tableau des limites de débit standards des API.

Passer au niveau supérieur

L'API Gemini utilise Cloud Billing pour tous les services de facturation. Pour passer du niveau sans frais à un niveau payant, vous devez d'abord activer la facturation Cloud pour votre projet Google Cloud.

Une fois que votre projet répond aux critères spécifiés, il peut passer au niveau supérieur. Pour demander une mise à niveau, procédez comme suit :

  • Accédez à la page Clés API dans AI Studio.
  • Recherchez le projet que vous souhaitez mettre à niveau, puis cliquez sur "Mettre à niveau". L'option "Passer au niveau supérieur" ne s'affiche que pour les projets qui répondent aux critères du niveau supérieur.

Après une validation rapide, le projet passera au niveau supérieur.

Demander une augmentation de la limite de fréquence

Chaque variante de modèle est associée à une limite de fréquence (requêtes par minute, RPM). Pour en savoir plus sur ces limites de débit, consultez Modèles Gemini.

Demander une augmentation de la limite de débit pour le niveau payant

Nous ne pouvons pas vous garantir que nous augmenterons votre limite de débit, mais nous ferons de notre mieux pour examiner votre demande.