Limites de débit

Les limites de débit régissent le nombre de requêtes que vous pouvez envoyer à l'API Gemini au cours d'une période donnée. Ces limites permettent de maintenir une utilisation équitable, de se protéger contre les utilisations abusives et de préserver les performances du système pour tous les utilisateurs.

Fonctionnement des limites de fréquence

Les limites de débit sont généralement mesurées selon trois dimensions :

Requêtes par minute (RPM)
Jetons par minute (entrée) (TPM)
Requêtes par jour (RPJ)

Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur de limitation du débit se déclenche. Par exemple, si votre limite de requêtes par minute est de 20, une erreur se produira si vous effectuez 21 requêtes en une minute, même si vous n'avez pas dépassé votre limite de requêtes par période ou d'autres limites.

Les limites de débit sont appliquées par projet, et non par clé API.

Les quotas de requêtes par jour (RPJ) sont réinitialisés à minuit (heure du Pacifique).

Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à certains modèles. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Imagen 3), mais sont conceptuellement similaires aux TPM. D'autres modèles peuvent avoir une limite de jetons par jour (TPD).

Les limites de débit sont plus strictes pour les modèles expérimentaux et en version preview.

Niveaux d'utilisation

Les limites de débit sont liées au niveau d'utilisation du projet. À mesure que votre utilisation et vos dépenses d'API augmentent, vous aurez la possibilité de passer à un niveau supérieur avec des limites de débit plus élevées.

Les critères d'éligibilité aux niveaux 2 et 3 sont basés sur les dépenses cumulées totales pour les services Google Cloud (y compris, mais sans s'y limiter, l'API Gemini) pour le compte de facturation associé à votre projet.

Niveau	Qualifications
Gratuit	Utilisateurs dans les pays éligibles
Niveau 1	Compte de facturation associé au projet
Niveau 2	Dépenses totales : > 250 $ et au moins 30 jours depuis le paiement réussi
Catégorie 3	Dépenses totales : > 1 000 $ et au moins 30 jours depuis le paiement réussi

Lorsque vous demandez une mise à niveau, notre système automatisé de protection contre les utilisations abusives effectue des vérifications supplémentaires. Bien que le respect des critères d'éligibilité indiqués soit généralement suffisant pour l'approbation, il peut arriver, dans de rares cas, qu'une demande de mise à niveau soit refusée en fonction d'autres facteurs identifiés lors de la procédure d'examen.

Ce système permet de préserver la sécurité et l'intégrité de la plate-forme Gemini API pour tous les utilisateurs.

Limites de débit standards des API

Le tableau suivant répertorie les limites de débit pour tous les appels standards à l'API Gemini.

Version gratuite

Modèle	RPM	TPM	RPD
Modèles de sortie de texte
Gemini 2.5 Pro	5	250 000	100
Gemini 2.5 Flash	10	250 000	250
Gemini 2.5 Flash-Lite	15	250 000	1 000
Gemini 2.0 Flash	15	1 000 000	200
Gemini 2.0 Flash-Lite	30	1 000 000	200
API Live
Gemini 2.5 Flash Live	3 sessions	1 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash	1 séance	25 000	5
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental	1 séance	10 000	5
Gemini 2.0 Flash Live	3 sessions	1 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS	3	10 000	15
TTS Gemini 2.5 Pro (preview)
Génération d'images Gemini 2.0 Flash (preview)	10	200 000	100
Imagen 3
Veo 2
Autres modèles
Gemma 3 et 3n	30	15 000	14 400
Embedding Gemini	100	30 000	1 000
Modèles obsolètes
Gemini 1.5 Flash (obsolète)	15	250 000	50
Gemini 1.5 Flash-8B (obsolète)	15	250 000	50
Gemini 1.5 Pro (obsolète)

Niveau 1

Modèle	RPM	TPM	RPD	Jetons mis en file d'attente par lots
Modèles de sortie de texte
Gemini 2.5 Pro	150	2 000 000	10 000	5 000 000
Gemini 2.5 Flash	1 000	1 000 000	10 000	3 000 000
Gemini 2.5 Flash-Lite	4 000	4 000 000	Aucune limite	10 000 000
Gemini 2.0 Flash	2 000	4 000 000	Aucune limite	10 000 000
Gemini 2.0 Flash-Lite	4 000	4 000 000	Aucune limite	10 000 000
API Live
Gemini 2.5 Flash Live	50 sessions	4 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash	3 sessions	50 000	50
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental	1 séance	25 000	50
Gemini 2.0 Flash Live	50 sessions	4 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS	10	10 000	100
TTS Gemini 2.5 Pro (preview)	10	10 000	50
Génération d'images Gemini 2.0 Flash (preview)	1 000	1 000 000	10 000
Imagen 4 Standard	10		70
Imagen 4 Ultra	5		30
Imagen 3	20
Veo 3	2		10
Veo 2	2		50
Autres modèles
Gemma 3 et 3n	30	15 000	14 400
Embedding Gemini	3 000	1 000 000
Modèles obsolètes
Gemini 1.5 Flash (obsolète)	2 000	4 000 000
Gemini 1.5 Flash-8B (obsolète)	4 000	4 000 000
Gemini 1.5 Pro (obsolète)	1 000	4 000 000

Niveau 2

Modèle	RPM	TPM	RPD	Jetons mis en file d'attente par lots
Modèles de sortie de texte
Gemini 2.5 Pro	1 000	5 000 000	50 000	500 000 000
Gemini 2.5 Flash	2 000	3 000 000	100 000	400 000 000
Gemini 2.5 Flash-Lite	10 000	10 000 000	Aucune limite	500 000 000
Gemini 2.0 Flash	10 000	10 000 000	Aucune limite	1 000 000 000
Gemini 2.0 Flash-Lite	20 000	10 000 000	Aucune limite	1 000 000 000
API Live
Gemini 2.5 Flash Live	1 000 sessions	10 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash	100 sessions	1 000 000
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental	1 séance	25 000	50
Gemini 2.0 Flash Live	1 000 sessions	10 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS	1 000	100 000	10 000
TTS Gemini 2.5 Pro (preview)	100	25 000	1 000
Génération d'images Gemini 2.0 Flash (preview)	2 000	3 000 000	100 000
Imagen 4 Standard	15		1000
Imagen 4 Ultra	10		400
Imagen 3	20
Veo 3	4		50
Veo 2	2		50
Autres modèles
Gemma 3 et 3n	30	15 000	14 400
Embedding Gemini	5 000	5 000 000	--	--
Modèles obsolètes
Gemini 1.5 Flash (obsolète)	2 000	4 000 000
Gemini 1.5 Flash-8B (obsolète)	4 000	4 000 000
Gemini 1.5 Pro (obsolète)	1 000	4 000 000

Catégorie 3

Modèle	RPM	TPM	RPD	Jetons mis en file d'attente par lots
Modèles de sortie de texte
Gemini 2.5 Pro	2 000	8 000 000	Aucune limite	1 000 000 000
Gemini 2.5 Flash	10 000	8 000 000	Aucune limite	1 000 000 000
Gemini 2.5 Flash-Lite	30 000	30 000 000	Aucune limite	1 000 000 000
Gemini 2.0 Flash	30 000	30 000 000	Aucune limite	5 000 000 000
Gemini 2.0 Flash-Lite	30 000	30 000 000	Aucune limite	5 000 000 000
API Live
Gemini 2.5 Flash Live	1 000 sessions	10 000 000
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash	100 sessions	1 000 000
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental	1 séance	25 000	50
Gemini 2.0 Flash Live	1 000 sessions	10 000 000
Modèles de génération multimodaux
Aperçu de Gemini 2.5 Flash TTS	1 000	1 000 000
TTS Gemini 2.5 Pro (preview)	100	1 000 000
Génération d'images Gemini 2.0 Flash (preview)	5 000	5 000 000
Imagen 4 Standard	20		15 000
Imagen 4 Ultra	15		5 000
Imagen 3	20
Veo 3	10		500
Veo 2	2		50
Autres modèles
Gemma 3 et 3n	30	15 000	14 400
Embedding Gemini	10 000	10 000 000	--	--
Modèles obsolètes
Gemini 1.5 Flash (obsolète)	2 000	4 000 000
Gemini 1.5 Flash-8B (obsolète)	4 000	4 000 000
Gemini 1.5 Pro (obsolète)	1 000	4 000 000

Les limites de débit spécifiées ne sont pas garanties et la capacité réelle peut varier.

Limites de débit du mode batch

Les requêtes en mode batch sont soumises à leurs propres limites de fréquence, distinctes de celles des appels d'API en mode non batch.

Requêtes par lot simultanées : 100
Taille maximale du fichier d'entrée : 2 Go
Limite de stockage de fichiers : 20 Go
Jetons mis en file d'attente par modèle : la colonne Jetons mis en file d'attente par lot du tableau des limites de débit indique le nombre maximal de jetons pouvant être mis en file d'attente pour le traitement par lot dans tous vos jobs par lot actifs pour un modèle donné. Consultez le tableau des limites de débit standards des API.

Passer au niveau supérieur

L'API Gemini utilise Cloud Billing pour tous les services de facturation. Pour passer du niveau sans frais à un niveau payant, vous devez d'abord activer la facturation Cloud pour votre projet Google Cloud.

Une fois que votre projet répond aux critères spécifiés, il peut passer au niveau supérieur. Pour demander une mise à niveau, procédez comme suit :

Accédez à la page Clés API dans AI Studio.
Recherchez le projet que vous souhaitez mettre à niveau, puis cliquez sur "Mettre à niveau". L'option "Passer au niveau supérieur" ne s'affiche que pour les projets qui répondent aux critères du niveau supérieur.

Après une validation rapide, le projet passera au niveau supérieur.

Demander une augmentation de la limite de fréquence

Chaque variante de modèle est associée à une limite de fréquence (requêtes par minute, RPM). Pour en savoir plus sur ces limites de débit, consultez Modèles Gemini.

Demander une augmentation de la limite de débit pour le niveau payant

Nous ne pouvons pas vous garantir que nous augmenterons votre limite de débit, mais nous ferons de notre mieux pour examiner votre demande.