Les limites de débit régissent le nombre de requêtes que vous pouvez envoyer à l'API Gemini au cours d'une période donnée. Ces limites permettent de maintenir une utilisation équitable, de se protéger contre les utilisations abusives et de préserver les performances du système pour tous les utilisateurs.
Fonctionnement des limites de fréquence
Les limites de débit sont généralement mesurées selon trois dimensions :
- Requêtes par minute (RPM)
- Jetons par minute (entrée) (TPM)
- Requêtes par jour (RPJ)
Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur de limitation du débit se déclenche. Par exemple, si votre limite de requêtes par minute est de 20, une erreur se produira si vous effectuez 21 requêtes en une minute, même si vous n'avez pas dépassé votre limite de requêtes par période ou d'autres limites.
Les limites de débit sont appliquées par projet, et non par clé API.
Les quotas de requêtes par jour (RPJ) sont réinitialisés à minuit (heure du Pacifique).
Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à certains modèles. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Imagen 3), mais sont conceptuellement similaires aux TPM. D'autres modèles peuvent avoir une limite de jetons par jour (TPD).
Les limites de débit sont plus strictes pour les modèles expérimentaux et en version preview.
Niveaux d'utilisation
Les limites de débit sont liées au niveau d'utilisation du projet. À mesure que votre utilisation et vos dépenses d'API augmentent, vous aurez la possibilité de passer à un niveau supérieur avec des limites de débit plus élevées.
Les critères d'éligibilité aux niveaux 2 et 3 sont basés sur les dépenses cumulées totales pour les services Google Cloud (y compris, mais sans s'y limiter, l'API Gemini) pour le compte de facturation associé à votre projet.
Niveau | Qualifications |
---|---|
Gratuit | Utilisateurs dans les pays éligibles |
Niveau 1 | Compte de facturation associé au projet |
Niveau 2 | Dépenses totales : > 250 $ et au moins 30 jours depuis le paiement réussi |
Catégorie 3 | Dépenses totales : > 1 000 $ et au moins 30 jours depuis le paiement réussi |
Lorsque vous demandez une mise à niveau, notre système automatisé de protection contre les utilisations abusives effectue des vérifications supplémentaires. Bien que le respect des critères d'éligibilité indiqués soit généralement suffisant pour l'approbation, il peut arriver, dans de rares cas, qu'une demande de mise à niveau soit refusée en fonction d'autres facteurs identifiés lors de la procédure d'examen.
Ce système permet de préserver la sécurité et l'intégrité de la plate-forme Gemini API pour tous les utilisateurs.
Limites de débit standards des API
Le tableau suivant répertorie les limites de débit pour tous les appels standards à l'API Gemini.
Version gratuite
Modèle | RPM | TPM | RPD |
---|---|---|---|
Modèles de sortie de texte | |||
Gemini 2.5 Pro | 5 | 250 000 | 100 |
Gemini 2.5 Flash | 10 | 250 000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250 000 | 1 000 |
Gemini 2.0 Flash | 15 | 1 000 000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1 000 000 | 200 |
API Live | |||
Gemini 2.5 Flash Live | 3 sessions | 1 000 000 | |
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash | 1 séance | 25 000 | 5 |
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental | 1 séance | 10 000 | 5 |
Gemini 2.0 Flash Live | 3 sessions | 1 000 000 | |
Modèles de génération multimodaux | |||
Aperçu de Gemini 2.5 Flash TTS | 3 | 10 000 | 15 |
TTS Gemini 2.5 Pro (preview) | |||
Génération d'images Gemini 2.0 Flash (preview) | 10 | 200 000 | 100 |
Imagen 3 | |||
Veo 2 | |||
Autres modèles | |||
Gemma 3 et 3n | 30 | 15 000 | 14 400 |
Embedding Gemini | 100 | 30 000 | 1 000 |
Modèles obsolètes | |||
Gemini 1.5 Flash (obsolète) | 15 | 250 000 | 50 |
Gemini 1.5 Flash-8B (obsolète) | 15 | 250 000 | 50 |
Gemini 1.5 Pro (obsolète) |
Niveau 1
Modèle | RPM | TPM | RPD | Jetons mis en file d'attente par lots |
---|---|---|---|---|
Modèles de sortie de texte | ||||
Gemini 2.5 Pro | 150 | 2 000 000 | 10 000 | 5 000 000 |
Gemini 2.5 Flash | 1 000 | 1 000 000 | 10 000 | 3 000 000 |
Gemini 2.5 Flash-Lite | 4 000 | 4 000 000 | Aucune limite | 10 000 000 |
Gemini 2.0 Flash | 2 000 | 4 000 000 | Aucune limite | 10 000 000 |
Gemini 2.0 Flash-Lite | 4 000 | 4 000 000 | Aucune limite | 10 000 000 |
API Live | ||||
Gemini 2.5 Flash Live | 50 sessions | 4 000 000 | ||
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash | 3 sessions | 50 000 | 50 | |
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental | 1 séance | 25 000 | 50 | |
Gemini 2.0 Flash Live | 50 sessions | 4 000 000 | ||
Modèles de génération multimodaux | ||||
Aperçu de Gemini 2.5 Flash TTS | 10 | 10 000 | 100 | |
TTS Gemini 2.5 Pro (preview) | 10 | 10 000 | 50 | |
Génération d'images Gemini 2.0 Flash (preview) | 1 000 | 1 000 000 | 10 000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
Autres modèles | ||||
Gemma 3 et 3n | 30 | 15 000 | 14 400 | |
Embedding Gemini | 3 000 | 1 000 000 | ||
Modèles obsolètes | ||||
Gemini 1.5 Flash (obsolète) | 2 000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (obsolète) | 4 000 | 4 000 000 | ||
Gemini 1.5 Pro (obsolète) | 1 000 | 4 000 000 |
Niveau 2
Modèle | RPM | TPM | RPD | Jetons mis en file d'attente par lots |
---|---|---|---|---|
Modèles de sortie de texte | ||||
Gemini 2.5 Pro | 1 000 | 5 000 000 | 50 000 | 500 000 000 |
Gemini 2.5 Flash | 2 000 | 3 000 000 | 100 000 | 400 000 000 |
Gemini 2.5 Flash-Lite | 10 000 | 10 000 000 | Aucune limite | 500 000 000 |
Gemini 2.0 Flash | 10 000 | 10 000 000 | Aucune limite | 1 000 000 000 |
Gemini 2.0 Flash-Lite | 20 000 | 10 000 000 | Aucune limite | 1 000 000 000 |
API Live | ||||
Gemini 2.5 Flash Live | 1 000 sessions | 10 000 000 | ||
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash | 100 sessions | 1 000 000 | ||
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental | 1 séance | 25 000 | 50 | |
Gemini 2.0 Flash Live | 1 000 sessions | 10 000 000 | ||
Modèles de génération multimodaux | ||||
Aperçu de Gemini 2.5 Flash TTS | 1 000 | 100 000 | 10 000 | |
TTS Gemini 2.5 Pro (preview) | 100 | 25 000 | 1 000 | |
Génération d'images Gemini 2.0 Flash (preview) | 2 000 | 3 000 000 | 100 000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
Autres modèles | ||||
Gemma 3 et 3n | 30 | 15 000 | 14 400 | |
Embedding Gemini | 5 000 | 5 000 000 | -- | -- |
Modèles obsolètes | ||||
Gemini 1.5 Flash (obsolète) | 2 000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (obsolète) | 4 000 | 4 000 000 | ||
Gemini 1.5 Pro (obsolète) | 1 000 | 4 000 000 |
Catégorie 3
Modèle | RPM | TPM | RPD | Jetons mis en file d'attente par lots |
---|---|---|---|---|
Modèles de sortie de texte | ||||
Gemini 2.5 Pro | 2 000 | 8 000 000 | Aucune limite | 1 000 000 000 |
Gemini 2.5 Flash | 10 000 | 8 000 000 | Aucune limite | 1 000 000 000 |
Gemini 2.5 Flash-Lite | 30 000 | 30 000 000 | Aucune limite | 1 000 000 000 |
Gemini 2.0 Flash | 30 000 | 30 000 000 | Aucune limite | 5 000 000 000 |
Gemini 2.0 Flash-Lite | 30 000 | 30 000 000 | Aucune limite | 5 000 000 000 |
API Live | ||||
Gemini 2.5 Flash Live | 1 000 sessions | 10 000 000 | ||
Boîte de dialogue audio native de l'aperçu Gemini 2.5 Flash | 100 sessions | 1 000 000 | ||
Boîte de dialogue native de réflexion sur l'audio Gemini 2.5 Flash Experimental | 1 séance | 25 000 | 50 | |
Gemini 2.0 Flash Live | 1 000 sessions | 10 000 000 | ||
Modèles de génération multimodaux | ||||
Aperçu de Gemini 2.5 Flash TTS | 1 000 | 1 000 000 | ||
TTS Gemini 2.5 Pro (preview) | 100 | 1 000 000 | ||
Génération d'images Gemini 2.0 Flash (preview) | 5 000 | 5 000 000 | ||
Imagen 4 Standard | 20 | 15 000 | ||
Imagen 4 Ultra | 15 | 5 000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
Autres modèles | ||||
Gemma 3 et 3n | 30 | 15 000 | 14 400 | |
Embedding Gemini | 10 000 | 10 000 000 | -- | -- |
Modèles obsolètes | ||||
Gemini 1.5 Flash (obsolète) | 2 000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (obsolète) | 4 000 | 4 000 000 | ||
Gemini 1.5 Pro (obsolète) | 1 000 | 4 000 000 |
Les limites de débit spécifiées ne sont pas garanties et la capacité réelle peut varier.
Limites de débit du mode batch
Les requêtes en mode batch sont soumises à leurs propres limites de fréquence, distinctes de celles des appels d'API en mode non batch.
- Requêtes par lot simultanées : 100
- Taille maximale du fichier d'entrée : 2 Go
- Limite de stockage de fichiers : 20 Go
- Jetons mis en file d'attente par modèle : la colonne Jetons mis en file d'attente par lot du tableau des limites de débit indique le nombre maximal de jetons pouvant être mis en file d'attente pour le traitement par lot dans tous vos jobs par lot actifs pour un modèle donné. Consultez le tableau des limites de débit standards des API.
Passer au niveau supérieur
L'API Gemini utilise Cloud Billing pour tous les services de facturation. Pour passer du niveau sans frais à un niveau payant, vous devez d'abord activer la facturation Cloud pour votre projet Google Cloud.
Une fois que votre projet répond aux critères spécifiés, il peut passer au niveau supérieur. Pour demander une mise à niveau, procédez comme suit :
- Accédez à la page Clés API dans AI Studio.
- Recherchez le projet que vous souhaitez mettre à niveau, puis cliquez sur "Mettre à niveau". L'option "Passer au niveau supérieur" ne s'affiche que pour les projets qui répondent aux critères du niveau supérieur.
Après une validation rapide, le projet passera au niveau supérieur.
Demander une augmentation de la limite de fréquence
Chaque variante de modèle est associée à une limite de fréquence (requêtes par minute, RPM). Pour en savoir plus sur ces limites de débit, consultez Modèles Gemini.
Demander une augmentation de la limite de débit pour le niveau payant
Nous ne pouvons pas vous garantir que nous augmenterons votre limite de débit, mais nous ferons de notre mieux pour examiner votre demande.