Los límites de frecuencia regulan la cantidad de solicitudes que puedes realizar a la API de Gemini en un período determinado. Estos límites ayudan a mantener un uso justo, proteger contra el abuso y mantener el rendimiento del sistema para todos los usuarios.
Cómo funcionan los límites de frecuencia
Por lo general, los límites de frecuencia se miden en tres dimensiones:
- Solicitudes por minuto (RPM)
- Tokens por minuto (entrada) (TPM)
- Solicitudes por día (RPD)
Tu uso se evalúa en función de cada límite, y si superas alguno de ellos, se activará un error de límite de frecuencia. Por ejemplo, si tu límite de RPM es de 20, realizar 21 solicitudes en un minuto generará un error, incluso si no superaste tu límite de TPM ni otros límites.
Los límites de frecuencia se aplican por proyecto, no por clave de API.
Las cuotas de solicitudes por día (RPD) se restablecen a medianoche, hora del Pacífico.
Los límites varían según el modelo específico que se use, y algunos límites solo se aplican a modelos específicos. Por ejemplo, las imágenes por minuto (IPM) solo se calculan para los modelos capaces de generar imágenes (Imagen 3), pero son conceptualmente similares a los TPM. Es posible que otros modelos tengan un límite de tokens por día (TPD).
Los límites de frecuencia son más estrictos para los modelos experimentales y de vista previa.
Niveles de uso
Los límites de frecuencia están vinculados al nivel de uso del proyecto. A medida que aumenten tu uso y gasto de la API, tendrás la opción de actualizar a un nivel superior con límites de frecuencia más altos.
Los requisitos para los niveles 2 y 3 se basan en la inversión acumulada total en los servicios de Google Cloud (incluida, sin limitaciones, la API de Gemini) para la cuenta de facturación vinculada a tu proyecto.
Nivel | Requisitos |
---|---|
Gratis | Usuarios en países aptos |
Nivel 1 | Cuenta de facturación vinculada al proyecto |
Nivel 2 | Inversión total: > USD 250 y al menos 30 días desde el pago correcto |
Nivel 3 | Inversión total: > USD 1,000 y al menos 30 días desde el pago exitoso |
Cuando solicitas una actualización, nuestro sistema automatizado de protección contra abusos realiza verificaciones adicionales. Si bien cumplir con los criterios de calificación establecidos suele ser suficiente para la aprobación, en casos excepcionales, se puede rechazar una solicitud de actualización en función de otros factores identificados durante el proceso de revisión.
Este sistema ayuda a mantener la seguridad y la integridad de la plataforma de la API de Gemini para todos los usuarios.
Límites de frecuencia estándar de la API
En la siguiente tabla, se indican los límites de frecuencia para todas las llamadas a la API de Gemini estándar.
Nivel gratuito
Modelo | RPM | TPM | RPD |
---|---|---|---|
Modelos de texto | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
API de Live | |||
Gemini 2.5 Flash Live | 3 sesiones | 1,000,000 | |
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash | 1 sesión | 25,000 | 5 |
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking | 1 sesión | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 sesiones | 1,000,000 | |
Modelos de generación multimodal | |||
Versión preliminar de TTS de Gemini 2.5 Flash | 3 | 10,000 | 15 |
Versión preliminar de TTS de Gemini 2.5 Pro | |||
Generación de imágenes de vista previa de Gemini 2.0 Flash | 10 | 200,000 | 100 |
Imagen 3 | |||
Veo 2 | |||
Otros modelos | |||
Gemma 3 y 3n | 30 | 15,000 | 14,400 |
Gemini Embedding | 100 | 30,000 | 1,000 |
Modelos obsoletos | |||
Gemini 1.5 Flash (obsoleto) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (obsoleto) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (obsoleto) |
Nivel 1
Modelo | RPM | TPM | RPD | Tokens en cola por lotes |
---|---|---|---|---|
Modelos de texto | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | Sin límite | 10,000,000 |
Gemini 2.0 Flash | 2,000 | 4,000,000 | Sin límite | 10,000,000 |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | Sin límite | 10,000,000 |
API de Live | ||||
Gemini 2.5 Flash Live | 50 sesiones | 4,000,000 | ||
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash | 3 sesiones | 50,000 | 50 | |
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking | 1 sesión | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 sesiones | 4,000,000 | ||
Modelos de generación multimodal | ||||
Versión preliminar de TTS de Gemini 2.5 Flash | 10 | 10,000 | 100 | |
Versión preliminar de TTS de Gemini 2.5 Pro | 10 | 10,000 | 50 | |
Generación de imágenes de vista previa de Gemini 2.0 Flash | 1,000 | 1,000,000 | 10,000 | |
Imagen 4, estándar | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
Otros modelos | ||||
Gemma 3 y 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 3,000 | 1,000,000 | ||
Modelos obsoletos | ||||
Gemini 1.5 Flash (obsoleto) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (obsoleto) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (obsoleto) | 1,000 | 4,000,000 |
Nivel 2
Modelo | RPM | TPM | RPD | Tokens en cola por lotes |
---|---|---|---|---|
Modelos de texto | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | Sin límite | 500,000,000 |
Gemini 2.0 Flash | 10,000 | 10,000,000 | Sin límite | 1,000,000,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | Sin límite | 1,000,000,000 |
API de Live | ||||
Gemini 2.5 Flash Live | 1,000 sesiones | 10,000,000 | ||
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash | 100 sesiones | 1,000,000 | ||
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking | 1 sesión | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 sesiones | 10,000,000 | ||
Modelos de generación multimodal | ||||
Versión preliminar de TTS de Gemini 2.5 Flash | 1,000 | 100,000 | 10,000 | |
Versión preliminar de TTS de Gemini 2.5 Pro | 100 | 25,000 | 1,000 | |
Generación de imágenes de vista previa de Gemini 2.0 Flash | 2,000 | 3,000,000 | 100,000 | |
Imagen 4, estándar | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
Otros modelos | ||||
Gemma 3 y 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 5,000 | 5,000,000 | -- | -- |
Modelos obsoletos | ||||
Gemini 1.5 Flash (obsoleto) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (obsoleto) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (obsoleto) | 1,000 | 4,000,000 |
Nivel 3
Modelo | RPM | TPM | RPD | Tokens en cola por lotes |
---|---|---|---|---|
Modelos de texto | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | Sin límite | 1,000,000,000 |
Gemini 2.5 Flash | 10,000 | 8,000,000 | Sin límite | 1,000,000,000 |
Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | Sin límite | 1,000,000,000 |
Gemini 2.0 Flash | 30,000 | 30,000,000 | Sin límite | 5,000,000,000 |
Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | Sin límite | 5,000,000,000 |
API de Live | ||||
Gemini 2.5 Flash Live | 1,000 sesiones | 10,000,000 | ||
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash | 100 sesiones | 1,000,000 | ||
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking | 1 sesión | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 sesiones | 10,000,000 | ||
Modelos de generación multimodal | ||||
Versión preliminar de TTS de Gemini 2.5 Flash | 1,000 | 1,000,000 | ||
Versión preliminar de TTS de Gemini 2.5 Pro | 100 | 1,000,000 | ||
Generación de imágenes de vista previa de Gemini 2.0 Flash | 5,000 | 5,000,000 | ||
Imagen 4, estándar | 20 | 15,000 | ||
Imagen 4 Ultra | 15 | 5,000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
Otros modelos | ||||
Gemma 3 y 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 10,000 | 10,000,000 | -- | -- |
Modelos obsoletos | ||||
Gemini 1.5 Flash (obsoleto) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (obsoleto) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (obsoleto) | 1,000 | 4,000,000 |
Los límites de frecuencia especificados no están garantizados y la capacidad real puede variar.
Límites de frecuencia del modo por lotes
Las solicitudes del modo por lotes están sujetas a sus propios límites de frecuencia, que son independientes de las llamadas a la API del modo no por lotes.
- Solicitudes por lotes simultáneas: 100
- Límite de tamaño del archivo de entrada: 2 GB
- Límite de almacenamiento de archivos: 20 GB
- Tokens en cola por modelo: La columna Tokens en cola por lotes de la tabla de límites de frecuencia enumera la cantidad máxima de tokens que se pueden poner en cola para el procesamiento por lotes en todos tus trabajos por lotes activos para un modelo determinado. Consulta la tabla de límites de frecuencia estándar de la API.
Cómo actualizar a la siguiente categoría
La API de Gemini usa la Facturación de Cloud para todos los servicios de facturación. Para pasar del nivel gratuito a un nivel pagado, primero debes habilitar la facturación de Cloud para tu proyecto de Google Cloud.
Una vez que tu proyecto cumpla con los criterios especificados, será apto para una actualización al siguiente nivel. Para solicitar una actualización, sigue estos pasos:
- Navega a la página Claves de API en AI Studio.
- Busca el proyecto que deseas actualizar y haz clic en "Actualizar". La opción "Actualizar" solo aparecerá en los proyectos que cumplan con las calificaciones del siguiente nivel.
Después de una validación rápida, el proyecto se actualizará al siguiente nivel.
Solicita un aumento del límite de frecuencia
Cada variación del modelo tiene un límite de frecuencia asociado (solicitudes por minuto, RPM). Para obtener detalles sobre esos límites de frecuencia, consulta Modelos de Gemini.
Solicita un aumento del límite de la tarifa del nivel pagado
No ofrecemos garantías sobre el aumento del límite de frecuencia, pero haremos todo lo posible para revisar tu solicitud.