Límites de frecuencia

Los límites de frecuencia regulan la cantidad de solicitudes que puedes realizar a la API de Gemini en un período determinado. Estos límites ayudan a mantener un uso justo, proteger contra el abuso y mantener el rendimiento del sistema para todos los usuarios.

Cómo funcionan los límites de frecuencia

Por lo general, los límites de frecuencia se miden en tres dimensiones:

Solicitudes por minuto (RPM)
Tokens por minuto (entrada) (TPM)
Solicitudes por día (RPD)

Tu uso se evalúa en función de cada límite, y si superas alguno de ellos, se activará un error de límite de frecuencia. Por ejemplo, si tu límite de RPM es de 20, realizar 21 solicitudes en un minuto generará un error, incluso si no superaste tu límite de TPM ni otros límites.

Los límites de frecuencia se aplican por proyecto, no por clave de API.

Las cuotas de solicitudes por día (RPD) se restablecen a medianoche, hora del Pacífico.

Los límites varían según el modelo específico que se use, y algunos límites solo se aplican a modelos específicos. Por ejemplo, las imágenes por minuto (IPM) solo se calculan para los modelos capaces de generar imágenes (Imagen 3), pero son conceptualmente similares a los TPM. Es posible que otros modelos tengan un límite de tokens por día (TPD).

Los límites de frecuencia son más estrictos para los modelos experimentales y de vista previa.

Niveles de uso

Los límites de frecuencia están vinculados al nivel de uso del proyecto. A medida que aumenten tu uso y gasto de la API, tendrás la opción de actualizar a un nivel superior con límites de frecuencia más altos.

Los requisitos para los niveles 2 y 3 se basan en la inversión acumulada total en los servicios de Google Cloud (incluida, sin limitaciones, la API de Gemini) para la cuenta de facturación vinculada a tu proyecto.

Nivel	Requisitos
Gratis	Usuarios en países aptos
Nivel 1	Cuenta de facturación vinculada al proyecto
Nivel 2	Inversión total: > USD 250 y al menos 30 días desde el pago correcto
Nivel 3	Inversión total: > USD 1,000 y al menos 30 días desde el pago exitoso

Cuando solicitas una actualización, nuestro sistema automatizado de protección contra abusos realiza verificaciones adicionales. Si bien cumplir con los criterios de calificación establecidos suele ser suficiente para la aprobación, en casos excepcionales, se puede rechazar una solicitud de actualización en función de otros factores identificados durante el proceso de revisión.

Este sistema ayuda a mantener la seguridad y la integridad de la plataforma de la API de Gemini para todos los usuarios.

Límites de frecuencia estándar de la API

En la siguiente tabla, se indican los límites de frecuencia para todas las llamadas a la API de Gemini estándar.

Nivel gratuito

Modelo	RPM	TPM	RPD
Modelos de texto
Gemini 2.5 Pro	5	250,000	100
Gemini 2.5 Flash	10	250,000	250
Gemini 2.5 Flash-Lite	15	250,000	1,000
Gemini 2.0 Flash	15	1,000,000	200
Gemini 2.0 Flash-Lite	30	1,000,000	200
API de Live
Gemini 2.5 Flash Live	3 sesiones	1,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash	1 sesión	25,000	5
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking	1 sesión	10,000	5
Gemini 2.0 Flash Live	3 sesiones	1,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash	3	10,000	15
Versión preliminar de TTS de Gemini 2.5 Pro
Generación de imágenes de vista previa de Gemini 2.0 Flash	10	200,000	100
Imagen 3
Veo 2
Otros modelos
Gemma 3 y 3n	30	15,000	14,400
Gemini Embedding	100	30,000	1,000
Modelos obsoletos
Gemini 1.5 Flash (obsoleto)	15	250,000	50
Gemini 1.5 Flash-8B (obsoleto)	15	250,000	50
Gemini 1.5 Pro (obsoleto)

Nivel 1

Modelo	RPM	TPM	RPD	Tokens en cola por lotes
Modelos de texto
Gemini 2.5 Pro	150	2,000,000	10,000	5,000,000
Gemini 2.5 Flash	1,000	1,000,000	10,000	3,000,000
Gemini 2.5 Flash-Lite	4,000	4,000,000	Sin límite	10,000,000
Gemini 2.0 Flash	2,000	4,000,000	Sin límite	10,000,000
Gemini 2.0 Flash-Lite	4,000	4,000,000	Sin límite	10,000,000
API de Live
Gemini 2.5 Flash Live	50 sesiones	4,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash	3 sesiones	50,000	50
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking	1 sesión	25,000	50
Gemini 2.0 Flash Live	50 sesiones	4,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash	10	10,000	100
Versión preliminar de TTS de Gemini 2.5 Pro	10	10,000	50
Generación de imágenes de vista previa de Gemini 2.0 Flash	1,000	1,000,000	10,000
Imagen 4, estándar	10		70
Imagen 4 Ultra	5		30
Imagen 3	20
Veo 3	2		10
Veo 2	2		50
Otros modelos
Gemma 3 y 3n	30	15,000	14,400
Gemini Embedding	3,000	1,000,000
Modelos obsoletos
Gemini 1.5 Flash (obsoleto)	2,000	4,000,000
Gemini 1.5 Flash-8B (obsoleto)	4,000	4,000,000
Gemini 1.5 Pro (obsoleto)	1,000	4,000,000

Nivel 2

Modelo	RPM	TPM	RPD	Tokens en cola por lotes
Modelos de texto
Gemini 2.5 Pro	1,000	5,000,000	50,000	500,000,000
Gemini 2.5 Flash	2,000	3,000,000	100,000	400,000,000
Gemini 2.5 Flash-Lite	10,000	10,000,000	Sin límite	500,000,000
Gemini 2.0 Flash	10,000	10,000,000	Sin límite	1,000,000,000
Gemini 2.0 Flash-Lite	20,000	10,000,000	Sin límite	1,000,000,000
API de Live
Gemini 2.5 Flash Live	1,000 sesiones	10,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash	100 sesiones	1,000,000
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking	1 sesión	25,000	50
Gemini 2.0 Flash Live	1,000 sesiones	10,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash	1,000	100,000	10,000
Versión preliminar de TTS de Gemini 2.5 Pro	100	25,000	1,000
Generación de imágenes de vista previa de Gemini 2.0 Flash	2,000	3,000,000	100,000
Imagen 4, estándar	15		1000
Imagen 4 Ultra	10		400
Imagen 3	20
Veo 3	4		50
Veo 2	2		50
Otros modelos
Gemma 3 y 3n	30	15,000	14,400
Gemini Embedding	5,000	5,000,000	--	--
Modelos obsoletos
Gemini 1.5 Flash (obsoleto)	2,000	4,000,000
Gemini 1.5 Flash-8B (obsoleto)	4,000	4,000,000
Gemini 1.5 Pro (obsoleto)	1,000	4,000,000

Nivel 3

Modelo	RPM	TPM	RPD	Tokens en cola por lotes
Modelos de texto
Gemini 2.5 Pro	2,000	8,000,000	Sin límite	1,000,000,000
Gemini 2.5 Flash	10,000	8,000,000	Sin límite	1,000,000,000
Gemini 2.5 Flash-Lite	30,000	30,000,000	Sin límite	1,000,000,000
Gemini 2.0 Flash	30,000	30,000,000	Sin límite	5,000,000,000
Gemini 2.0 Flash-Lite	30,000	30,000,000	Sin límite	5,000,000,000
API de Live
Gemini 2.5 Flash Live	1,000 sesiones	10,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash	100 sesiones	1,000,000
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking	1 sesión	25,000	50
Gemini 2.0 Flash Live	1,000 sesiones	10,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash	1,000	1,000,000
Versión preliminar de TTS de Gemini 2.5 Pro	100	1,000,000
Generación de imágenes de vista previa de Gemini 2.0 Flash	5,000	5,000,000
Imagen 4, estándar	20		15,000
Imagen 4 Ultra	15		5,000
Imagen 3	20
Veo 3	10		500
Veo 2	2		50
Otros modelos
Gemma 3 y 3n	30	15,000	14,400
Gemini Embedding	10,000	10,000,000	--	--
Modelos obsoletos
Gemini 1.5 Flash (obsoleto)	2,000	4,000,000
Gemini 1.5 Flash-8B (obsoleto)	4,000	4,000,000
Gemini 1.5 Pro (obsoleto)	1,000	4,000,000

Los límites de frecuencia especificados no están garantizados y la capacidad real puede variar.

Límites de frecuencia del modo por lotes

Las solicitudes del modo por lotes están sujetas a sus propios límites de frecuencia, que son independientes de las llamadas a la API del modo no por lotes.

Solicitudes por lotes simultáneas: 100
Límite de tamaño del archivo de entrada: 2 GB
Límite de almacenamiento de archivos: 20 GB
Tokens en cola por modelo: La columna Tokens en cola por lotes de la tabla de límites de frecuencia enumera la cantidad máxima de tokens que se pueden poner en cola para el procesamiento por lotes en todos tus trabajos por lotes activos para un modelo determinado. Consulta la tabla de límites de frecuencia estándar de la API.

Cómo actualizar a la siguiente categoría

La API de Gemini usa la Facturación de Cloud para todos los servicios de facturación. Para pasar del nivel gratuito a un nivel pagado, primero debes habilitar la facturación de Cloud para tu proyecto de Google Cloud.

Una vez que tu proyecto cumpla con los criterios especificados, será apto para una actualización al siguiente nivel. Para solicitar una actualización, sigue estos pasos:

Navega a la página Claves de API en AI Studio.
Busca el proyecto que deseas actualizar y haz clic en "Actualizar". La opción "Actualizar" solo aparecerá en los proyectos que cumplan con las calificaciones del siguiente nivel.

Después de una validación rápida, el proyecto se actualizará al siguiente nivel.

Solicita un aumento del límite de frecuencia

Cada variación del modelo tiene un límite de frecuencia asociado (solicitudes por minuto, RPM). Para obtener detalles sobre esos límites de frecuencia, consulta Modelos de Gemini.

Solicita un aumento del límite de la tarifa del nivel pagado

No ofrecemos garantías sobre el aumento del límite de frecuencia, pero haremos todo lo posible para revisar tu solicitud.