Límites de frecuencia

Los límites de frecuencia regulan la cantidad de solicitudes que puedes realizar a la API de Gemini en un período determinado. Estos límites ayudan a mantener un uso justo, proteger contra el abuso y mantener el rendimiento del sistema para todos los usuarios.

Cómo funcionan los límites de frecuencia

Por lo general, los límites de frecuencia se miden en tres dimensiones:

  • Solicitudes por minuto (RPM)
  • Tokens por minuto (entrada) (TPM)
  • Solicitudes por día (RPD)

Tu uso se evalúa en función de cada límite, y si superas alguno de ellos, se activará un error de límite de frecuencia. Por ejemplo, si tu límite de RPM es de 20, realizar 21 solicitudes en un minuto generará un error, incluso si no superaste tu límite de TPM ni otros límites.

Los límites de frecuencia se aplican por proyecto, no por clave de API.

Las cuotas de solicitudes por día (RPD) se restablecen a medianoche, hora del Pacífico.

Los límites varían según el modelo específico que se use, y algunos límites solo se aplican a modelos específicos. Por ejemplo, las imágenes por minuto (IPM) solo se calculan para los modelos capaces de generar imágenes (Imagen 3), pero son conceptualmente similares a los TPM. Es posible que otros modelos tengan un límite de tokens por día (TPD).

Los límites de frecuencia son más estrictos para los modelos experimentales y de vista previa.

Niveles de uso

Los límites de frecuencia están vinculados al nivel de uso del proyecto. A medida que aumenten tu uso y gasto de la API, tendrás la opción de actualizar a un nivel superior con límites de frecuencia más altos.

Los requisitos para los niveles 2 y 3 se basan en la inversión acumulada total en los servicios de Google Cloud (incluida, sin limitaciones, la API de Gemini) para la cuenta de facturación vinculada a tu proyecto.

Nivel Requisitos
Gratis Usuarios en países aptos
Nivel 1 Cuenta de facturación vinculada al proyecto
Nivel 2 Inversión total: > USD 250 y al menos 30 días desde el pago correcto
Nivel 3 Inversión total: > USD 1,000 y al menos 30 días desde el pago exitoso

Cuando solicitas una actualización, nuestro sistema automatizado de protección contra abusos realiza verificaciones adicionales. Si bien cumplir con los criterios de calificación establecidos suele ser suficiente para la aprobación, en casos excepcionales, se puede rechazar una solicitud de actualización en función de otros factores identificados durante el proceso de revisión.

Este sistema ayuda a mantener la seguridad y la integridad de la plataforma de la API de Gemini para todos los usuarios.

Límites de frecuencia estándar de la API

En la siguiente tabla, se indican los límites de frecuencia para todas las llamadas a la API de Gemini estándar.

Nivel gratuito

Modelo RPM TPM RPD
Modelos de texto
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
API de Live
Gemini 2.5 Flash Live 3 sesiones 1,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash 1 sesión 25,000 5
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking 1 sesión 10,000 5
Gemini 2.0 Flash Live 3 sesiones 1,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash 3 10,000 15
Versión preliminar de TTS de Gemini 2.5 Pro
Generación de imágenes de vista previa de Gemini 2.0 Flash 10 200,000 100
Imagen 3
Veo 2
Otros modelos
Gemma 3 y 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
Modelos obsoletos
Gemini 1.5 Flash (obsoleto) 15 250,000 50
Gemini 1.5 Flash-8B (obsoleto) 15 250,000 50
Gemini 1.5 Pro (obsoleto)

Nivel 1

Modelo RPM TPM RPD Tokens en cola por lotes
Modelos de texto
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 Sin límite 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 Sin límite 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 Sin límite 10,000,000
API de Live
Gemini 2.5 Flash Live 50 sesiones 4,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash 3 sesiones 50,000 50
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking 1 sesión 25,000 50
Gemini 2.0 Flash Live 50 sesiones 4,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash 10 10,000 100
Versión preliminar de TTS de Gemini 2.5 Pro 10 10,000 50
Generación de imágenes de vista previa de Gemini 2.0 Flash 1,000 1,000,000 10,000
Imagen 4, estándar 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
Otros modelos
Gemma 3 y 3n 30 15,000 14,400
Gemini Embedding 3,000 1,000,000
Modelos obsoletos
Gemini 1.5 Flash (obsoleto) 2,000 4,000,000
Gemini 1.5 Flash-8B (obsoleto) 4,000 4,000,000
Gemini 1.5 Pro (obsoleto) 1,000 4,000,000

Nivel 2

Modelo RPM TPM RPD Tokens en cola por lotes
Modelos de texto
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 Sin límite 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 Sin límite 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 Sin límite 1,000,000,000
API de Live
Gemini 2.5 Flash Live 1,000 sesiones 10,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash 100 sesiones 1,000,000
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking 1 sesión 25,000 50
Gemini 2.0 Flash Live 1,000 sesiones 10,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash 1,000 100,000 10,000
Versión preliminar de TTS de Gemini 2.5 Pro 100 25,000 1,000
Generación de imágenes de vista previa de Gemini 2.0 Flash 2,000 3,000,000 100,000
Imagen 4, estándar 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
Otros modelos
Gemma 3 y 3n 30 15,000 14,400
Gemini Embedding 5,000 5,000,000 -- --
Modelos obsoletos
Gemini 1.5 Flash (obsoleto) 2,000 4,000,000
Gemini 1.5 Flash-8B (obsoleto) 4,000 4,000,000
Gemini 1.5 Pro (obsoleto) 1,000 4,000,000

Nivel 3

Modelo RPM TPM RPD Tokens en cola por lotes
Modelos de texto
Gemini 2.5 Pro 2,000 8,000,000 Sin límite 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 Sin límite 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 Sin límite 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 Sin límite 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 Sin límite 5,000,000,000
API de Live
Gemini 2.5 Flash Live 1,000 sesiones 10,000,000
Diálogo de audio nativo de la versión preliminar de Gemini 2.5 Flash 100 sesiones 1,000,000
Diálogo de Gemini 2.5 Flash Experimental Native Audio Thinking 1 sesión 25,000 50
Gemini 2.0 Flash Live 1,000 sesiones 10,000,000
Modelos de generación multimodal
Versión preliminar de TTS de Gemini 2.5 Flash 1,000 1,000,000
Versión preliminar de TTS de Gemini 2.5 Pro 100 1,000,000
Generación de imágenes de vista previa de Gemini 2.0 Flash 5,000 5,000,000
Imagen 4, estándar 20 15,000
Imagen 4 Ultra 15 5,000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
Otros modelos
Gemma 3 y 3n 30 15,000 14,400
Gemini Embedding 10,000 10,000,000 -- --
Modelos obsoletos
Gemini 1.5 Flash (obsoleto) 2,000 4,000,000
Gemini 1.5 Flash-8B (obsoleto) 4,000 4,000,000
Gemini 1.5 Pro (obsoleto) 1,000 4,000,000

Los límites de frecuencia especificados no están garantizados y la capacidad real puede variar.

Límites de frecuencia del modo por lotes

Las solicitudes del modo por lotes están sujetas a sus propios límites de frecuencia, que son independientes de las llamadas a la API del modo no por lotes.

  • Solicitudes por lotes simultáneas: 100
  • Límite de tamaño del archivo de entrada: 2 GB
  • Límite de almacenamiento de archivos: 20 GB
  • Tokens en cola por modelo: La columna Tokens en cola por lotes de la tabla de límites de frecuencia enumera la cantidad máxima de tokens que se pueden poner en cola para el procesamiento por lotes en todos tus trabajos por lotes activos para un modelo determinado. Consulta la tabla de límites de frecuencia estándar de la API.

Cómo actualizar a la siguiente categoría

La API de Gemini usa la Facturación de Cloud para todos los servicios de facturación. Para pasar del nivel gratuito a un nivel pagado, primero debes habilitar la facturación de Cloud para tu proyecto de Google Cloud.

Una vez que tu proyecto cumpla con los criterios especificados, será apto para una actualización al siguiente nivel. Para solicitar una actualización, sigue estos pasos:

Después de una validación rápida, el proyecto se actualizará al siguiente nivel.

Solicita un aumento del límite de frecuencia

Cada variación del modelo tiene un límite de frecuencia asociado (solicitudes por minuto, RPM). Para obtener detalles sobre esos límites de frecuencia, consulta Modelos de Gemini.

Solicita un aumento del límite de la tarifa del nivel pagado

No ofrecemos garantías sobre el aumento del límite de frecuencia, pero haremos todo lo posible para revisar tu solicitud.