Os limites de taxa regulam o número de solicitações que você pode fazer para a API Gemini em um determinado período. Esses limites ajudam a manter o uso justo, proteger contra abusos e manter o desempenho do sistema para todos os usuários.
Como os limites de taxa funcionam
Os limites de taxa geralmente são medidos em três dimensões:
- Solicitações por minuto (RPM)
- Tokens por minuto (entrada) (TPM)
- Solicitações por dia (RPD)
Seu uso é avaliado em relação a cada limite, e exceder qualquer um deles vai acionar um erro de limitação de taxa. Por exemplo, se o limite de RPM for 20, fazer 21 solicitações em um minuto vai resultar em um erro, mesmo que você não tenha excedido o TPM ou outros limites.
As limitações de taxa são aplicadas por projeto, não por chave de API.
As cotas de solicitações por dia (RPD) são redefinidas à meia-noite do horário do Pacífico.
Os limites variam de acordo com o modelo específico usado, e alguns limites se aplicam apenas a modelos específicos. Por exemplo, as imagens por minuto (IPM) só são calculadas para modelos capazes de gerar imagens (Imagen 3), mas são conceitualmente semelhantes aos TPM. Outros modelos podem ter um limite de tokens por dia (TPD).
Os limites de taxa são mais restritos para modelos experimentais e de prévia.
Níveis de uso
Os limites de taxa estão vinculados ao nível de uso do projeto. À medida que o uso e os gastos com a API aumentam, você tem a opção de fazer upgrade para um nível mais alto com limites de taxa maiores.
As qualificações para os níveis 2 e 3 são baseadas no gasto total acumulado em serviços do Google Cloud (incluindo, entre outros, a API Gemini) para a conta de faturamento vinculada ao seu projeto.
Nível | Requisitos |
---|---|
Grátis | Usuários em países qualificados |
Nível 1 | Conta de faturamento vinculada ao projeto |
Nível 2 | Gasto total: > US$ 250 e pelo menos 30 dias desde o pagamento bem-sucedido |
Nível 3 | Gasto total: > US$ 1.000 e pelo menos 30 dias desde o pagamento bem-sucedido |
Quando você pede um upgrade, nosso sistema automatizado de proteção contra abusos realiza verificações adicionais. Embora atender aos critérios de qualificação declarados seja geralmente suficiente para aprovação, em casos raros, uma solicitação de upgrade pode ser negada com base em outros fatores identificados durante o processo de revisão.
Esse sistema ajuda a manter a segurança e a integridade da plataforma da API Gemini para todos os usuários.
Limitações de taxa de API padrão
A tabela a seguir lista os limites de taxa para todas as chamadas padrão da API Gemini.
Nível gratuito
Modelo | RPM | TPM | RPD |
---|---|---|---|
Modelos de texto | |||
Gemini 2.5 Pro | 5 | 250.000 | 100 |
Gemini 2.5 Flash | 10 | 250.000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250.000 | 1.000 |
Gemini 2.0 Flash | 15 | 1.000.000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1.000.000 | 200 |
API Live | |||
Gemini 2.5 Flash Live | 3 sessões | 1.000.000 | |
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash | 1 sessão | 25.000 | 5 |
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash | 1 sessão | 10.000 | 5 |
Gemini 2.0 Flash Live | 3 sessões | 1.000.000 | |
Modelos de geração multimodal | |||
Prévia da conversão de texto em voz do Gemini 2.5 Flash | 3 | 10.000 | 15 |
Pré-lançamento da TTS do Gemini 2.5 Pro | |||
Geração de imagens de pré-lançamento do Gemini 2.0 Flash | 10 | 200.000 | 100 |
Imagen 3 | |||
Veo 2 | |||
Outros modelos | |||
Gemma 3 e 3n | 30 | 15.000 | 14.400 |
Incorporação do Gemini | 100 | 30.000 | 1.000 |
Modelos descontinuados | |||
Gemini 1.5 Flash (descontinuado) | 15 | 250.000 | 50 |
Gemini 1.5 Flash-8B (descontinuado) | 15 | 250.000 | 50 |
Gemini 1.5 Pro (descontinuado) |
Nível 1
Modelo | RPM | TPM | RPD | Tokens enfileirados em lote |
---|---|---|---|---|
Modelos de texto | ||||
Gemini 2.5 Pro | 150 | 2.000.000 | 10.000 | 5.000.000 |
Gemini 2.5 Flash | 1.000 | 1.000.000 | 10.000 | 3.000.000 |
Gemini 2.5 Flash-Lite | 4.000 | 4.000.000 | Sem limite | 10.000.000 |
Gemini 2.0 Flash | 2.000 | 4.000.000 | Sem limite | 10.000.000 |
Gemini 2.0 Flash-Lite | 4.000 | 4.000.000 | Sem limite | 10.000.000 |
API Live | ||||
Gemini 2.5 Flash Live | 50 sessões | 4.000.000 | ||
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash | 3 sessões | 50.000 | 50 | |
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash | 1 sessão | 25.000 | 50 | |
Gemini 2.0 Flash Live | 50 sessões | 4.000.000 | ||
Modelos de geração multimodal | ||||
Prévia da conversão de texto em voz do Gemini 2.5 Flash | 10 | 10.000 | 100 | |
Pré-lançamento da TTS do Gemini 2.5 Pro | 10 | 10.000 | 50 | |
Geração de imagens de pré-lançamento do Gemini 2.0 Flash | 1.000 | 1.000.000 | 10.000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
Outros modelos | ||||
Gemma 3 e 3n | 30 | 15.000 | 14.400 | |
Incorporação do Gemini | 3.000 | 1.000.000 | ||
Modelos descontinuados | ||||
Gemini 1.5 Flash (descontinuado) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (descontinuado) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (descontinuado) | 1.000 | 4.000.000 |
Nível 2
Modelo | RPM | TPM | RPD | Tokens enfileirados em lote |
---|---|---|---|---|
Modelos de texto | ||||
Gemini 2.5 Pro | 1.000 | 5.000.000 | 50.000 | 500.000.000 |
Gemini 2.5 Flash | 2.000 | 3.000.000 | 100.000 | 400.000.000 |
Gemini 2.5 Flash-Lite | 10.000 | 10.000.000 | Sem limite | 500.000.000 |
Gemini 2.0 Flash | 10.000 | 10.000.000 | Sem limite | 1.000.000.000 |
Gemini 2.0 Flash-Lite | 20.000 | 10.000.000 | Sem limite | 1.000.000.000 |
API Live | ||||
Gemini 2.5 Flash Live | 1.000 sessões | 10.000.000 | ||
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash | 100 sessões | 1.000.000 | ||
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash | 1 sessão | 25.000 | 50 | |
Gemini 2.0 Flash Live | 1.000 sessões | 10.000.000 | ||
Modelos de geração multimodal | ||||
Prévia da conversão de texto em voz do Gemini 2.5 Flash | 1.000 | 100.000 | 10.000 | |
Pré-lançamento da TTS do Gemini 2.5 Pro | 100 | 25.000 | 1.000 | |
Geração de imagens de pré-lançamento do Gemini 2.0 Flash | 2.000 | 3.000.000 | 100.000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
Outros modelos | ||||
Gemma 3 e 3n | 30 | 15.000 | 14.400 | |
Incorporação do Gemini | 5.000 | 5.000.000 | -- | -- |
Modelos descontinuados | ||||
Gemini 1.5 Flash (descontinuado) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (descontinuado) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (descontinuado) | 1.000 | 4.000.000 |
Nível 3
Modelo | RPM | TPM | RPD | Tokens enfileirados em lote |
---|---|---|---|---|
Modelos de texto | ||||
Gemini 2.5 Pro | 2.000 | 8.000.000 | Sem limite | 1.000.000.000 |
Gemini 2.5 Flash | 10.000 | 8.000.000 | Sem limite | 1.000.000.000 |
Gemini 2.5 Flash-Lite | 30.000 | 30.000.000 | Sem limite | 1.000.000.000 |
Gemini 2.0 Flash | 30.000 | 30.000.000 | Sem limite | 5.000.000.000 |
Gemini 2.0 Flash-Lite | 30.000 | 30.000.000 | Sem limite | 5.000.000.000 |
API Live | ||||
Gemini 2.5 Flash Live | 1.000 sessões | 10.000.000 | ||
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash | 100 sessões | 1.000.000 | ||
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash | 1 sessão | 25.000 | 50 | |
Gemini 2.0 Flash Live | 1.000 sessões | 10.000.000 | ||
Modelos de geração multimodal | ||||
Prévia da conversão de texto em voz do Gemini 2.5 Flash | 1.000 | 1.000.000 | ||
Pré-lançamento da TTS do Gemini 2.5 Pro | 100 | 1.000.000 | ||
Geração de imagens de pré-lançamento do Gemini 2.0 Flash | 5.000 | 5.000.000 | ||
Imagen 4 Standard | 20 | 15.000 | ||
Imagen 4 Ultra | 15 | 5.000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
Outros modelos | ||||
Gemma 3 e 3n | 30 | 15.000 | 14.400 | |
Incorporação do Gemini | 10.000 | 10.000.000 | -- | -- |
Modelos descontinuados | ||||
Gemini 1.5 Flash (descontinuado) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (descontinuado) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (descontinuado) | 1.000 | 4.000.000 |
Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.
Limites de taxa do modo em lote
As solicitações do modo em lote estão sujeitas a limites de taxa próprios, separados das chamadas de API do modo não em lote.
- Solicitações em lote simultâneas:100
- Limite de tamanho do arquivo de entrada:2 GB
- Limite de armazenamento de arquivos:20 GB
- Tokens enfileirados por modelo:a coluna Tokens enfileirados em lote na tabela de limites de taxa lista o número máximo de tokens que podem ser enfileirados para processamento em lote em todos os seus jobs em lote ativos para um determinado modelo. Consulte a tabela de limites de taxa de API padrão.
Como fazer upgrade para o próximo nível
A API Gemini usa o Cloud Billing para todos os serviços de faturamento. Para fazer a transição do nível sem custo financeiro para um nível pago, primeiro ative o faturamento do Cloud no seu projeto do Google Cloud.
Quando seu projeto atender aos critérios especificados, ele vai se qualificar para um upgrade para o próximo nível. Para pedir um upgrade, siga estas etapas:
- Navegue até a página de chaves de API no AI Studio.
- Localize o projeto que você quer atualizar e clique em "Fazer upgrade". A opção "Fazer upgrade" só vai aparecer para projetos que atendem às qualificações do próximo nível.
Após uma validação rápida, o projeto será atualizado para o próximo nível.
Solicitar um aumento no limite de taxa
Cada variação de modelo tem um limite de taxa associado (solicitações por minuto, RPM). Para detalhes sobre esses limites de taxa, consulte Modelos do Gemini.
Solicitar um aumento no limite de taxa do nível pago
Não podemos garantir que vamos aumentar seu limite de taxa, mas faremos o possível para analisar seu pedido.