Limiti di frequenza

I limiti di frequenza regolano il numero di richieste che puoi effettuare all'API Gemini in un determinato periodo di tempo. Questi limiti contribuiscono a mantenere un utilizzo equo, proteggere dagli abusi e mantenere le prestazioni del sistema per tutti gli utenti.

Come funzionano i limiti di frequenza

I limiti di frequenza vengono in genere misurati in tre dimensioni:

Richieste al minuto (RPM)
Token al minuto (input) (TPM)
Richieste al giorno (RPD)

Il tuo utilizzo viene valutato in base a ciascun limite e il superamento di uno qualsiasi di questi limiti attiva un errore di limite di frequenza. Ad esempio, se il limite di RPM è 20, l'invio di 21 richieste entro un minuto genererà un errore, anche se non hai superato il limite TPM o altri limiti.

I limiti di frequenza vengono applicati per progetto, non per chiave API.

Le quote di richieste al giorno (RPD) vengono reimpostate alla mezzanotte del fuso orario del Pacifico.

I limiti variano a seconda del modello specifico utilizzato e alcuni limiti si applicano solo a modelli specifici. Ad esempio, le immagini al minuto (IPM) vengono calcolate solo per i modelli in grado di generare immagini (Imagen 3), ma sono concettualmente simili ai token al minuto (TPM). Altri modelli potrebbero avere un limite di token al giorno (TPD).

I limiti di frequenza sono più restrittivi per i modelli sperimentali e di anteprima.

Livelli di utilizzo

I limiti di frequenza sono legati al livello di utilizzo del progetto. Man mano che l'utilizzo e la spesa dell'API aumentano, avrai la possibilità di eseguire l'upgrade a un livello superiore con limiti di frequenza maggiori.

I requisiti per i livelli 2 e 3 si basano sulla spesa cumulativa totale per i servizi Google Cloud (inclusa, a titolo esemplificativo, l'API Gemini) per l'account di fatturazione collegato al tuo progetto.

Livello	Requisiti
Gratis	Utenti nei paesi idonei
Livello 1	Account di fatturazione collegato al progetto
Livello 2	Spesa totale: > 250 $ e almeno 30 giorni dal pagamento andato a buon fine
Livello 3	Spesa totale: > 1000 $ e almeno 30 giorni dal pagamento andato a buon fine

Quando richiedi un upgrade, il nostro sistema automatico di protezione dagli abusi esegue controlli aggiuntivi. Sebbene il rispetto dei criteri di qualifica indicati sia generalmente sufficiente per l'approvazione, in rari casi una richiesta di upgrade può essere rifiutata in base ad altri fattori identificati durante la procedura di revisione.

Questo sistema contribuisce a mantenere la sicurezza e l'integrità della piattaforma API Gemini per tutti gli utenti.

Limiti di frequenza delle richieste API standard

La tabella seguente elenca i limiti di frequenza per tutte le chiamate standard dell'API Gemini.

Livello gratuito

Modello	RPM	TPM	RPD
Modelli di estrazione del testo
Gemini 2.5 Pro	5	250.000	100
Gemini 2.5 Flash	10	250.000	250
Gemini 2.5 Flash-Lite	15	250.000	1000
Gemini 2.0 Flash	15	1.000.000	200
Gemini 2.0 Flash-Lite	30	1.000.000	200
API Live
Gemini 2.5 Flash Live	3 sessioni	1.000.000
Finestra di dialogo dell'anteprima audio nativo di Gemini 2.5 Flash	1 sessione	25.000	5
Finestra di dialogo di Gemini 2.5 Flash Experimental Native Audio Thinking	1 sessione	10.000	5
Gemini 2.0 Flash Live	3 sessioni	1.000.000
Modelli di generazione multimodale
Sintesi vocale di anteprima di Gemini 2.5 Flash	3	10.000	15
Anteprima della sintesi vocale di Gemini 2.5 Pro
Generazione di immagini di anteprima di Gemini 2.0 Flash	10	200.000	100
Imagen 3
Veo 2
Altri modelli
Gemma 3 e 3n	30	15.000	14.400
Incorporamento di Gemini	100	30.000	1000
Modelli ritirati
Gemini 1.5 Flash (ritirato)	15	250.000	50
Gemini 1.5 Flash-8B (ritirato)	15	250.000	50
Gemini 1.5 Pro (ritirato)

Livello 1

Modello	RPM	TPM	RPD	Token in coda batch
Modelli di estrazione del testo
Gemini 2.5 Pro	150	2.000.000	10.000	5.000.000
Gemini 2.5 Flash	1000	1.000.000	10.000	3.000.000
Gemini 2.5 Flash-Lite	4000	4.000.000	Nessun limite	10.000.000
Gemini 2.0 Flash	2000	4.000.000	Nessun limite	10.000.000
Gemini 2.0 Flash-Lite	4000	4.000.000	Nessun limite	10.000.000
API Live
Gemini 2.5 Flash Live	50 sessioni	4.000.000
Finestra di dialogo dell'anteprima audio nativo di Gemini 2.5 Flash	3 sessioni	50.000	50
Finestra di dialogo di Gemini 2.5 Flash Experimental Native Audio Thinking	1 sessione	25.000	50
Gemini 2.0 Flash Live	50 sessioni	4.000.000
Modelli di generazione multimodale
Sintesi vocale di anteprima di Gemini 2.5 Flash	10	10.000	100
Anteprima della sintesi vocale di Gemini 2.5 Pro	10	10.000	50
Generazione di immagini di anteprima di Gemini 2.0 Flash	1000	1.000.000	10.000
Imagen 4 Standard	10		70
Imagen 4 Ultra	5		30
Imagen 3	20
Veo 3	2		10
Veo 2	2		50
Altri modelli
Gemma 3 e 3n	30	15.000	14.400
Incorporamento di Gemini	3000	1.000.000
Modelli ritirati
Gemini 1.5 Flash (ritirato)	2000	4.000.000
Gemini 1.5 Flash-8B (ritirato)	4000	4.000.000
Gemini 1.5 Pro (ritirato)	1000	4.000.000

Livello 2

Modello	RPM	TPM	RPD	Token in coda batch
Modelli di estrazione del testo
Gemini 2.5 Pro	1000	5.000.000	50.000	500.000.000
Gemini 2.5 Flash	2000	3.000.000	100.000	400.000.000
Gemini 2.5 Flash-Lite	10.000	10.000.000	Nessun limite	500.000.000
Gemini 2.0 Flash	10.000	10.000.000	Nessun limite	1.000.000.000
Gemini 2.0 Flash-Lite	20.000	10.000.000	Nessun limite	1.000.000.000
API Live
Gemini 2.5 Flash Live	1000 sessioni	10.000.000
Finestra di dialogo dell'anteprima audio nativo di Gemini 2.5 Flash	100 sessioni	1.000.000
Finestra di dialogo di Gemini 2.5 Flash Experimental Native Audio Thinking	1 sessione	25.000	50
Gemini 2.0 Flash Live	1000 sessioni	10.000.000
Modelli di generazione multimodale
Sintesi vocale di anteprima di Gemini 2.5 Flash	1000	100.000	10.000
Anteprima della sintesi vocale di Gemini 2.5 Pro	100	25.000	1000
Generazione di immagini di anteprima di Gemini 2.0 Flash	2000	3.000.000	100.000
Imagen 4 Standard	15		1000
Imagen 4 Ultra	10		400
Imagen 3	20
Veo 3	4		50
Veo 2	2		50
Altri modelli
Gemma 3 e 3n	30	15.000	14.400
Incorporamento di Gemini	5000	5.000.000	--	--
Modelli ritirati
Gemini 1.5 Flash (ritirato)	2000	4.000.000
Gemini 1.5 Flash-8B (ritirato)	4000	4.000.000
Gemini 1.5 Pro (ritirato)	1000	4.000.000

Livello 3

Modello	RPM	TPM	RPD	Token in coda batch
Modelli di estrazione del testo
Gemini 2.5 Pro	2000	8.000.000	Nessun limite	1.000.000.000
Gemini 2.5 Flash	10.000	8.000.000	Nessun limite	1.000.000.000
Gemini 2.5 Flash-Lite	30.000	30.000.000	Nessun limite	1.000.000.000
Gemini 2.0 Flash	30.000	30.000.000	Nessun limite	5.000.000.000
Gemini 2.0 Flash-Lite	30.000	30.000.000	Nessun limite	5.000.000.000
API Live
Gemini 2.5 Flash Live	1000 sessioni	10.000.000
Finestra di dialogo dell'anteprima audio nativo di Gemini 2.5 Flash	100 sessioni	1.000.000
Finestra di dialogo di Gemini 2.5 Flash Experimental Native Audio Thinking	1 sessione	25.000	50
Gemini 2.0 Flash Live	1000 sessioni	10.000.000
Modelli di generazione multimodale
Sintesi vocale di anteprima di Gemini 2.5 Flash	1000	1.000.000
Anteprima della sintesi vocale di Gemini 2.5 Pro	100	1.000.000
Generazione di immagini di anteprima di Gemini 2.0 Flash	5000	5.000.000
Imagen 4 Standard	20		15.000
Imagen 4 Ultra	15		5000
Imagen 3	20
Veo 3	10		500
Veo 2	2		50
Altri modelli
Gemma 3 e 3n	30	15.000	14.400
Incorporamento di Gemini	10.000	10.000.000	--	--
Modelli ritirati
Gemini 1.5 Flash (ritirato)	2000	4.000.000
Gemini 1.5 Flash-8B (ritirato)	4000	4.000.000
Gemini 1.5 Pro (ritirato)	1000	4.000.000

I limiti di frequenza specificati non sono garantiti e la capacità effettiva potrebbe variare.

Limiti di frequenza della modalità batch

Le richieste in modalità batch sono soggette a limiti di frequenza propri, separati dalle chiamate API in modalità non batch.

Richieste batch simultanee: 100
Limite dimensioni file di input:2 GB
Limite di spazio di archiviazione dei file:20 GB
Token in coda per modello:la colonna Token in coda batch nella tabella dei limiti di frequenza elenca il numero massimo di token che possono essere messi in coda per l'elaborazione batch in tutti i job batch attivi per un determinato modello. Consulta la tabella dei limiti di frequenza delle richieste API standard.

Come eseguire l'upgrade al livello successivo

L'API Gemini utilizza Cloud Billing per tutti i servizi di fatturazione. Per passare dal livello senza costi a un livello a pagamento, devi prima attivare Cloud Billing per il tuo progetto Google Cloud.

Una volta che il progetto soddisfa i criteri specificati, diventa idoneo per un upgrade al livello successivo. Per richiedere un upgrade:

Vai alla pagina Chiavi API in AI Studio.
Individua il progetto di cui vuoi eseguire l'upgrade e fai clic su "Esegui l'upgrade". L'opzione "Esegui upgrade" viene visualizzata solo per i progetti che soddisfano i requisiti del livello successivo.

Dopo una rapida convalida, verrà eseguito l'upgrade del progetto al livello successivo.

Richiedere un aumento del limite di frequenza

Ogni variante del modello ha un limite di frequenza associato (richieste al minuto, RPM). Per informazioni dettagliate su questi limiti di frequenza, consulta Modelli Gemini.

Richiedere un aumento del limite di frequenza per il livello a pagamento

Non offriamo garanzie in merito all'aumento del limite di frequenza, ma faremo del nostro meglio per esaminare la tua richiesta.