Batas kapasitas

Batas laju mengatur jumlah permintaan yang dapat Anda ajukan ke Gemini API dalam jangka waktu tertentu. Batasan ini membantu mempertahankan penggunaan yang adil, melindungi dari penyalahgunaan, dan membantu mempertahankan performa sistem untuk semua pengguna.

Cara kerja batas laju

Batas laju biasanya diukur di tiga dimensi:

Permintaan per menit (RPM)
Token per menit (input) (TPM)
Permintaan per hari (RPD)

Penggunaan Anda dievaluasi terhadap setiap batas, dan jika salah satu batas terlampaui, error batas laju akan dipicu. Misalnya, jika batas RPM Anda adalah 20, membuat 21 permintaan dalam satu menit akan menghasilkan error, meskipun Anda belum melampaui batas TPM atau batas lainnya.

Batas frekuensi diterapkan per project, bukan per kunci API.

Kuota permintaan per hari (RPD) direset pada tengah malam waktu Pasifik.

Batas bervariasi bergantung pada model spesifik yang digunakan, dan beberapa batas hanya berlaku untuk model tertentu. Misalnya, Gambar per menit (IPM) hanya dihitung untuk model yang mampu membuat gambar (Imagen 3), tetapi secara konseptual mirip dengan TPM. Model lain mungkin memiliki batas token per hari (TPD).

Batas penggunaan lebih ketat untuk model eksperimental dan pratinjau.

Tingkat penggunaan

Pembatasan kapasitas terikat dengan tingkat penggunaan project. Seiring peningkatan penggunaan dan pembelanjaan API, Anda akan memiliki opsi untuk mengupgrade ke tingkat yang lebih tinggi dengan batas frekuensi yang lebih tinggi.

Kualifikasi untuk Tingkat 2 dan 3 didasarkan pada total pembelanjaan kumulatif untuk layanan Google Cloud (termasuk, tetapi tidak terbatas pada, Gemini API) untuk akun penagihan yang ditautkan ke project Anda.

Tingkat	Kualifikasi
Gratis	Pengguna di negara yang memenuhi syarat
Tingkat 1	Akun penagihan yang ditautkan ke project
Tingkat 2	Total pembelanjaan: > $250 dan setidaknya 30 hari sejak pembayaran berhasil
Tingkat 3	Total pembelanjaan: > $1.000 dan setidaknya 30 hari sejak pembayaran berhasil

Saat Anda meminta upgrade, sistem perlindungan dari penyalahgunaan otomatis kami akan melakukan pemeriksaan tambahan. Meskipun memenuhi kriteria kelayakan yang dinyatakan umumnya sudah cukup untuk mendapatkan persetujuan, dalam kasus yang jarang terjadi, permintaan upgrade dapat ditolak berdasarkan faktor lain yang diidentifikasi selama proses peninjauan.

Sistem ini membantu menjaga keamanan dan integritas platform Gemini API bagi semua pengguna.

Batas kapasitas API standar

Tabel berikut mencantumkan batas laju untuk semua panggilan Gemini API standar.

Paket Gratis

Model	RPM	TPM	RPD
Model teks keluar
Gemini 2.5 Pro	5	250.000	100
Gemini 2.5 Flash	10	250.000	250
Gemini 2.5 Flash-Lite	15	250.000	1.000
Gemini 2.0 Flash	15	1.000.000	200
Gemini 2.0 Flash-Lite	30	1.000.000	200
Live API
Gemini 2.5 Flash Live	3 sesi	1.000.000
Dialog Audio Native Pratinjau Gemini 2.5 Flash	1 sesi	25.000	5
Dialog Native Audio Thinking Eksperimental Gemini 2.5 Flash	1 sesi	10.000	5
Gemini 2.0 Flash Live	3 sesi	1.000.000
Model pembuatan multi-modal
TTS Pratinjau Gemini 2.5 Flash	3	10.000	15
TTS Pratinjau Gemini 2.5 Pro
Pembuatan Gambar Pratinjau Gemini 2.0 Flash	10	200.000	100
Imagen 3
Veo 2
Model lainnya
Gemma 3 & 3n	30	15.000	14.400
Penyematan Gemini	100	30.000	1.000
Model yang tidak digunakan lagi
Gemini 1.5 Flash (Tidak digunakan lagi)	15	250.000	50
Gemini 1.5 Flash-8B (Tidak digunakan lagi)	15	250.000	50
Gemini 1.5 Pro (Tidak digunakan lagi)

Tingkat 1

Model	RPM	TPM	RPD	Token yang Dimasukkan dalam Antrean Batch
Model teks keluar
Gemini 2.5 Pro	150	2.000.000	10.000	5.000.000
Gemini 2.5 Flash	1.000	1.000.000	10.000	3.000.000
Gemini 2.5 Flash-Lite	4.000	4.000.000	Tak terbatas	10.000.000
Gemini 2.0 Flash	2.000	4.000.000	Tak terbatas	10.000.000
Gemini 2.0 Flash-Lite	4.000	4.000.000	Tak terbatas	10.000.000
Live API
Gemini 2.5 Flash Live	50 sesi	4.000.000
Dialog Audio Native Pratinjau Gemini 2.5 Flash	3 sesi	50.000	50
Dialog Native Audio Thinking Eksperimental Gemini 2.5 Flash	1 sesi	25.000	50
Gemini 2.0 Flash Live	50 sesi	4.000.000
Model pembuatan multi-modal
TTS Pratinjau Gemini 2.5 Flash	10	10.000	100
TTS Pratinjau Gemini 2.5 Pro	10	10.000	50
Pembuatan Gambar Pratinjau Gemini 2.0 Flash	1.000	1.000.000	10.000
Imagen 4 Standard	10		70
Imagen 4 Ultra	5		30
Imagen 3	20
Veo 3	2		10
Veo 2	2		50
Model lainnya
Gemma 3 & 3n	30	15.000	14.400
Penyematan Gemini	3.000	1.000.000
Model yang tidak digunakan lagi
Gemini 1.5 Flash (Tidak digunakan lagi)	2.000	4.000.000
Gemini 1.5 Flash-8B (Tidak digunakan lagi)	4.000	4.000.000
Gemini 1.5 Pro (Tidak digunakan lagi)	1.000	4.000.000

Tingkat 2

Model	RPM	TPM	RPD	Token yang Dimasukkan dalam Antrean Batch
Model teks keluar
Gemini 2.5 Pro	1.000	5.000.000	50.000	500.000.000
Gemini 2.5 Flash	2.000	3.000.000	100.000	400.000.000
Gemini 2.5 Flash-Lite	10.000	10.000.000	Tak terbatas	500.000.000
Gemini 2.0 Flash	10.000	10.000.000	Tak terbatas	1.000.000.000
Gemini 2.0 Flash-Lite	20.000	10.000.000	Tak terbatas	1.000.000.000
Live API
Gemini 2.5 Flash Live	1.000 sesi	10.000.000
Dialog Audio Native Pratinjau Gemini 2.5 Flash	100 sesi	1.000.000
Dialog Native Audio Thinking Eksperimental Gemini 2.5 Flash	1 sesi	25.000	50
Gemini 2.0 Flash Live	1.000 sesi	10.000.000
Model pembuatan multi-modal
TTS Pratinjau Gemini 2.5 Flash	1.000	100.000	10.000
TTS Pratinjau Gemini 2.5 Pro	100	25.000	1.000
Pembuatan Gambar Pratinjau Gemini 2.0 Flash	2.000	3.000.000	100.000
Imagen 4 Standard	15		1000
Imagen 4 Ultra	10		400
Imagen 3	20
Veo 3	4		50
Veo 2	2		50
Model lainnya
Gemma 3 & 3n	30	15.000	14.400
Penyematan Gemini	5.000	5.000.000	--	--
Model yang tidak digunakan lagi
Gemini 1.5 Flash (Tidak digunakan lagi)	2.000	4.000.000
Gemini 1.5 Flash-8B (Tidak digunakan lagi)	4.000	4.000.000
Gemini 1.5 Pro (Tidak digunakan lagi)	1.000	4.000.000

Tingkat 3

Model	RPM	TPM	RPD	Token yang Dimasukkan dalam Antrean Batch
Model teks keluar
Gemini 2.5 Pro	2.000	8.000.000	Tak terbatas	1.000.000.000
Gemini 2.5 Flash	10.000	8.000.000	Tak terbatas	1.000.000.000
Gemini 2.5 Flash-Lite	30.000	30.000.000	Tak terbatas	1.000.000.000
Gemini 2.0 Flash	30.000	30.000.000	Tak terbatas	5.000.000.000
Gemini 2.0 Flash-Lite	30.000	30.000.000	Tak terbatas	5.000.000.000
Live API
Gemini 2.5 Flash Live	1.000 sesi	10.000.000
Dialog Audio Native Pratinjau Gemini 2.5 Flash	100 sesi	1.000.000
Dialog Native Audio Thinking Eksperimental Gemini 2.5 Flash	1 sesi	25.000	50
Gemini 2.0 Flash Live	1.000 sesi	10.000.000
Model pembuatan multi-modal
TTS Pratinjau Gemini 2.5 Flash	1.000	1.000.000
TTS Pratinjau Gemini 2.5 Pro	100	1.000.000
Pembuatan Gambar Pratinjau Gemini 2.0 Flash	5.000	5.000.000
Imagen 4 Standard	20		15.000
Imagen 4 Ultra	15		5.000
Imagen 3	20
Veo 3	10		500
Veo 2	2		50
Model lainnya
Gemma 3 & 3n	30	15.000	14.400
Penyematan Gemini	10.000	10.000.000	--	--
Model yang tidak digunakan lagi
Gemini 1.5 Flash (Tidak digunakan lagi)	2.000	4.000.000
Gemini 1.5 Flash-8B (Tidak digunakan lagi)	4.000	4.000.000
Gemini 1.5 Pro (Tidak digunakan lagi)	1.000	4.000.000

Batas frekuensi yang ditentukan tidak dijamin dan kapasitas sebenarnya dapat bervariasi.

Batas kapasitas Mode Batch

Permintaan Mode Batch tunduk pada batas laju sendiri, terpisah dari panggilan API mode non-batch.

Permintaan batch serentak: 100
Batas ukuran file input: 2 GB
Batas penyimpanan file: 20 GB
Token dalam antrean per model: Kolom Token dalam Antrean Batch dalam tabel batas kecepatan mencantumkan jumlah maksimum token yang dapat dimasukkan dalam antrean untuk pemrosesan batch di semua tugas batch aktif Anda untuk model tertentu. Lihat di tabel batas kapasitas API standar.

Cara mengupgrade ke tingkat berikutnya

Gemini API menggunakan Penagihan Cloud untuk semua layanan penagihan. Untuk beralih dari paket Gratis ke paket berbayar, Anda harus mengaktifkan Penagihan Cloud untuk project Google Cloud Anda terlebih dahulu.

Setelah project Anda memenuhi kriteria yang ditentukan, project tersebut akan memenuhi syarat untuk di-upgrade ke tingkat berikutnya. Untuk meminta upgrade, ikuti langkah-langkah berikut:

Buka halaman kunci API di AI Studio.
Cari project yang ingin Anda upgrade, lalu klik "Upgrade". Opsi "Upgrade" hanya akan muncul untuk project yang memenuhi kualifikasi tingkat berikutnya.

Setelah validasi cepat, project akan diupgrade ke tingkat berikutnya.

Meminta peningkatan batas frekuensi

Setiap variasi model memiliki batas frekuensi panggilan terkait (permintaan per menit, RPM). Untuk mengetahui detail tentang batas kapasitas tersebut, lihat Model Gemini.

Meminta peningkatan batas rasio tingkat berbayar

Kami tidak memberikan jaminan tentang peningkatan batas kecepatan Anda, tetapi kami akan berupaya sebaik mungkin untuk meninjau permintaan Anda.