Hız sınırları

Hız sınırları, belirli bir zaman aralığında Gemini API'ye yapabileceğiniz istek sayısını düzenler. Bu sınırlar, adil kullanımı sürdürmeye, kötüye kullanıma karşı korumaya ve sistem performansını tüm kullanıcılar için korumaya yardımcı olur.

Hız sınırlarının işleyiş şekli

Hız sınırları genellikle üç boyutta ölçülür:

  • Dakika başına istek sayısı (RPM)
  • Dakikadaki jeton sayısı (giriş) (TPM)
  • Günlük istek sayısı (RPD)

Kullanımınız her sınıra göre değerlendirilir ve herhangi bir sınırı aşmanız durumunda sıklık sınırı hatası tetiklenir. Örneğin, RPM sınırınız 20 ise TPM veya diğer sınırlarınızı aşmamış olsanız bile bir dakika içinde 21 istekte bulunmanız hataya neden olur.

Hız sınırları, API anahtarı başına değil proje başına uygulanır.

Günlük istek (RPD) kotaları, Pasifik saatine göre gece yarısında sıfırlanır.

Sınırlar, kullanılan modele göre değişir ve bazı sınırlar yalnızca belirli modeller için geçerlidir. Örneğin, dakikadaki resim sayısı (IPM) yalnızca resim oluşturabilen modeller (Imagen 3) için hesaplanır ancak kavramsal olarak TPM'ye benzer. Diğer modellerde günlük jeton sınırı (TPD) olabilir.

Deneysel ve önizleme modellerinde hız sınırları daha kısıtlıdır.

Kullanım katmanları

Hız sınırları, projenin kullanım katmanına bağlıdır. API kullanımınız ve harcamanız arttıkça daha yüksek hız sınırlarına sahip bir plana geçiş yapabilirsiniz.

2. ve 3. katmanların şartları, projenize bağlı faturalandırma hesabında Google Cloud hizmetlerine (Gemini API dahil ancak bununla sınırlı olmamak üzere) yapılan toplam harcamaya göre belirlenir.

Katman Nitelikler
Ücretsiz Uygun ülkelerdeki kullanıcılar
Katman 1 Projeye bağlı faturalandırma hesabı
Katman 2 Toplam harcama: > 250 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır.
3. Katman Toplam harcama: > 1.000 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır.

Yükseltme isteğinde bulunduğunuzda otomatik kötüye kullanım koruma sistemimiz ek kontroller gerçekleştirir. Belirtilen uygunluk ölçütlerini karşılamak genellikle onay için yeterli olsa da nadir durumlarda, inceleme süreci sırasında belirlenen diğer faktörlere bağlı olarak yükseltme isteği reddedilebilir.

Bu sistem, Gemini API platformunun tüm kullanıcılar için güvenliğini ve bütünlüğünü korumaya yardımcı olur.

Standart API hız sınırları

Aşağıdaki tabloda, tüm standart Gemini API çağrıları için hız sınırları listelenmiştir.

Ücretsiz Katman

Model BGBG TPM RPD
Metin çıkışı modelleri
Gemini 2.5 Pro 5 250.000 100
Gemini 2.5 Flash 10 250.000 250
Gemini 2.5 Flash-Lite 15 250.000 1.000
Gemini 2.0 Flash 15 1.000.000 200
Gemini 2.0 Flash-Lite 30 1.000.000 200
Live API
Gemini 2.5 Flash Live 3 oturum 1.000.000
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu 1 oturum 25.000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 oturum 10.000 5
Gemini 2.0 Flash Live 3 oturum 1.000.000
Çok formatlı üretken modeller
Gemini 2.5 Flash Önizleme TTS 3 10.000 15
Gemini 2.5 Pro Önizleme TTS
Gemini 2.0 Flash Önizleme Görüntü Üretimi 10 200.000 100
Imagen 3
Veo 2
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400
Gemini Embedding 100 30.000 1.000
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Kullanımdan kaldırıldı) 15 250.000 50
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) 15 250.000 50
Gemini 1.5 Pro (Kullanımdan kaldırıldı)

Katman 1

Model BGBG TPM RPD Toplu olarak sıraya alınan jetonlar
Metin çıkışı modelleri
Gemini 2.5 Pro 150 2.000.000 10.000 5.000.000
Gemini 2.5 Flash 1.000 1.000.000 10.000 3.000.000
Gemini 2.5 Flash-Lite 4.000 4.000.000 Sınır yok 10.000.000
Gemini 2.0 Flash 2.000 4.000.000 Sınır yok 10.000.000
Gemini 2.0 Flash-Lite 4.000 4.000.000 Sınır yok 10.000.000
Live API
Gemini 2.5 Flash Live 50 oturum 4.000.000
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu 3 oturum 50.000 50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 oturum 25.000 50
Gemini 2.0 Flash Live 50 oturum 4.000.000
Çok formatlı üretken modeller
Gemini 2.5 Flash Önizleme TTS 10 10.000 100
Gemini 2.5 Pro Önizleme TTS 10 10.000 50
Gemini 2.0 Flash Önizleme Görüntü Üretimi 1.000 1.000.000 10.000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400
Gemini Embedding 3.000 1.000.000
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Kullanımdan kaldırıldı) 2.000 4.000.000
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) 4.000 4.000.000
Gemini 1.5 Pro (Kullanımdan kaldırıldı) 1.000 4.000.000

Katman 2

Model BGBG TPM RPD Toplu olarak sıraya alınan jetonlar
Metin çıkışı modelleri
Gemini 2.5 Pro 1.000 5.000.000 50.000 500.000.000
Gemini 2.5 Flash 2.000 3.000.000 100.000 400.000.000
Gemini 2.5 Flash-Lite 10.000 10.000.000 Sınır yok 500.000.000
Gemini 2.0 Flash 10.000 10.000.000 Sınır yok 1.000.000.000
Gemini 2.0 Flash-Lite 20.000 10.000.000 Sınır yok 1.000.000.000
Live API
Gemini 2.5 Flash Live 1.000 oturum 10.000.000
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu 100 oturum 1.000.000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 oturum 25.000 50
Gemini 2.0 Flash Live 1.000 oturum 10.000.000
Çok formatlı üretken modeller
Gemini 2.5 Flash Önizleme TTS 1.000 100.000 10.000
Gemini 2.5 Pro Önizleme TTS 100 25.000 1.000
Gemini 2.0 Flash Önizleme Görüntü Üretimi 2.000 3.000.000 100.000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400
Gemini Embedding 5.000 5.000.000 -- --
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Kullanımdan kaldırıldı) 2.000 4.000.000
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) 4.000 4.000.000
Gemini 1.5 Pro (Kullanımdan kaldırıldı) 1.000 4.000.000

3. Katman

Model BGBG TPM RPD Toplu olarak sıraya alınan jetonlar
Metin çıkışı modelleri
Gemini 2.5 Pro 2.000 8.000.000 Sınır yok 1.000.000.000
Gemini 2.5 Flash 10.000 8.000.000 Sınır yok 1.000.000.000
Gemini 2.5 Flash-Lite 30.000 30.000.000 Sınır yok 1.000.000.000
Gemini 2.0 Flash 30.000 30.000.000 Sınır yok 5.000.000.000
Gemini 2.0 Flash-Lite 30.000 30.000.000 Sınır yok 5.000.000.000
Live API
Gemini 2.5 Flash Live 1.000 oturum 10.000.000
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu 100 oturum 1.000.000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 oturum 25.000 50
Gemini 2.0 Flash Live 1.000 oturum 10.000.000
Çok formatlı üretken modeller
Gemini 2.5 Flash Önizleme TTS 1.000 1.000.000
Gemini 2.5 Pro Önizleme TTS 100 1.000.000
Gemini 2.0 Flash Önizleme Görüntü Üretimi 5.000 5.000.000
Imagen 4 Standard 20 15.000
Imagen 4 Ultra 15 5.000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400
Gemini Embedding 10.000 10.000.000 -- --
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Kullanımdan kaldırıldı) 2.000 4.000.000
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) 4.000 4.000.000
Gemini 1.5 Pro (Kullanımdan kaldırıldı) 1.000 4.000.000

Belirtilen hız sınırları garanti edilmez ve gerçek kapasite farklılık gösterebilir.

Toplu mod hız sınırları

Toplu mod istekleri, toplu olmayan mod API çağrılarından ayrı olarak kendi hız sınırlarına tabidir.

  • Eşzamanlı toplu istek sayısı: 100
  • Giriş dosyasının boyutu sınırı: 2 GB
  • Dosya depolama alanı sınırı: 20 GB
  • Model başına sıraya alınan jetonlar: Sıkıştırma sınırı tablosundaki Toplu İşleme İçin Sıraya Alınan Jetonlar sütununda, belirli bir model için tüm etkin toplu işlerinizde toplu işleme için sıraya alınabilecek maksimum jeton sayısı listelenir. Standart API sıklık sınırları tablosunda görebilirsiniz.

Bir sonraki katmana nasıl geçilir?

Gemini API, tüm faturalandırma hizmetleri için Cloud Faturalandırma'yı kullanır. Ücretsiz katmandan ücretli katmana geçmek için önce Google Cloud projenizde Cloud Faturalandırma'yı etkinleştirmeniz gerekir.

Projeniz belirtilen ölçütleri karşıladığında bir sonraki katmana yükseltilmeye uygun hale gelir. Yükseltme isteğinde bulunmak için aşağıdaki adımları uygulayın:

Hızlı bir doğrulamanın ardından proje bir sonraki katmana yükseltilir.

Oran sınırı artışı isteğinde bulunma

Her model varyasyonunun ilişkili bir sıklık sınırı (dakikada istek sayısı, RPM) vardır. Bu sıklık sınırları hakkında ayrıntılı bilgi için Gemini modelleri başlıklı makaleyi inceleyin.

Ücretli katman için istek oranı sınırı artışı isteme

Hız sınırınızı artıracağımız konusunda garanti veremeyiz ancak isteğinizi incelemek için elimizden geleni yapacağız.