Hız sınırları, belirli bir zaman aralığında Gemini API'ye yapabileceğiniz istek sayısını düzenler. Bu sınırlar, adil kullanımı sürdürmeye, kötüye kullanıma karşı korumaya ve sistem performansını tüm kullanıcılar için korumaya yardımcı olur.
Hız sınırlarının işleyiş şekli
Hız sınırları genellikle üç boyutta ölçülür:
- Dakika başına istek sayısı (RPM)
- Dakikadaki jeton sayısı (giriş) (TPM)
- Günlük istek sayısı (RPD)
Kullanımınız her sınıra göre değerlendirilir ve herhangi bir sınırı aşmanız durumunda sıklık sınırı hatası tetiklenir. Örneğin, RPM sınırınız 20 ise TPM veya diğer sınırlarınızı aşmamış olsanız bile bir dakika içinde 21 istekte bulunmanız hataya neden olur.
Hız sınırları, API anahtarı başına değil proje başına uygulanır.
Günlük istek (RPD) kotaları, Pasifik saatine göre gece yarısında sıfırlanır.
Sınırlar, kullanılan modele göre değişir ve bazı sınırlar yalnızca belirli modeller için geçerlidir. Örneğin, dakikadaki resim sayısı (IPM) yalnızca resim oluşturabilen modeller (Imagen 3) için hesaplanır ancak kavramsal olarak TPM'ye benzer. Diğer modellerde günlük jeton sınırı (TPD) olabilir.
Deneysel ve önizleme modellerinde hız sınırları daha kısıtlıdır.
Kullanım katmanları
Hız sınırları, projenin kullanım katmanına bağlıdır. API kullanımınız ve harcamanız arttıkça daha yüksek hız sınırlarına sahip bir plana geçiş yapabilirsiniz.
2. ve 3. katmanların şartları, projenize bağlı faturalandırma hesabında Google Cloud hizmetlerine (Gemini API dahil ancak bununla sınırlı olmamak üzere) yapılan toplam harcamaya göre belirlenir.
Katman | Nitelikler |
---|---|
Ücretsiz | Uygun ülkelerdeki kullanıcılar |
Katman 1 | Projeye bağlı faturalandırma hesabı |
Katman 2 | Toplam harcama: > 250 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır. |
3. Katman | Toplam harcama: > 1.000 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır. |
Yükseltme isteğinde bulunduğunuzda otomatik kötüye kullanım koruma sistemimiz ek kontroller gerçekleştirir. Belirtilen uygunluk ölçütlerini karşılamak genellikle onay için yeterli olsa da nadir durumlarda, inceleme süreci sırasında belirlenen diğer faktörlere bağlı olarak yükseltme isteği reddedilebilir.
Bu sistem, Gemini API platformunun tüm kullanıcılar için güvenliğini ve bütünlüğünü korumaya yardımcı olur.
Standart API hız sınırları
Aşağıdaki tabloda, tüm standart Gemini API çağrıları için hız sınırları listelenmiştir.
Ücretsiz Katman
Model | BGBG | TPM | RPD |
---|---|---|---|
Metin çıkışı modelleri | |||
Gemini 2.5 Pro | 5 | 250.000 | 100 |
Gemini 2.5 Flash | 10 | 250.000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250.000 | 1.000 |
Gemini 2.0 Flash | 15 | 1.000.000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1.000.000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 oturum | 1.000.000 | |
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu | 1 oturum | 25.000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 oturum | 10.000 | 5 |
Gemini 2.0 Flash Live | 3 oturum | 1.000.000 | |
Çok formatlı üretken modeller | |||
Gemini 2.5 Flash Önizleme TTS | 3 | 10.000 | 15 |
Gemini 2.5 Pro Önizleme TTS | |||
Gemini 2.0 Flash Önizleme Görüntü Üretimi | 10 | 200.000 | 100 |
Imagen 3 | |||
Veo 2 | |||
Diğer modeller | |||
Gemma 3 ve 3n | 30 | 15.000 | 14.400 |
Gemini Embedding | 100 | 30.000 | 1.000 |
Kullanımdan kaldırılan modeller | |||
Gemini 1.5 Flash (Kullanımdan kaldırıldı) | 15 | 250.000 | 50 |
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) | 15 | 250.000 | 50 |
Gemini 1.5 Pro (Kullanımdan kaldırıldı) |
Katman 1
Model | BGBG | TPM | RPD | Toplu olarak sıraya alınan jetonlar |
---|---|---|---|---|
Metin çıkışı modelleri | ||||
Gemini 2.5 Pro | 150 | 2.000.000 | 10.000 | 5.000.000 |
Gemini 2.5 Flash | 1.000 | 1.000.000 | 10.000 | 3.000.000 |
Gemini 2.5 Flash-Lite | 4.000 | 4.000.000 | Sınır yok | 10.000.000 |
Gemini 2.0 Flash | 2.000 | 4.000.000 | Sınır yok | 10.000.000 |
Gemini 2.0 Flash-Lite | 4.000 | 4.000.000 | Sınır yok | 10.000.000 |
Live API | ||||
Gemini 2.5 Flash Live | 50 oturum | 4.000.000 | ||
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu | 3 oturum | 50.000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 oturum | 25.000 | 50 | |
Gemini 2.0 Flash Live | 50 oturum | 4.000.000 | ||
Çok formatlı üretken modeller | ||||
Gemini 2.5 Flash Önizleme TTS | 10 | 10.000 | 100 | |
Gemini 2.5 Pro Önizleme TTS | 10 | 10.000 | 50 | |
Gemini 2.0 Flash Önizleme Görüntü Üretimi | 1.000 | 1.000.000 | 10.000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
Diğer modeller | ||||
Gemma 3 ve 3n | 30 | 15.000 | 14.400 | |
Gemini Embedding | 3.000 | 1.000.000 | ||
Kullanımdan kaldırılan modeller | ||||
Gemini 1.5 Flash (Kullanımdan kaldırıldı) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (Kullanımdan kaldırıldı) | 1.000 | 4.000.000 |
Katman 2
Model | BGBG | TPM | RPD | Toplu olarak sıraya alınan jetonlar |
---|---|---|---|---|
Metin çıkışı modelleri | ||||
Gemini 2.5 Pro | 1.000 | 5.000.000 | 50.000 | 500.000.000 |
Gemini 2.5 Flash | 2.000 | 3.000.000 | 100.000 | 400.000.000 |
Gemini 2.5 Flash-Lite | 10.000 | 10.000.000 | Sınır yok | 500.000.000 |
Gemini 2.0 Flash | 10.000 | 10.000.000 | Sınır yok | 1.000.000.000 |
Gemini 2.0 Flash-Lite | 20.000 | 10.000.000 | Sınır yok | 1.000.000.000 |
Live API | ||||
Gemini 2.5 Flash Live | 1.000 oturum | 10.000.000 | ||
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu | 100 oturum | 1.000.000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 oturum | 25.000 | 50 | |
Gemini 2.0 Flash Live | 1.000 oturum | 10.000.000 | ||
Çok formatlı üretken modeller | ||||
Gemini 2.5 Flash Önizleme TTS | 1.000 | 100.000 | 10.000 | |
Gemini 2.5 Pro Önizleme TTS | 100 | 25.000 | 1.000 | |
Gemini 2.0 Flash Önizleme Görüntü Üretimi | 2.000 | 3.000.000 | 100.000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
Diğer modeller | ||||
Gemma 3 ve 3n | 30 | 15.000 | 14.400 | |
Gemini Embedding | 5.000 | 5.000.000 | -- | -- |
Kullanımdan kaldırılan modeller | ||||
Gemini 1.5 Flash (Kullanımdan kaldırıldı) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (Kullanımdan kaldırıldı) | 1.000 | 4.000.000 |
3. Katman
Model | BGBG | TPM | RPD | Toplu olarak sıraya alınan jetonlar |
---|---|---|---|---|
Metin çıkışı modelleri | ||||
Gemini 2.5 Pro | 2.000 | 8.000.000 | Sınır yok | 1.000.000.000 |
Gemini 2.5 Flash | 10.000 | 8.000.000 | Sınır yok | 1.000.000.000 |
Gemini 2.5 Flash-Lite | 30.000 | 30.000.000 | Sınır yok | 1.000.000.000 |
Gemini 2.0 Flash | 30.000 | 30.000.000 | Sınır yok | 5.000.000.000 |
Gemini 2.0 Flash-Lite | 30.000 | 30.000.000 | Sınır yok | 5.000.000.000 |
Live API | ||||
Gemini 2.5 Flash Live | 1.000 oturum | 10.000.000 | ||
Gemini 2.5 Flash Önizlemesi Yerel Ses İletişim Kutusu | 100 oturum | 1.000.000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 oturum | 25.000 | 50 | |
Gemini 2.0 Flash Live | 1.000 oturum | 10.000.000 | ||
Çok formatlı üretken modeller | ||||
Gemini 2.5 Flash Önizleme TTS | 1.000 | 1.000.000 | ||
Gemini 2.5 Pro Önizleme TTS | 100 | 1.000.000 | ||
Gemini 2.0 Flash Önizleme Görüntü Üretimi | 5.000 | 5.000.000 | ||
Imagen 4 Standard | 20 | 15.000 | ||
Imagen 4 Ultra | 15 | 5.000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
Diğer modeller | ||||
Gemma 3 ve 3n | 30 | 15.000 | 14.400 | |
Gemini Embedding | 10.000 | 10.000.000 | -- | -- |
Kullanımdan kaldırılan modeller | ||||
Gemini 1.5 Flash (Kullanımdan kaldırıldı) | 2.000 | 4.000.000 | ||
Gemini 1.5 Flash-8B (Kullanımdan kaldırıldı) | 4.000 | 4.000.000 | ||
Gemini 1.5 Pro (Kullanımdan kaldırıldı) | 1.000 | 4.000.000 |
Belirtilen hız sınırları garanti edilmez ve gerçek kapasite farklılık gösterebilir.
Toplu mod hız sınırları
Toplu mod istekleri, toplu olmayan mod API çağrılarından ayrı olarak kendi hız sınırlarına tabidir.
- Eşzamanlı toplu istek sayısı: 100
- Giriş dosyasının boyutu sınırı: 2 GB
- Dosya depolama alanı sınırı: 20 GB
- Model başına sıraya alınan jetonlar: Sıkıştırma sınırı tablosundaki Toplu İşleme İçin Sıraya Alınan Jetonlar sütununda, belirli bir model için tüm etkin toplu işlerinizde toplu işleme için sıraya alınabilecek maksimum jeton sayısı listelenir. Standart API sıklık sınırları tablosunda görebilirsiniz.
Bir sonraki katmana nasıl geçilir?
Gemini API, tüm faturalandırma hizmetleri için Cloud Faturalandırma'yı kullanır. Ücretsiz katmandan ücretli katmana geçmek için önce Google Cloud projenizde Cloud Faturalandırma'yı etkinleştirmeniz gerekir.
Projeniz belirtilen ölçütleri karşıladığında bir sonraki katmana yükseltilmeye uygun hale gelir. Yükseltme isteğinde bulunmak için aşağıdaki adımları uygulayın:
- AI Studio'da API anahtarları sayfasına gidin.
- Yükseltmek istediğiniz projeyi bulup "Yükselt"i tıklayın. "Yükselt" seçeneği yalnızca bir sonraki katmanın şartlarını karşılayan projelerde gösterilir.
Hızlı bir doğrulamanın ardından proje bir sonraki katmana yükseltilir.
Oran sınırı artışı isteğinde bulunma
Her model varyasyonunun ilişkili bir sıklık sınırı (dakikada istek sayısı, RPM) vardır. Bu sıklık sınırları hakkında ayrıntılı bilgi için Gemini modelleri başlıklı makaleyi inceleyin.
Ücretli katman için istek oranı sınırı artışı isteme
Hız sınırınızı artıracağımız konusunda garanti veremeyiz ancak isteğinizi incelemek için elimizden geleni yapacağız.