दर की सीमाएं

अनुरोधों की संख्या की सीमाएं, यह तय करती हैं कि किसी तय समयसीमा में Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.

दर से जुड़ी सीमाएं कैसे काम करती हैं

आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मेज़र किया जाता है:

  • अनुरोध प्रति मिनट (आरपीएम)
  • हर मिनट में प्रोसेस किए जाने वाले टोकन (इनपुट) (टीपीएम)
  • हर दिन मिलने वाले अनुरोध (RPD)

आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.

अनुरोध की दर से जुड़ी सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई पासकोड पर.

हर दिन के अनुरोध (आरपीडी) के कोटे, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होते हैं.

इस्तेमाल किए जा रहे मॉडल के हिसाब से सीमाएं अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज प्रति मिनट (आईपीएम) को सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए कैलकुलेट किया जाता है. हालांकि, यह टीपीएम के जैसा ही होता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.

एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.

इस्तेमाल के टियर

दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपके पास ज़्यादा दर की सीमाओं के साथ, सदस्यता के ऊंचे लेवल पर अपग्रेड करने का विकल्प होगा.

दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया जाता है.

टियर क्वालिफ़िकेशन
मुफ़्त ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता
टियर 1 बिलिंग खाता प्रोजेक्ट से लिंक किया गया है
टियर 2 कुल खर्च: 250 डॉलर से ज़्यादा और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों
टियर 3 कुल खर्च: > 1,000 डॉलर और पेमेंट को 30 दिन से ज़्यादा हो गए हों

अपग्रेड का अनुरोध करने पर, बुरे बर्ताव से बचाने वाला हमारा ऑटोमेटेड सिस्टम, अतिरिक्त जांच करता है. आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.

यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.

स्टैंडर्ड एपीआई के लिए अनुरोधों की दर की सीमाएं

यहां दी गई टेबल में, Gemini API के सभी स्टैंडर्ड कॉल के लिए दर की सीमाएं दी गई हैं.

फ़्री टियर

मॉडल आरपीएम टीपीएम RPD
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 सत्र 1,000,000
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 1 सत्र 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 10,000 5
Gemini 2.0 Flash Live 3 सत्र 1,000,000
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 3 10,000 15
Gemini 2.5 Pro Preview TTS
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 10 2,00,000 100
Imagen 3
Veo 2
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 15 250,000 50
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 15 250,000 50
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता)

टियर 1

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 30,00,000
Gemini 2.5 Flash-Lite 4,000 40,00,000 कोई सीमा नहीं 10,000,000
Gemini 2.0 Flash 2,000 40,00,000 कोई सीमा नहीं 10,000,000
Gemini 2.0 Flash-Lite 4,000 40,00,000 कोई सीमा नहीं 10,000,000
Live API
Gemini 2.5 Flash Live 50 सेशन 40,00,000
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 3 सत्र 50,000 50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50
Gemini 2.0 Flash Live 50 सेशन 40,00,000
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 10 10,000 100
Gemini 2.5 Pro Preview TTS 10 10,000 50
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 1,000 1,000,000 10,000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400
Gemini Embedding 3,000 1,000,000
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 2,000 40,00,000
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) 1,000 40,00,000

टियर 2

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 30,00,000 1,00,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 कोई सीमा नहीं 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 कोई सीमा नहीं 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 कोई सीमा नहीं 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 100 सेशन 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,00,000 10,000
Gemini 2.5 Pro Preview TTS 100 25,000 1,000
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 2,000 30,00,000 1,00,000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400
Gemini Embedding 5,000 5,000,000 -- --
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 2,000 40,00,000
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) 1,000 40,00,000

टियर 3

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 2,000 8,000,000 कोई सीमा नहीं 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 कोई सीमा नहीं 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 3,00,00,000 कोई सीमा नहीं 1,000,000,000
Gemini 2.0 Flash 30,000 3,00,00,000 कोई सीमा नहीं 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 3,00,00,000 कोई सीमा नहीं 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 100 सेशन 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,000,000
Gemini 2.5 Pro Preview TTS 100 1,000,000
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 5,000 5,000,000
Imagen 4 Standard 20 15,000
Imagen 4 Ultra 15 5,000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400
Gemini Embedding 10,000 10,000,000 -- --
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 2,000 40,00,000
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) 1,000 40,00,000

तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.

बैच मोड के लिए रेट लिमिट

बैच मोड के अनुरोधों पर, दर से जुड़ी अपनी सीमाएं लागू होती हैं. ये सीमाएं, नॉन-बैच मोड वाले एपीआई कॉल से अलग होती हैं.

  • एक साथ किए गए बैच अनुरोध: 100
  • इनपुट फ़ाइल का साइज़: 2 जीबी
  • फ़ाइल स्टोरेज की सीमा: 20 जीबी
  • हर मॉडल के लिए, लाइन में लगे टोकन: दर की सीमाओं वाली टेबल के बैच में लाइन में लगे टोकन कॉलम में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है. एपीआई के लिए अनुरोध करने की स्टैंडर्ड सीमाओं वाली टेबल में देखें.

अगले टियर पर अपग्रेड करने का तरीका

Gemini API, बिलिंग से जुड़ी सभी सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टियर से पैसे चुकाकर लिए जाने वाले टियर पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.

जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेता है, तब उसे अगले टियर में अपग्रेड किया जा सकता है. अपग्रेड करने का अनुरोध करने के लिए, यह तरीका अपनाएं:

पुष्टि हो जाने के बाद, प्रोजेक्ट को अगले टियर में अपग्रेड कर दिया जाएगा.

अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हर मॉडल वेरिएशन के लिए, अनुरोधों की दर (हर मिनट में किए जाने वाले अनुरोध, आरपीएम) तय की जाती है. इन सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.

पैसे चुकाकर लिए जाने वाले टियर के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.