अनुरोधों की संख्या की सीमाएं, यह तय करती हैं कि किसी तय समयसीमा में Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.
दर से जुड़ी सीमाएं कैसे काम करती हैं
आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मेज़र किया जाता है:
- अनुरोध प्रति मिनट (आरपीएम)
- हर मिनट में प्रोसेस किए जाने वाले टोकन (इनपुट) (टीपीएम)
- हर दिन मिलने वाले अनुरोध (RPD)
आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.
अनुरोध की दर से जुड़ी सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई पासकोड पर.
हर दिन के अनुरोध (आरपीडी) के कोटे, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होते हैं.
इस्तेमाल किए जा रहे मॉडल के हिसाब से सीमाएं अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज प्रति मिनट (आईपीएम) को सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए कैलकुलेट किया जाता है. हालांकि, यह टीपीएम के जैसा ही होता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.
एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.
इस्तेमाल के टियर
दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपके पास ज़्यादा दर की सीमाओं के साथ, सदस्यता के ऊंचे लेवल पर अपग्रेड करने का विकल्प होगा.
दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया जाता है.
टियर | क्वालिफ़िकेशन |
---|---|
मुफ़्त | ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता |
टियर 1 | बिलिंग खाता प्रोजेक्ट से लिंक किया गया है |
टियर 2 | कुल खर्च: 250 डॉलर से ज़्यादा और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों |
टियर 3 | कुल खर्च: > 1,000 डॉलर और पेमेंट को 30 दिन से ज़्यादा हो गए हों |
अपग्रेड का अनुरोध करने पर, बुरे बर्ताव से बचाने वाला हमारा ऑटोमेटेड सिस्टम, अतिरिक्त जांच करता है. आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.
यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.
स्टैंडर्ड एपीआई के लिए अनुरोधों की दर की सीमाएं
यहां दी गई टेबल में, Gemini API के सभी स्टैंडर्ड कॉल के लिए दर की सीमाएं दी गई हैं.
फ़्री टियर
मॉडल | आरपीएम | टीपीएम | RPD |
---|---|---|---|
टेक्स्ट-आउट मॉडल | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 सत्र | 1,000,000 | |
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 1 सत्र | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 सत्र | 1,000,000 | |
मल्टी-मॉडल जनरेशन मॉडल | |||
Gemini 2.5 Flash Preview TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro Preview TTS | |||
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 10 | 2,00,000 | 100 |
Imagen 3 | |||
Veo 2 | |||
अन्य मॉडल | |||
Gemma 3 और 3n | 30 | 15,000 | 14,400 |
Gemini Embedding | 100 | 30,000 | 1,000 |
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल | |||
Gemini 1.5 Flash (अब उपलब्ध नहीं है) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) |
टियर 1
मॉडल | आरपीएम | टीपीएम | RPD | बैच में शामिल किए गए टोकन |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 30,00,000 |
Gemini 2.5 Flash-Lite | 4,000 | 40,00,000 | कोई सीमा नहीं | 10,000,000 |
Gemini 2.0 Flash | 2,000 | 40,00,000 | कोई सीमा नहीं | 10,000,000 |
Gemini 2.0 Flash-Lite | 4,000 | 40,00,000 | कोई सीमा नहीं | 10,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 50 सेशन | 40,00,000 | ||
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 3 सत्र | 50,000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 सेशन | 40,00,000 | ||
मल्टी-मॉडल जनरेशन मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 10 | 10,000 | 100 | |
Gemini 2.5 Pro Preview TTS | 10 | 10,000 | 50 | |
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 1,000 | 1,000,000 | 10,000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 3,000 | 1,000,000 | ||
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल | ||||
Gemini 1.5 Flash (अब उपलब्ध नहीं है) | 2,000 | 40,00,000 | ||
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 4,000 | 40,00,000 | ||
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) | 1,000 | 40,00,000 |
टियर 2
मॉडल | आरपीएम | टीपीएम | RPD | बैच में शामिल किए गए टोकन |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 30,00,000 | 1,00,000 | 400,000,000 |
Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | कोई सीमा नहीं | 500,000,000 |
Gemini 2.0 Flash | 10,000 | 10,000,000 | कोई सीमा नहीं | 1,000,000,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | कोई सीमा नहीं | 1,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 सत्र | 10,000,000 | ||
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 100 सेशन | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 सत्र | 10,000,000 | ||
मल्टी-मॉडल जनरेशन मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 1,00,000 | 10,000 | |
Gemini 2.5 Pro Preview TTS | 100 | 25,000 | 1,000 | |
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 2,000 | 30,00,000 | 1,00,000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 5,000 | 5,000,000 | -- | -- |
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल | ||||
Gemini 1.5 Flash (अब उपलब्ध नहीं है) | 2,000 | 40,00,000 | ||
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 4,000 | 40,00,000 | ||
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) | 1,000 | 40,00,000 |
टियर 3
मॉडल | आरपीएम | टीपीएम | RPD | बैच में शामिल किए गए टोकन |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | कोई सीमा नहीं | 1,000,000,000 |
Gemini 2.5 Flash | 10,000 | 8,000,000 | कोई सीमा नहीं | 1,000,000,000 |
Gemini 2.5 Flash-Lite | 30,000 | 3,00,00,000 | कोई सीमा नहीं | 1,000,000,000 |
Gemini 2.0 Flash | 30,000 | 3,00,00,000 | कोई सीमा नहीं | 5,000,000,000 |
Gemini 2.0 Flash-Lite | 30,000 | 3,00,00,000 | कोई सीमा नहीं | 5,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 सत्र | 10,000,000 | ||
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 100 सेशन | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 सत्र | 10,000,000 | ||
मल्टी-मॉडल जनरेशन मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 1,000,000 | ||
Gemini 2.5 Pro Preview TTS | 100 | 1,000,000 | ||
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 5,000 | 5,000,000 | ||
Imagen 4 Standard | 20 | 15,000 | ||
Imagen 4 Ultra | 15 | 5,000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 10,000 | 10,000,000 | -- | -- |
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल | ||||
Gemini 1.5 Flash (अब उपलब्ध नहीं है) | 2,000 | 40,00,000 | ||
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 4,000 | 40,00,000 | ||
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) | 1,000 | 40,00,000 |
तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.
बैच मोड के लिए रेट लिमिट
बैच मोड के अनुरोधों पर, दर से जुड़ी अपनी सीमाएं लागू होती हैं. ये सीमाएं, नॉन-बैच मोड वाले एपीआई कॉल से अलग होती हैं.
- एक साथ किए गए बैच अनुरोध: 100
- इनपुट फ़ाइल का साइज़: 2 जीबी
- फ़ाइल स्टोरेज की सीमा: 20 जीबी
- हर मॉडल के लिए, लाइन में लगे टोकन: दर की सीमाओं वाली टेबल के बैच में लाइन में लगे टोकन कॉलम में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है. एपीआई के लिए अनुरोध करने की स्टैंडर्ड सीमाओं वाली टेबल में देखें.
अगले टियर पर अपग्रेड करने का तरीका
Gemini API, बिलिंग से जुड़ी सभी सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टियर से पैसे चुकाकर लिए जाने वाले टियर पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.
जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेता है, तब उसे अगले टियर में अपग्रेड किया जा सकता है. अपग्रेड करने का अनुरोध करने के लिए, यह तरीका अपनाएं:
- AI Studio में एपीआई पासकोड पेज पर जाएं.
- वह प्रोजेक्ट ढूंढें जिसे अपग्रेड करना है. इसके बाद, "अपग्रेड करें" पर क्लिक करें. "अपग्रेड करें" विकल्प सिर्फ़ उन प्रोजेक्ट के लिए दिखेगा जो अगले टियर की ज़रूरी शर्तें पूरी करते हैं.
पुष्टि हो जाने के बाद, प्रोजेक्ट को अगले टियर में अपग्रेड कर दिया जाएगा.
अनुरोधों की संख्या बढ़ाने का अनुरोध करना
हर मॉडल वेरिएशन के लिए, अनुरोधों की दर (हर मिनट में किए जाने वाले अनुरोध, आरपीएम) तय की जाती है. इन सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.
पैसे चुकाकर लिए जाने वाले टियर के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना
हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.