محدودیت های نرخ

محدودیت‌های نرخ تعداد درخواست‌هایی را که می‌توانید در یک بازه زمانی معین به Gemini API ارسال کنید، تنظیم می‌کند. این محدودیت ها به حفظ استفاده منصفانه، محافظت در برابر سوء استفاده و کمک به حفظ عملکرد سیستم برای همه کاربران کمک می کند.

محدودیت نرخ چگونه کار می کند

محدودیت‌های نرخ معمولاً در سه بعد اندازه‌گیری می‌شوند:

  • درخواست در دقیقه ( RPM )
  • توکن ها در دقیقه (ورودی) ( TPM )
  • درخواست در روز ( RPD )

استفاده شما در برابر هر محدودیت ارزیابی می شود و تجاوز از هر یک از آنها باعث خطای محدودیت نرخ می شود. به عنوان مثال، اگر محدودیت RPM شما 20 باشد، انجام 21 درخواست در یک دقیقه منجر به خطا می شود، حتی اگر از TPM یا محدودیت های دیگر تجاوز نکرده باشید.

محدودیت‌های نرخ برای هر پروژه اعمال می‌شوند، نه برای کلید API.

سهمیه‌های درخواست‌های روزانه ( RPD ) در نیمه‌شب به وقت اقیانوس آرام بازنشانی می‌شوند.

محدودیت ها بسته به مدل خاصی که استفاده می شود متفاوت است و برخی محدودیت ها فقط برای مدل های خاص اعمال می شود. به عنوان مثال، تصاویر در دقیقه یا IPM، فقط برای مدل هایی که قادر به تولید تصاویر هستند (Imagen 3) محاسبه می شود، اما از نظر مفهومی مشابه TPM است. مدل‌های دیگر ممکن است محدودیت روزانه (TPD) داشته باشند.

محدودیت‌های نرخ برای مدل‌های آزمایشی و پیش‌نمایش محدودتر است.

سطوح استفاده

محدودیت های نرخ به سطح استفاده پروژه گره خورده است. همانطور که استفاده و هزینه API شما افزایش می یابد، گزینه ای برای ارتقا به سطح بالاتر با محدودیت نرخ افزایش یافته خواهید داشت.

شرایط برای سطوح 2 و 3 بر اساس کل هزینه‌های انباشته در سرویس‌های Google Cloud (شامل، اما نه محدود به، Gemini API) برای حساب صورت‌حساب مرتبط با پروژه شما است.

ردیف صلاحیت ها
رایگان کاربران در کشورهای واجد شرایط
ردیف 1 حساب صورت‌حساب مرتبط با پروژه
ردیف 2 کل هزینه: > 250 دلار و حداقل 30 روز از پرداخت موفقیت آمیز
ردیف 3 کل هزینه: > 1000 دلار و حداقل 30 روز از پرداخت موفقیت آمیز

هنگامی که درخواست ارتقا می دهید، سیستم خودکار حفاظت از سوء استفاده ما بررسی های بیشتری را انجام می دهد. در حالی که رعایت معیارهای صلاحیت اعلام شده به طور کلی برای تأیید کافی است، در موارد نادر ممکن است درخواست ارتقاء بر اساس سایر عوامل شناسایی شده در طول فرآیند بررسی رد شود.

این سیستم به حفظ امنیت و یکپارچگی پلتفرم Gemini API برای همه کاربران کمک می کند.

محدودیت نرخ استاندارد API

جدول زیر محدودیت‌های نرخ برای همه تماس‌های استاندارد Gemini API را فهرست می‌کند.

ردیف رایگان

مدل دور در دقیقه TPM RPD
مدل های خروجی متن
جمینی 2.5 پرو 5 250000 100
فلش جمینی 2.5 10 250000 250
Gemini 2.5 Flash-Lite 15 250000 1000
فلش جمینی 2.0 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 جلسه 1,000,000
Gemini 2.5 Flash Preview Native Audio Dialog 1 جلسه 25000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 جلسه 10000 5
Gemini 2.0 Flash Live 3 جلسه 1,000,000
مدل های نسل چند وجهی
Gemini 2.5 Flash Preview TTS 3 10000 15
Gemini 2.5 Pro Preview TTS
Gemini 2.0 Flash Preview Generation Image 10 200000 100
تصویر 3
Veo 2
مدل های دیگر
جما 3 و 3n 30 15000 14400
جاسازی جوزا 100 30000 1000
مدل های منسوخ شده
فلش Gemini 1.5 (منسوخ شده) 15 250000 50
Gemini 1.5 Flash-8B (منسوخ شده) 15 250000 50
Gemini 1.5 Pro (منسوخ شده)

ردیف 1

مدل دور در دقیقه TPM RPD دسته ای توکن در صف
مدل های خروجی متن
جمینی 2.5 پرو 150 2,000,000 10000 5,000,000
فلش جمینی 2.5 1000 1,000,000 10000 3,000,000
Gemini 2.5 Flash-Lite 4000 4,000,000 بدون محدودیت 10,000,000
فلش جمینی 2.0 2000 4,000,000 بدون محدودیت 10,000,000
Gemini 2.0 Flash-Lite 4000 4,000,000 بدون محدودیت 10,000,000
Live API
Gemini 2.5 Flash Live 50 جلسه 4,000,000
Gemini 2.5 Flash Preview Native Audio Dialog 3 جلسه 50000 50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 جلسه 25000 50
Gemini 2.0 Flash Live 50 جلسه 4,000,000
مدل های نسل چند وجهی
Gemini 2.5 Flash Preview TTS 10 10000 100
Gemini 2.5 Pro Preview TTS 10 10000 50
Gemini 2.0 Flash Preview Generation Image 1000 1,000,000 10000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
تصویر 3 20
Veo 3 2 10
Veo 2 2 50
مدل های دیگر
جما 3 و 3n 30 15000 14400
جاسازی جوزا 3000 1,000,000
مدل های منسوخ شده
فلش Gemini 1.5 (منسوخ شده) 2000 4,000,000
Gemini 1.5 Flash-8B (منسوخ شده) 4000 4,000,000
Gemini 1.5 Pro (منسوخ شده) 1000 4,000,000

ردیف 2

مدل دور در دقیقه TPM RPD دسته ای توکن در صف
مدل های خروجی متن
جمینی 2.5 پرو 1000 5,000,000 50000 500,000,000
فلش جمینی 2.5 2000 3,000,000 100000 400,000,000
Gemini 2.5 Flash-Lite 10000 10,000,000 بدون محدودیت 500,000,000
فلش جمینی 2.0 10000 10,000,000 بدون محدودیت 1,000,000,000
Gemini 2.0 Flash-Lite 20000 10,000,000 بدون محدودیت 1,000,000,000
Live API
Gemini 2.5 Flash Live 1000 جلسه 10,000,000
Gemini 2.5 Flash Preview Native Audio Dialog 100 جلسه 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 جلسه 25000 50
Gemini 2.0 Flash Live 1000 جلسه 10,000,000
مدل های نسل چند وجهی
Gemini 2.5 Flash Preview TTS 1000 100000 10000
Gemini 2.5 Pro Preview TTS 100 25000 1000
Gemini 2.0 Flash Preview Generation Image 2000 3,000,000 100000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
تصویر 3 20
Veo 3 4 50
Veo 2 2 50
مدل های دیگر
جما 3 و 3n 30 15000 14400
جاسازی جوزا 5000 5,000,000 -- --
مدل های منسوخ شده
فلش Gemini 1.5 (منسوخ شده) 2000 4,000,000
Gemini 1.5 Flash-8B (منسوخ شده) 4000 4,000,000
Gemini 1.5 Pro (منسوخ شده) 1000 4,000,000

ردیف 3

مدل دور در دقیقه TPM RPD دسته ای توکن در صف
مدل های خروجی متن
جمینی 2.5 پرو 2000 8,000,000 بدون محدودیت 1,000,000,000
فلش جمینی 2.5 10000 8,000,000 بدون محدودیت 1,000,000,000
Gemini 2.5 Flash-Lite 30000 30,000,000 بدون محدودیت 1,000,000,000
فلش جمینی 2.0 30000 30,000,000 بدون محدودیت 5,000,000,000
Gemini 2.0 Flash-Lite 30000 30,000,000 بدون محدودیت 5,000,000,000
Live API
Gemini 2.5 Flash Live 1000 جلسه 10,000,000
Gemini 2.5 Flash Preview Native Audio Dialog 100 جلسه 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 جلسه 25000 50
Gemini 2.0 Flash Live 1000 جلسه 10,000,000
مدل های نسل چند وجهی
Gemini 2.5 Flash Preview TTS 1000 1,000,000
Gemini 2.5 Pro Preview TTS 100 1,000,000
Gemini 2.0 Flash Preview Generation Image 5000 5,000,000
Imagen 4 Standard 20 15000
Imagen 4 Ultra 15 5000
تصویر 3 20
Veo 3 10 500
Veo 2 2 50
مدل های دیگر
جما 3 و 3n 30 15000 14400
جاسازی جوزا 10000 10,000,000 -- --
مدل های منسوخ شده
فلش Gemini 1.5 (منسوخ شده) 2000 4,000,000
Gemini 1.5 Flash-8B (منسوخ شده) 4000 4,000,000
Gemini 1.5 Pro (منسوخ شده) 1000 4,000,000

محدودیت نرخ مشخص شده تضمین نمی شود و ظرفیت واقعی ممکن است متفاوت باشد.

محدودیت‌های نرخ حالت دسته‌ای

درخواست‌های حالت دسته‌ای تابع محدودیت‌های نرخ خودشان هستند، جدا از تماس‌های API حالت غیر دسته‌ای.

  • درخواست دسته ای همزمان: 100
  • محدودیت حجم فایل ورودی: 2 گیگابایت
  • محدودیت ذخیره سازی فایل: 20 گیگابایت
  • نشانه‌های در صف در هر مدل: ستون Batch Enqueued Tokens در جدول محدودیت‌های نرخ، حداکثر تعداد نشانه‌هایی را که می‌توان برای پردازش دسته‌ای در تمام کارهای دسته‌ای فعال شما برای یک مدل معین در صف قرار داد، فهرست می‌کند. در جدول استاندارد محدودیت نرخ API را ببینید.

نحوه ارتقاء به سطح بعدی

Gemini API از Cloud Billing برای همه خدمات صورت‌حساب استفاده می‌کند. برای انتقال از سطح رایگان به یک ردیف پولی، ابتدا باید Cloud Billing را برای پروژه Google Cloud خود فعال کنید.

هنگامی که پروژه شما معیارهای مشخص شده را برآورده می کند، واجد شرایط ارتقاء به سطح بعدی می شود. برای درخواست ارتقا، مراحل زیر را دنبال کنید:

  • به صفحه کلیدهای API در AI Studio بروید.
  • پروژه ای را که می خواهید ارتقا دهید پیدا کنید و روی "Upgrade" کلیک کنید. گزینه "ارتقا" فقط برای پروژه هایی نشان داده می شود که واجد شرایط سطح بعدی باشند.

پس از یک اعتبارسنجی سریع، پروژه به سطح بعدی ارتقا می یابد.

درخواست افزایش محدودیت نرخ

هر تغییر مدل دارای یک محدودیت نرخ مرتبط است (درخواست در دقیقه، RPM). برای جزئیات در مورد این محدودیت‌های نرخ، مدل‌های Gemini را ببینید.

درخواست افزایش سقف نرخ ردیف پرداختی

ما هیچ تضمینی در مورد افزایش محدودیت نرخ شما ارائه نمی دهیم، اما تمام تلاش خود را می کنیم تا درخواست شما را بررسی کنیم.