การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
วิธีการทำงานของขีดจำกัดอัตรา
โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้
- คำขอต่อนาที (RPM)
- โทเค็นต่อนาที (อินพุต) (TPM)
- คำขอต่อวัน (RPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจํากัดแต่ละรายการ และการใช้งานเกินขีดจํากัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API
โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปขึ้นอยู่กับโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลที่เฉพาะเจาะจงเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า
ระดับการใช้งาน
โควต้าจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น
การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ
ระดับ | คุณสมบัติ |
---|---|
ฟรี | ผู้ใช้ในประเทศที่มีสิทธิ์ |
ระดับ 1 | บัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ |
ระดับ 2 | การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ |
ระดับ 3 | การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ |
เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตรา API มาตรฐาน
ตารางต่อไปนี้แสดงขีดจํากัดอัตราสําหรับการเรียก Gemini API มาตรฐานทั้งหมด
รุ่นฟรี
รุ่น | RPM | TPM | RPD |
---|---|---|---|
โมเดลที่แสดงผลเป็นข้อความ | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 เซสชัน | 1,000,000 | |
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1 ครั้ง | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 ครั้ง | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 เซสชัน | 1,000,000 | |
โมเดลการสร้างแบบหลายโมดัล | |||
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 3 | 10,000 | 15 |
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) | |||
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 10 | 200,000 | 100 |
Imagen 3 | |||
Veo 2 | |||
รุ่นอื่นๆ | |||
Gemma 3 และ 3n | 30 | 15,000 | 14,400 |
การฝัง Gemini | 100 | 30,000 | 1,000 |
โมเดลที่เลิกใช้งาน | |||
Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (เลิกใช้งานแล้ว) |
ระดับ 1
รุ่น | RPM | TPM | RPD | โทเค็นที่จัดคิวแบบกลุ่ม |
---|---|---|---|---|
โมเดลที่แสดงผลเป็นข้อความ | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | ไม่จำกัด | 10,000,000 |
Gemini 2.0 Flash | 2,000 | 4,000,000 | ไม่จำกัด | 10,000,000 |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | ไม่จำกัด | 10,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 50 เซสชัน | 4,000,000 | ||
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 3 เซสชัน | 50,000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 ครั้ง | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 เซสชัน | 4,000,000 | ||
โมเดลการสร้างแบบหลายโมดัล | ||||
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 10 | 10,000 | 100 | |
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) | 10 | 10,000 | 50 | |
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 1,000 | 1,000,000 | 10,000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
รุ่นอื่นๆ | ||||
Gemma 3 และ 3n | 30 | 15,000 | 14,400 | |
การฝัง Gemini | 3,000 | 1,000,000 | ||
โมเดลที่เลิกใช้งาน | ||||
Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (เลิกใช้งานแล้ว) | 1,000 | 4,000,000 |
ระดับ 2
รุ่น | RPM | TPM | RPD | โทเค็นที่จัดคิวแบบกลุ่ม |
---|---|---|---|---|
โมเดลที่แสดงผลเป็นข้อความ | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | ไม่จำกัด | 500,000,000 |
Gemini 2.0 Flash | 10,000 | 10,000,000 | ไม่จำกัด | 1,000,000,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | ไม่จำกัด | 1,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 เซสชัน | 10,000,000 | ||
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 100 เซสชัน | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 ครั้ง | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 เซสชัน | 10,000,000 | ||
โมเดลการสร้างแบบหลายโมดัล | ||||
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000 | 100,000 | 10,000 | |
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) | 100 | 25,000 | 1,000 | |
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 2,000 | 3,000,000 | 100,000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
รุ่นอื่นๆ | ||||
Gemma 3 และ 3n | 30 | 15,000 | 14,400 | |
การฝัง Gemini | 5,000 | 5,000,000 | -- | -- |
โมเดลที่เลิกใช้งาน | ||||
Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (เลิกใช้งานแล้ว) | 1,000 | 4,000,000 |
ระดับ 3
รุ่น | RPM | TPM | RPD | โทเค็นที่จัดคิวแบบกลุ่ม |
---|---|---|---|---|
โมเดลที่แสดงผลเป็นข้อความ | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | ไม่จำกัด | 1,000,000,000 |
Gemini 2.5 Flash | 10,000 | 8,000,000 | ไม่จำกัด | 1,000,000,000 |
Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | ไม่จำกัด | 1,000,000,000 |
Gemini 2.0 Flash | 30,000 | 30,000,000 | ไม่จำกัด | 5,000,000,000 |
Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | ไม่จำกัด | 5,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 เซสชัน | 10,000,000 | ||
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 100 เซสชัน | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 ครั้ง | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 เซสชัน | 10,000,000 | ||
โมเดลการสร้างแบบหลายโมดัล | ||||
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000 | 1,000,000 | ||
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) | 100 | 1,000,000 | ||
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 5,000 | 5,000,000 | ||
Imagen 4 Standard | 20 | 15,000 | ||
Imagen 4 Ultra | 15 | 5,000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
รุ่นอื่นๆ | ||||
Gemma 3 และ 3n | 30 | 15,000 | 14,400 | |
การฝัง Gemini | 10,000 | 10,000,000 | -- | -- |
โมเดลที่เลิกใช้งาน | ||||
Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (เลิกใช้งานแล้ว) | 1,000 | 4,000,000 |
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตราคำขอในโหมดเป็นกลุ่ม
คำขอโหมดกลุ่มจะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API ในโหมดที่ไม่ใช่กลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100
- ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
- ขีดจำกัดพื้นที่เก็บไฟล์: 20 GB
- โทเค็นที่จัดคิวต่อโมเดล: คอลัมน์โทเค็นที่จัดคิวแบบเป็นกลุ่มใน ตารางโควต้าจะแสดงจำนวนโทเค็นสูงสุดที่จัดคิวได้ สำหรับการประมวลผลแบบเป็นกลุ่มในงานแบบเป็นกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด ดูได้ในตารางขีดจำกัดอัตรา API มาตรฐาน
วิธีอัปเกรดเป็นระดับถัดไป
Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน
เมื่อโปรเจ็กต์ของคุณเป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้
- ไปที่หน้าคีย์ API ใน AI Studio
- ค้นหาโปรเจ็กต์ที่ต้องการอัปเกรด แล้วคลิก "อัปเกรด" ตัวเลือก "อัปเกรด" จะแสดงเฉพาะโปรเจ็กต์ที่มีคุณสมบัติตรงตามการมีสิทธิ์ในระดับถัดไป
หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป
ขอเพิ่มขีดจำกัดอัตรา
โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตราที่เชื่อมโยงกัน (คำขอต่อนาที หรือ RPM) ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่โมเดล Gemini
ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ