ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจํากัดแต่ละรายการ และการใช้งานเกินขีดจํากัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API

โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปขึ้นอยู่กับโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลที่เฉพาะเจาะจงเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ระดับการใช้งาน

โควต้าจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับ คุณสมบัติ
ฟรี ผู้ใช้ในประเทศที่มีสิทธิ์
ระดับ 1 บัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์
ระดับ 2 การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ
ระดับ 3 การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ

เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา API มาตรฐาน

ตารางต่อไปนี้แสดงขีดจํากัดอัตราสําหรับการเรียก Gemini API มาตรฐานทั้งหมด

รุ่นฟรี

รุ่น RPM TPM RPD
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 เซสชัน 1,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1 ครั้ง 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 ครั้ง 10,000 5
Gemini 2.0 Flash Live 3 เซสชัน 1,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 3 10,000 15
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 10 200,000 100
Imagen 3
Veo 2
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400
การฝัง Gemini 100 30,000 1,000
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 15 250,000 50
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 15 250,000 50
Gemini 1.5 Pro (เลิกใช้งานแล้ว)

ระดับ 1

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 ไม่จำกัด 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 ไม่จำกัด 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 ไม่จำกัด 10,000,000
Live API
Gemini 2.5 Flash Live 50 เซสชัน 4,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 3 เซสชัน 50,000 50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 ครั้ง 25,000 50
Gemini 2.0 Flash Live 50 เซสชัน 4,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 10 10,000 100
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 10 10,000 50
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 1,000 1,000,000 10,000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400
การฝัง Gemini 3,000 1,000,000
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000

ระดับ 2

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 ไม่จำกัด 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 ไม่จำกัด 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 ไม่จำกัด 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 เซสชัน 10,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 100 เซสชัน 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 ครั้ง 25,000 50
Gemini 2.0 Flash Live 1,000 เซสชัน 10,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000 100,000 10,000
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 100 25,000 1,000
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 2,000 3,000,000 100,000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400
การฝัง Gemini 5,000 5,000,000 -- --
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000

ระดับ 3

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro 2,000 8,000,000 ไม่จำกัด 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 ไม่จำกัด 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 ไม่จำกัด 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 ไม่จำกัด 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 ไม่จำกัด 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 เซสชัน 10,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 100 เซสชัน 1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 ครั้ง 25,000 50
Gemini 2.0 Flash Live 1,000 เซสชัน 10,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000 1,000,000
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 100 1,000,000
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 5,000 5,000,000
Imagen 4 Standard 20 15,000
Imagen 4 Ultra 15 5,000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400
การฝัง Gemini 10,000 10,000,000 -- --
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราคำขอในโหมดเป็นกลุ่ม

คำขอโหมดกลุ่มจะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API ในโหมดที่ไม่ใช่กลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บไฟล์: 20 GB
  • โทเค็นที่จัดคิวต่อโมเดล: คอลัมน์โทเค็นที่จัดคิวแบบเป็นกลุ่มใน ตารางโควต้าจะแสดงจำนวนโทเค็นสูงสุดที่จัดคิวได้ สำหรับการประมวลผลแบบเป็นกลุ่มในงานแบบเป็นกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด ดูได้ในตารางขีดจำกัดอัตรา API มาตรฐาน

วิธีอัปเกรดเป็นระดับถัดไป

Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน

เมื่อโปรเจ็กต์ของคุณเป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้

หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตราที่เชื่อมโยงกัน (คำขอต่อนาที หรือ RPM) ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่โมเดล Gemini

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ