ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

คำขอต่อนาที (RPM)
โทเค็นต่อนาที (อินพุต) (TPM)
คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจํากัดแต่ละรายการ และการใช้งานเกินขีดจํากัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API

โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปขึ้นอยู่กับโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลที่เฉพาะเจาะจงเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ระดับการใช้งาน

โควต้าจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับ	คุณสมบัติ
ฟรี	ผู้ใช้ในประเทศที่มีสิทธิ์
ระดับ 1	บัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์
ระดับ 2	การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ
ระดับ 3	การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ

เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา API มาตรฐาน

ตารางต่อไปนี้แสดงขีดจํากัดอัตราสําหรับการเรียก Gemini API มาตรฐานทั้งหมด

รุ่นฟรี

รุ่น	RPM	TPM	RPD
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro	5	250,000	100
Gemini 2.5 Flash	10	250,000	250
Gemini 2.5 Flash-Lite	15	250,000	1,000
Gemini 2.0 Flash	15	1,000,000	200
Gemini 2.0 Flash-Lite	30	1,000,000	200
Live API
Gemini 2.5 Flash Live	3 เซสชัน	1,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1 ครั้ง	25,000	5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog	1 ครั้ง	10,000	5
Gemini 2.0 Flash Live	3 เซสชัน	1,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	3	10,000	15
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	10	200,000	100
Imagen 3
Veo 2
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400
การฝัง Gemini	100	30,000	1,000
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	15	250,000	50
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	15	250,000	50
Gemini 1.5 Pro (เลิกใช้งานแล้ว)

ระดับ 1

รุ่น	RPM	TPM	RPD	โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro	150	2,000,000	10,000	5,000,000
Gemini 2.5 Flash	1,000	1,000,000	10,000	3,000,000
Gemini 2.5 Flash-Lite	4,000	4,000,000	ไม่จำกัด	10,000,000
Gemini 2.0 Flash	2,000	4,000,000	ไม่จำกัด	10,000,000
Gemini 2.0 Flash-Lite	4,000	4,000,000	ไม่จำกัด	10,000,000
Live API
Gemini 2.5 Flash Live	50 เซสชัน	4,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	3 เซสชัน	50,000	50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog	1 ครั้ง	25,000	50
Gemini 2.0 Flash Live	50 เซสชัน	4,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	10	10,000	100
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)	10	10,000	50
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	1,000	1,000,000	10,000
Imagen 4 Standard	10		70
Imagen 4 Ultra	5		30
Imagen 3	20
Veo 3	2		10
Veo 2	2		50
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400
การฝัง Gemini	3,000	1,000,000
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	2,000	4,000,000
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	4,000	4,000,000
Gemini 1.5 Pro (เลิกใช้งานแล้ว)	1,000	4,000,000

ระดับ 2

รุ่น	RPM	TPM	RPD	โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro	1,000	5,000,000	50,000	500,000,000
Gemini 2.5 Flash	2,000	3,000,000	100,000	400,000,000
Gemini 2.5 Flash-Lite	10,000	10,000,000	ไม่จำกัด	500,000,000
Gemini 2.0 Flash	10,000	10,000,000	ไม่จำกัด	1,000,000,000
Gemini 2.0 Flash-Lite	20,000	10,000,000	ไม่จำกัด	1,000,000,000
Live API
Gemini 2.5 Flash Live	1,000 เซสชัน	10,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	100 เซสชัน	1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog	1 ครั้ง	25,000	50
Gemini 2.0 Flash Live	1,000 เซสชัน	10,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1,000	100,000	10,000
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)	100	25,000	1,000
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	2,000	3,000,000	100,000
Imagen 4 Standard	15		1000
Imagen 4 Ultra	10		400
Imagen 3	20
Veo 3	4		50
Veo 2	2		50
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400
การฝัง Gemini	5,000	5,000,000	--	--
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	2,000	4,000,000
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	4,000	4,000,000
Gemini 1.5 Pro (เลิกใช้งานแล้ว)	1,000	4,000,000

ระดับ 3

รุ่น	RPM	TPM	RPD	โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลที่แสดงผลเป็นข้อความ
Gemini 2.5 Pro	2,000	8,000,000	ไม่จำกัด	1,000,000,000
Gemini 2.5 Flash	10,000	8,000,000	ไม่จำกัด	1,000,000,000
Gemini 2.5 Flash-Lite	30,000	30,000,000	ไม่จำกัด	1,000,000,000
Gemini 2.0 Flash	30,000	30,000,000	ไม่จำกัด	5,000,000,000
Gemini 2.0 Flash-Lite	30,000	30,000,000	ไม่จำกัด	5,000,000,000
Live API
Gemini 2.5 Flash Live	1,000 เซสชัน	10,000,000
กล่องโต้ตอบเสียงของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	100 เซสชัน	1,000,000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog	1 ครั้ง	25,000	50
Gemini 2.0 Flash Live	1,000 เซสชัน	10,000,000
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1,000	1,000,000
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)	100	1,000,000
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	5,000	5,000,000
Imagen 4 Standard	20		15,000
Imagen 4 Ultra	15		5,000
Imagen 3	20
Veo 3	10		500
Veo 2	2		50
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400
การฝัง Gemini	10,000	10,000,000	--	--
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	2,000	4,000,000
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	4,000	4,000,000
Gemini 1.5 Pro (เลิกใช้งานแล้ว)	1,000	4,000,000

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราคำขอในโหมดเป็นกลุ่ม

คำขอโหมดกลุ่มจะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API ในโหมดที่ไม่ใช่กลุ่ม

คำขอแบบกลุ่มพร้อมกัน: 100
ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
ขีดจำกัดพื้นที่เก็บไฟล์: 20 GB
โทเค็นที่จัดคิวต่อโมเดล: คอลัมน์โทเค็นที่จัดคิวแบบเป็นกลุ่มใน ตารางโควต้าจะแสดงจำนวนโทเค็นสูงสุดที่จัดคิวได้ สำหรับการประมวลผลแบบเป็นกลุ่มในงานแบบเป็นกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด ดูได้ในตารางขีดจำกัดอัตรา API มาตรฐาน

วิธีอัปเกรดเป็นระดับถัดไป

Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน

เมื่อโปรเจ็กต์ของคุณเป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้

ไปที่หน้าคีย์ API ใน AI Studio
ค้นหาโปรเจ็กต์ที่ต้องการอัปเกรด แล้วคลิก "อัปเกรด" ตัวเลือก "อัปเกรด" จะแสดงเฉพาะโปรเจ็กต์ที่มีคุณสมบัติตรงตามการมีสิทธิ์ในระดับถัดไป

หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตราที่เชื่อมโยงกัน (คำขอต่อนาที หรือ RPM) ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่โมเดล Gemini

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ