Veo 3 พร้อมให้ใช้งานแล้วใน Gemini API ดูข้อมูลเพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

รูปแบบของ Gemini

2.5 Pro

โมเดลการคิดที่ทรงพลังที่สุดของเราที่มีความแม่นยำในการตอบสูงสุดและประสิทธิภาพที่ล้ำสมัย

ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบเป็นข้อความ
แก้ปัญหาที่ซับซ้อน วิเคราะห์ฐานข้อมูลขนาดใหญ่ และอื่นๆ
ดีที่สุดสำหรับการเขียนโค้ดที่ซับซ้อน การให้เหตุผล และความเข้าใจแบบมัลติโมดัล

2.5 Flash

โมเดลที่ดีที่สุดของเราในแง่ของราคาต่อประสิทธิภาพ ซึ่งมี ความสามารถที่ครอบคลุม

ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบเป็นข้อความ
โมเดลจะคิดตามความจำเป็น หรือคุณจะกำหนดค่าโควต้าการคิดก็ได้
เหมาะสำหรับงานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้ความคิด

2.5 Flash-Lite

โมเดล Gemini 2.5 Flash ที่เพิ่มประสิทธิภาพเพื่อความคุ้มค่าและเวลาในการตอบสนองต่ำ

ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบเป็นข้อความ
โมเดลที่คุ้มค่าที่สุดซึ่งรองรับปริมาณงานสูง
เหมาะสำหรับ Use Case แบบเรียลไทม์ที่มีเวลาในการตอบสนองต่ำ

โมเดลย่อย

Gemini API มีโมเดลต่างๆ ที่ได้รับการเพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมโดยย่อของโมเดล Gemini ที่พร้อมใช้งานมีดังนี้

รุ่นย่อยของโมเดล	อินพุต	เอาต์พุต	เพิ่มประสิทธิภาพสำหรับ
Gemini 2.5 Pro `gemini-2.5-pro`	เสียง รูปภาพ วิดีโอ ข้อความ และ PDF	ข้อความ	การคิดและการให้เหตุผลที่ได้รับการปรับปรุง ความเข้าใจแบบหลายโมดัล การเขียนโค้ดขั้นสูง และอื่นๆ
Gemini 2.5 Flash `gemini-2.5-flash`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	การคิดแบบปรับตัว ประสิทธิภาพค่าใช้จ่าย
Gemini 2.5 Flash-Lite `gemini-2.5-flash-lite`	ข้อความ, รูปภาพ, วิดีโอ, เสียง	ข้อความ	โมเดลที่คุ้มค่าที่สุดซึ่งรองรับปริมาณงานสูง
เสียงดั้งเดิมของ Gemini 2.5 Flash `gemini-2.5-flash-preview-native-audio-dialog` & `gemini-2.5-flash-exp-native-audio-thinking-dialog`	เสียง วิดีโอ และข้อความ	ข้อความและเสียงที่สลับกัน	เอาต์พุตเสียงสนทนาที่เป็นธรรมชาติและมีคุณภาพสูง ไม่ว่าจะมีการคิดหรือไม่ก็ตาม
TTS ของ Gemini 2.5 Flash เวอร์ชันตัวอย่าง `gemini-2.5-flash-preview-tts`	ข้อความ	เสียง	การสร้างเสียงอ่านออกเสียงข้อความแบบลำโพงเดี่ยวและหลายลำโพงที่ควบคุมได้และมีเวลาในการตอบสนองต่ำ
TTS ของ Gemini 2.5 Pro เวอร์ชันตัวอย่าง `gemini-2.5-pro-preview-tts`	ข้อความ	เสียง	การสร้างเสียงอ่านออกเสียงข้อความแบบลำโพงเดี่ยวและหลายลำโพงที่ควบคุมได้และมีเวลาในการตอบสนองต่ำ
Gemini 2.0 Flash `gemini-2.0-flash`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	ฟีเจอร์รุ่นใหม่ ความเร็ว และการสตรีมแบบเรียลไทม์
การสร้างรูปภาพเวอร์ชันตัวอย่างของ Gemini 2.0 Flash `gemini-2.0-flash-preview-image-generation`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ รูปภาพ	การสร้างและแก้ไขรูปภาพแบบสนทนา
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	ความคุ้มค่าและเวลาในการตอบสนองต่ำ
Gemini 1.5 Flash `gemini-1.5-flash`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	ประสิทธิภาพที่รวดเร็วและหลากหลายในงานต่างๆ เลิกใช้งานแล้ว
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	งานที่มีปริมาณมากและมีระดับความซับซ้อนต่ำ เลิกใช้งานแล้ว
Gemini 1.5 Pro `gemini-1.5-pro`	เสียง รูปภาพ วิดีโอ และข้อความ	ข้อความ	งานการให้เหตุผลที่ซับซ้อนซึ่งต้องใช้สติปัญญามากขึ้น เลิกใช้งานแล้ว
การฝัง Gemini `gemini-embedding-001`	ข้อความ	การฝังข้อความ	การวัดความเกี่ยวข้องของสตริงข้อความ
Imagen 4 `imagen-4.0-generate-preview-06-06` `imagen-4.0-ultra-generate-preview-06-06`	ข้อความ	รูปภาพ	โมเดลการสร้างรูปภาพที่อัปเดตล่าสุดของเรา
Imagen 3 `imagen-3.0-generate-002`	ข้อความ	รูปภาพ	โมเดลการสร้างรูปภาพคุณภาพสูง
ตัวอย่าง Veo 3 `veo-3.0-generate-preview`	ข้อความ	วิดีโอพร้อมเสียง	การสร้างวิดีโอคุณภาพสูงพร้อมเอฟเฟกต์เสียง เสียงรอบข้าง และบทสนทนา
Veo 2 `veo-2.0-generate-001`	ข้อความ รูปภาพ	วิดีโอ	การสร้างวิดีโอคุณภาพสูง
Gemini 2.5 Flash Live `gemini-live-2.5-flash-preview`	เสียง วิดีโอ และข้อความ	ข้อความ เสียง	การโต้ตอบด้วยเสียงและวิดีโอแบบ 2 ทางที่มีเวลาในการตอบสนองต่ำ
Gemini 2.0 Flash Live `gemini-2.0-flash-live-001`	เสียง วิดีโอ และข้อความ	ข้อความ เสียง	การโต้ตอบด้วยเสียงและวิดีโอแบบ 2 ทางที่มีเวลาในการตอบสนองต่ำ

คุณดูขีดจํากัดอัตราสําหรับแต่ละโมเดลได้ในหน้าขีดจํากัดอัตรา

Gemini 2.5 Pro

Gemini 2.5 Pro เป็นโมเดลการคิดที่ล้ำสมัยของเรา ซึ่งสามารถให้เหตุผลเกี่ยวกับปัญหาที่ซับซ้อนในโค้ด คณิตศาสตร์ และ STEM รวมถึงวิเคราะห์ชุดข้อมูล ฐานของโค้ด และเอกสารขนาดใหญ่โดยใช้บริบทแบบยาว

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`gemini-2.5-pro`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ ข้อความ และ PDF เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 65,536
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำได้ โหมดแบทช์ สิ่งที่ทำได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล `Stable: gemini-2.5-pro`
การอัปเดตล่าสุด	มิถุนายน 2025
การตัดข้อมูล	มกราคม 2025

Gemini 2.5 Flash

โมเดลที่ดีที่สุดของเราในแง่ของราคาต่อประสิทธิภาพ ซึ่งมีความสามารถรอบด้าน 2.5 Flash เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ เวลาในการตอบสนองต่ำ งานที่มีปริมาณมากซึ่งต้องใช้ความคิด และ Use Case ของเอเจนต์

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.5-flash`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ รูปภาพ วิดีโอ เสียง เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 65,536
ความสามารถของ	การสร้างเสียง สิ่งที่ทำไม่ได้ การแคช สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การคิด สิ่งที่ทำได้ โหมดแบทช์ สิ่งที่ทำได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล เสถียร: `gemini-2.5-flash` ตัวอย่าง: `gemini-2.5-flash-preview-05-20`
การอัปเดตล่าสุด	มิถุนายน 2025
การตัดข้อมูล	มกราคม 2025

Gemini 2.5 Flash-Lite

โมเดล Gemini 2.5 Flash ที่ได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่าและปริมาณงานสูง

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.5-flash-lite`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ, รูปภาพ, วิดีโอ, เสียง, PDF เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 65,536
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ บริบท URL สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำได้ โหมดแบทช์ สิ่งที่ทำได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล เสถียร: `gemini-2.5-flash-lite` ตัวอย่าง: `gemini-2.5-flash-lite-06-17`
การอัปเดตล่าสุด	กรกฎาคม 2025
การตัดข้อมูล	มกราคม 2025

เสียงเนทีฟของ Gemini 2.5 Flash

โมเดลบทสนทนาเสียงแบบเนทีฟของเราที่มีและไม่มีการคิด ซึ่งพร้อมใช้งานผ่าน Live API โมเดลเหล่านี้มอบ ประสบการณ์การสนทนาแบบอินเทอร์แอกทีฟและไม่มีโครงสร้าง พร้อมด้วยการ แจ้งสไตล์และการควบคุม

ลองใช้เสียงแบบเนทีฟใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.5-flash-preview-native-audio-dialog` & `models/gemini-2.5-flash-exp-native-audio-thinking-dialog`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง วิดีโอ ข้อความ เอาต์พุต เสียงและข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 128,000 ขีดจำกัดโทเค็นเอาต์พุต 8,000
ความสามารถของ	การสร้างเสียง สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การรันโค้ด สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ตัวอย่าง: `gemini-2.5-flash-preview-05-20` ทดลอง: `gemini-2.5-flash-exp-native-audio-thinking-dialog`
การอัปเดตล่าสุด	พฤษภาคม 2025
การตัดข้อมูล	มกราคม 2025

การอ่านออกเสียงข้อความของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)

TTS ของ Gemini 2.5 Flash Preview เป็นโมเดลแปลงข้อความเป็นคำพูดที่คุ้มค่า ซึ่งให้การควบคุมและความโปร่งใสสูงสำหรับเวิร์กโฟลว์ที่มีโครงสร้าง เช่น การสร้างพอดแคสต์ หนังสือเสียง การสนับสนุนลูกค้า และอื่นๆ ขีดจำกัดอัตราของ Gemini 2.5 Flash จะถูกจำกัดมากกว่าเนื่องจากเป็นโมเดลทดลอง / โมเดลเวอร์ชันตัวอย่าง

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.5-flash-preview-tts`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต เสียง
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 8,000 ขีดจำกัดโทเค็นเอาต์พุต 16,000
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การรันโค้ด สิ่งที่ทำไม่ได้ ค้นหา สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล `gemini-2.5-flash-preview-tts`
การอัปเดตล่าสุด	พฤษภาคม 2025

การอ่านออกเสียงข้อความของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)

TTS ของ Gemini 2.5 Pro เวอร์ชันตัวอย่างคือโมเดลแปลงข้อความเป็นคำพูดที่ทรงพลังที่สุดของเรา ซึ่งให้การควบคุมและความโปร่งใสสูงสำหรับเวิร์กโฟลว์ที่มีโครงสร้าง เช่น การสร้างพอดแคสต์ หนังสือเสียง การสนับสนุนลูกค้า และอื่นๆ ขีดจำกัดอัตราของ Gemini 2.5 Pro จะถูกจำกัดมากกว่าเนื่องจากเป็นโมเดลเวอร์ชันทดลอง / ตัวอย่าง

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.5-pro-preview-tts`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต เสียง
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 8,000 ขีดจำกัดโทเค็นเอาต์พุต 16,000
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การรันโค้ด สิ่งที่ทำไม่ได้ ค้นหา สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล `gemini-2.5-pro-preview-tts`
การอัปเดตล่าสุด	พฤษภาคม 2025

Gemini 2.0 Flash

Gemini 2.0 Flash มาพร้อมฟีเจอร์รุ่นถัดไปและความสามารถที่ดียิ่งขึ้น รวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือแบบเนทีฟ และหน้าต่างบริบทขนาด 1 ล้านโทเค็น

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.0-flash`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำได้ การคิด ทดลอง โหมดแบทช์ สิ่งที่ทำได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ล่าสุด: `gemini-2.0-flash` เสถียร: `gemini-2.0-flash-001` ทดลอง: `gemini-2.0-flash-exp`
การอัปเดตล่าสุด	กุมภาพันธ์ 2025
การตัดข้อมูล	สิงหาคม 2024

การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)

การสร้างรูปภาพตัวอย่างของ Gemini 2.0 Flash จะมอบฟีเจอร์การสร้างรูปภาพที่ได้รับการปรับปรุง ซึ่งรวมถึงการสร้างและแก้ไขรูปภาพในลักษณะการสนทนา

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.0-flash-preview-image-generation`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความและรูปภาพ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 32,000 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การรันโค้ด ไม่รองรับ ค้นหา ไม่รองรับ การสร้างรูปภาพ สิ่งที่ทำได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API ไม่รองรับ การคิด ไม่รองรับ
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ตัวอย่าง: `gemini-2.0-flash-preview-image-generation` ขณะนี้ยังไม่รองรับ gemini-2.0-flash-preview-image-generation ในหลายประเทศในยุโรป ตะวันออกกลาง และแอฟริกา
การอัปเดตล่าสุด	พฤษภาคม 2025
การตัดข้อมูล	สิงหาคม 2024

Gemini 2.0 Flash-Lite

โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อความคุ้มค่าและเวลาในการตอบสนองที่ต่ำ

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.0-flash-lite`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำไม่ได้ ค้นหา สิ่งที่ทำไม่ได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ Batch API สิ่งที่ทำได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ล่าสุด: `gemini-2.0-flash-lite` เสถียร: `gemini-2.0-flash-lite-001`
การอัปเดตล่าสุด	กุมภาพันธ์ 2025
การตัดข้อมูล	สิงหาคม 2024

Gemini 1.5 Flash

Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดใน งานที่หลากหลาย

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-1.5-flash`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ข้อกำหนดด้านภาพและเสียง	จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวสูงสุดของเสียง ประมาณ 9.5 ชั่วโมง
ความสามารถของ	คำสั่งของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ล่าสุด: `gemini-1.5-flash-latest` เวอร์ชันเสถียรล่าสุด: `gemini-1.5-flash` เสถียร: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
วันที่เลิกใช้งาน	กันยายน 2025
การอัปเดตล่าสุด	กันยายน 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้สติปัญญาต่ำ

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-1.5-flash-8b`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ข้อกำหนดด้านภาพและเสียง	จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวสูงสุดของเสียง ประมาณ 9.5 ชั่วโมง
ความสามารถของ	คำสั่งของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ล่าสุด: `gemini-1.5-flash-8b-latest` เวอร์ชันเสถียรล่าสุด: `gemini-1.5-flash-8b` เสถียร: `gemini-1.5-flash-8b-001`
วันที่เลิกใช้งาน	กันยายน 2025
การอัปเดตล่าสุด	ตุลาคม 2024

Gemini 1.5 Pro

ลองใช้ Gemini 2.5 Pro เวอร์ชันตัวอย่าง ซึ่งเป็นโมเดล Gemini ที่ล้ำหน้าที่สุดของเราในปัจจุบัน

Gemini 1.5 Pro เป็นโมเดลมัลติโมดัลขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับ งานการให้เหตุผลที่หลากหลาย 1.5 Pro ประมวลผลข้อมูลจำนวนมากได้ พร้อมกัน รวมถึงวิดีโอ 2 ชั่วโมง เสียง 19 ชั่วโมง ฐานของโค้ดที่มี โค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-1.5-pro`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 2,097,152 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ข้อกำหนดด้านภาพและเสียง	จำนวนรูปภาพสูงสุดต่อพรอมต์ 7,200 ความยาววิดีโอสูงสุด 2 ชั่วโมง ความยาวสูงสุดของเสียง ประมาณ 19 ชั่วโมง
ความสามารถของ	คำสั่งของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ล่าสุด: `gemini-1.5-pro-latest` เวอร์ชันเสถียรล่าสุด: `gemini-1.5-pro` เสถียร: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
วันที่เลิกใช้งาน	กันยายน 2025
การอัปเดตล่าสุด	กันยายน 2024

Imagen 4

Imagen 4 เป็นโมเดลรูปภาพล่าสุดของเราที่สามารถสร้างรูปภาพที่มีรายละเอียดสูง พร้อมการจัดแสงที่สมบูรณ์ การแสดงข้อความที่ดีขึ้นอย่างมาก และเอาต์พุตที่มีความละเอียดสูงกว่า โมเดลก่อนหน้า

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `imagen-4.0-generate-preview-06-06` `imagen-4.0-ultra-generate-preview-06-06`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต รูปภาพ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 480 โทเค็น (ข้อความ) รูปภาพเอาต์พุต 1 (สูงพิเศษ) 1 ถึง 4 (มาตรฐาน)
การอัปเดตล่าสุด	มิถุนายน 2025

Imagen 3

Imagen 3 เป็นโมเดลเปลี่ยนข้อความเป็นรูปภาพคุณภาพสูงสุดของเรา ซึ่งสามารถสร้าง รูปภาพที่มีรายละเอียดดียิ่งขึ้น การจัดแสงที่เต็มอิ่มขึ้น และลดสิ่งรบกวนในภาพให้เหลือน้อยที่สุด เมื่อเทียบกับโมเดลก่อนหน้า

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `imagen-3.0-generate-002`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต รูปภาพ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต ไม่มี รูปภาพเอาต์พุต สูงสุด 4 รายการ
การอัปเดตล่าสุด	กุมภาพันธ์ 2025

ตัวอย่าง Veo 3

Veo 3 เวอร์ชันตัวอย่างเป็นโมเดลเปลี่ยนข้อความเป็นวิดีโอล่าสุดของเรา ซึ่งสามารถสร้าง วิดีโอที่มีรายละเอียดพร้อมเสียงในตัว ปฏิบัติตามพรอมต์ได้แม่นยำยิ่งขึ้น และควบคุมกล้องได้โดยตรง

ลองใช้ Veo 3

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `veo-3.0-generate-preview`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต วิดีโอพร้อมเสียง
Limits	การป้อนข้อความ 1,024 โทเค็น วิดีโอเอาต์พุต 1
การอัปเดตล่าสุด	กรกฎาคม 2025

Veo 2

Veo 2 เป็นโมเดลข้อความและรูปภาพเป็นวิดีโอคุณภาพสูงของเรา ซึ่งสามารถสร้าง วิดีโอที่มีรายละเอียด โดยจับภาพความแตกต่างทางศิลปะในพรอมต์ของคุณ

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `veo-2.0-generate-001`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ รูปภาพ เอาต์พุต วิดีโอ
Limits	การป้อนข้อความ ไม่มี อินพุตรูปภาพ ความละเอียดและสัดส่วนภาพใดก็ได้ที่มีขนาดไฟล์ไม่เกิน 20 MB วิดีโอเอาต์พุต สูงสุด 2 รายการ
การอัปเดตล่าสุด	เมษายน 2025

Gemini 2.5 Flash Live

โมเดล Gemini 2.5 Flash Live ทำงานร่วมกับ Live API เพื่อเปิดใช้การโต้ตอบด้วยเสียงและวิดีโอแบบสองทางที่มีเวลาในการตอบสนองต่ำ กับ Gemini โมเดลนี้สามารถประมวลผลอินพุตข้อความ เสียง และวิดีโอ รวมถึง แสดงเอาต์พุตข้อความและเสียงได้

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-live-2.5-flash-preview`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง วิดีโอ และข้อความ เอาต์พุต ข้อความและเสียง
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ การคิด สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ตัวอย่าง: `gemini-live-2.5-flash-preview`
การอัปเดตล่าสุด	มิถุนายน 2025
การตัดข้อมูล	มกราคม 2025

Gemini 2.0 Flash Live

โมเดล Gemini 2.0 Flash Live ทำงานร่วมกับ Live API เพื่อเปิดใช้การโต้ตอบด้วยเสียงและวิดีโอแบบสองทางที่มีเวลาในการตอบสนองต่ำ กับ Gemini โมเดลนี้สามารถประมวลผลอินพุตข้อความ เสียง และวิดีโอ รวมถึง แสดงเอาต์พุตข้อความและเสียงได้

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`models/gemini-2.0-flash-live-001`
ประเภทข้อมูลที่รองรับ	อินพุต เสียง วิดีโอ และข้อความ เอาต์พุต ข้อความและเสียง
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192
ความสามารถของ	เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ การคิด สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล ตัวอย่าง: `gemini-2.0-flash-live-001`
การอัปเดตล่าสุด	เมษายน 2025
การตัดข้อมูล	สิงหาคม 2024

การฝัง Gemini

โมเดลการฝัง Gemini มีประสิทธิภาพ SOTA ในมิติข้อมูลที่สำคัญหลายอย่าง รวมถึงโค้ด หลายภาษา และการดึงข้อมูล

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `gemini-embedding-001`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต การฝังข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต ยืดหยุ่น รองรับ: 128 - 3072, แนะนำ: 768, 1536, 3072
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล เสถียร: `gemini-embedding-001` ตัวอย่าง: `gemini-embedding-exp-03-07`
การอัปเดตล่าสุด	มิถุนายน 2025

โมเดลการฝังแบบเดิม

การฝังข้อความ (เดิม)

การฝังข้อความใช้เพื่อวัดความเกี่ยวข้องของสตริง และใช้กันอย่างแพร่หลายใน แอปพลิเคชัน AI หลายอย่าง

รายละเอียดโมเดล

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `models/text-embedding-004`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต การฝังข้อความ
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768
ขีดจำกัดอัตรา^[**]	คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้	สิ่งที่ทำไม่ได้
วันที่เลิกใช้งาน	มกราคม 2026
การอัปเดตล่าสุด	เมษายน 2024

ดูตัวอย่างเพื่อสำรวจความสามารถของโมเดล รูปแบบต่างๆ เหล่านี้

[*] โทเค็นเทียบเท่ากับอักขระประมาณ 4 ตัวสำหรับโมเดล Gemini โทเค็น 100 รายการ มีค่าประมาณ 60-80 คำในภาษาอังกฤษ

รูปแบบชื่อเวอร์ชันโมเดล

โมเดล Gemini มีให้ใช้งานในเวอร์ชันเสถียร ตัวอย่าง หรือทดลอง ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลต่อไปนี้รูปแบบใดรูปแบบหนึ่งเพื่อ ระบุโมเดลและเวอร์ชันที่ต้องการใช้

เสถียรล่าสุด

ชี้ไปยังเวอร์ชันที่เสถียรล่าสุดที่เผยแพร่สำหรับรุ่น รุ่นและรูปแบบที่ระบุ

หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation> เช่น gemini-2.0-flash

คงที่

ชี้ไปยังโมเดลที่เสถียรที่เฉพาะเจาะจง โดยปกติแล้วโมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้โมเดลที่เสถียรเฉพาะ

หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-2.0-flash-001

Preview

ชี้ไปยังโมเดลเวอร์ชันตัวอย่างซึ่งอาจไม่เหมาะกับการใช้งานจริง มาพร้อมกับขีดจำกัดอัตราที่เข้มงวดกว่า แต่ก็อาจเปิดใช้การเรียกเก็บเงินได้

หากต้องการระบุเวอร์ชันตัวอย่าง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-2.5-pro-preview-06-05

โมเดลเวอร์ชันตัวอย่างไม่เสถียร และความพร้อมใช้งานของปลายทางโมเดลอาจมีการเปลี่ยนแปลง

ทดลอง

ชี้ไปยังโมเดลทดลองซึ่งอาจไม่เหมาะกับการใช้งานจริงและ มีขีดจำกัดอัตราที่เข้มงวดกว่า เราเปิดตัวโมเดลทดลองเพื่อรวบรวม ความคิดเห็นและส่งการอัปเดตล่าสุดให้แก่นักพัฒนาแอปอย่างรวดเร็ว

หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-2.0-pro-exp-02-05

โมเดลทดลองไม่เสถียรและอาจมีการเปลี่ยนแปลงความพร้อมใช้งานของปลายทางโมเดล

โมเดลทดลอง

นอกจากโมเดลที่เสถียรแล้ว Gemini API ยังมีโมเดลเวอร์ชันทดลองซึ่ง อาจไม่เหมาะกับการใช้งานจริงและมีขีดจำกัดอัตราการใช้งานที่เข้มงวดกว่า

เราเปิดตัวโมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ให้ ข้อมูลอัปเดตล่าสุดแก่ผู้พัฒนาแอปอย่างรวดเร็ว และแสดงให้เห็นถึงความเร็วในการ สร้างสรรค์นวัตกรรมที่ Google การเรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จ คุณสามารถสลับโมเดลทดลองกับโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะ กลายเป็นโมเดลที่เสถียรในอนาคต

โมเดลทดลองก่อนหน้า

เมื่อมีเวอร์ชันใหม่หรือเวอร์ชันเสถียร เราจะนำโมเดลเวอร์ชันทดลองออกและแทนที่ด้วยเวอร์ชันใหม่ คุณดูโมเดลทดลองก่อนหน้าที่เราเปิดตัวได้ในส่วนต่อไปนี้พร้อมกับเวอร์ชันทดแทน

รหัสโมเดล	โมเดลฐาน	เวอร์ชันทดแทน
`gemini-embedding-exp-03-07`	การฝัง Gemini	`gemini-embedding-001`
`gemini-2.5-flash-preview-04-17`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-05-20`
`gemini-2.0-flash-exp-image-generation`	Gemini 2.0 Flash	`gemini-2.0-flash-preview-image-generation`
`gemini-2.5-pro-preview-06-05`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.5-pro-preview-05-06`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.5-pro-preview-03-25`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.0-flash-thinking-exp-01-21`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-04-17`
`gemini-2.0-pro-exp-02-05`	Gemini 2.0 Pro (เวอร์ชันทดลอง)	`gemini-2.5-pro-preview-03-25`
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	2.0 Flash Thinking ของ Gemini	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

ภาษาที่รองรับ

โมเดล Gemini ได้รับการฝึกให้ทำงานกับภาษาต่อไปนี้

อาหรับ (ar)
เบงกาลี (bn)
บัลแกเรีย (bg)
จีนตัวย่อและตัวเต็ม (zh)
โครเอเชีย (hr)
เช็ก (cs)
เดนมาร์ก (da)
ดัตช์ (nl)
อังกฤษ (en)
เอสโตเนีย (et)
ฟินแลนด์ (fi)
ฝรั่งเศส (fr)
เยอรมัน (de)
กรีก (el)
ฮีบรู (iw)
ฮินดี (hi)
ฮังการี (hu)
อินโดนีเซีย (id)
อิตาลี (it)
ญี่ปุ่น (ja)
เกาหลี (ko)
ลัตเวีย (lv)
ลิทัวเนีย (lt)
นอร์เวย์ (no)
โปแลนด์ (pl)
โปรตุเกส (pt)
โรมาเนีย (ro)
รัสเซีย (ru)
เซอร์เบีย (sr)
สโลวัก (sk)
สโลวีเนีย (sl)
สเปน (es)
สวาฮีลี (sw)
สวีเดน (sv)
ไทย (th)
ตุรกี (tr)
ยูเครน (uk)
เวียดนาม (vi)