2.5 Pro
โมเดลการคิดที่ทรงพลังที่สุดของเราที่มีความแม่นยำในการตอบสูงสุดและประสิทธิภาพที่ล้ำสมัย
- ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบเป็นข้อความ
- แก้ปัญหาที่ซับซ้อน วิเคราะห์ฐานข้อมูลขนาดใหญ่ และอื่นๆ
- ดีที่สุดสำหรับการเขียนโค้ดที่ซับซ้อน การให้เหตุผล และความเข้าใจแบบมัลติโมดัล
โมเดลย่อย
Gemini API มีโมเดลต่างๆ ที่ได้รับการเพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมโดยย่อของโมเดล Gemini ที่พร้อมใช้งานมีดังนี้
รุ่นย่อยของโมเดล | อินพุต | เอาต์พุต | เพิ่มประสิทธิภาพสำหรับ |
---|---|---|---|
Gemini 2.5 Pro
gemini-2.5-pro |
เสียง รูปภาพ วิดีโอ ข้อความ และ PDF | ข้อความ | การคิดและการให้เหตุผลที่ได้รับการปรับปรุง ความเข้าใจแบบหลายโมดัล การเขียนโค้ดขั้นสูง และอื่นๆ |
Gemini 2.5 Flash
gemini-2.5-flash |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | การคิดแบบปรับตัว ประสิทธิภาพค่าใช้จ่าย |
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite |
ข้อความ, รูปภาพ, วิดีโอ, เสียง | ข้อความ | โมเดลที่คุ้มค่าที่สุดซึ่งรองรับปริมาณงานสูง |
เสียงดั้งเดิมของ Gemini 2.5 Flash
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog |
เสียง วิดีโอ และข้อความ | ข้อความและเสียงที่สลับกัน | เอาต์พุตเสียงสนทนาที่เป็นธรรมชาติและมีคุณภาพสูง ไม่ว่าจะมีการคิดหรือไม่ก็ตาม |
TTS ของ Gemini 2.5 Flash เวอร์ชันตัวอย่าง
gemini-2.5-flash-preview-tts |
ข้อความ | เสียง | การสร้างเสียงอ่านออกเสียงข้อความแบบลำโพงเดี่ยวและหลายลำโพงที่ควบคุมได้และมีเวลาในการตอบสนองต่ำ |
TTS ของ Gemini 2.5 Pro เวอร์ชันตัวอย่าง
gemini-2.5-pro-preview-tts |
ข้อความ | เสียง | การสร้างเสียงอ่านออกเสียงข้อความแบบลำโพงเดี่ยวและหลายลำโพงที่ควบคุมได้และมีเวลาในการตอบสนองต่ำ |
Gemini 2.0 Flash
gemini-2.0-flash |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | ฟีเจอร์รุ่นใหม่ ความเร็ว และการสตรีมแบบเรียลไทม์ |
การสร้างรูปภาพเวอร์ชันตัวอย่างของ Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ รูปภาพ | การสร้างและแก้ไขรูปภาพแบบสนทนา |
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | ความคุ้มค่าและเวลาในการตอบสนองต่ำ |
Gemini 1.5 Flash
gemini-1.5-flash |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | ประสิทธิภาพที่รวดเร็วและหลากหลายในงานต่างๆ
เลิกใช้งานแล้ว |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | งานที่มีปริมาณมากและมีระดับความซับซ้อนต่ำ
เลิกใช้งานแล้ว |
Gemini 1.5 Pro
gemini-1.5-pro |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ |
งานการให้เหตุผลที่ซับซ้อนซึ่งต้องใช้สติปัญญามากขึ้น
เลิกใช้งานแล้ว |
การฝัง Gemini
gemini-embedding-001 |
ข้อความ | การฝังข้อความ | การวัดความเกี่ยวข้องของสตริงข้อความ |
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06 |
ข้อความ | รูปภาพ | โมเดลการสร้างรูปภาพที่อัปเดตล่าสุดของเรา |
Imagen 3
imagen-3.0-generate-002 |
ข้อความ | รูปภาพ | โมเดลการสร้างรูปภาพคุณภาพสูง |
ตัวอย่าง Veo 3
veo-3.0-generate-preview |
ข้อความ | วิดีโอพร้อมเสียง | การสร้างวิดีโอคุณภาพสูงพร้อมเอฟเฟกต์เสียง เสียงรอบข้าง และบทสนทนา |
Veo 2
veo-2.0-generate-001 |
ข้อความ รูปภาพ | วิดีโอ | การสร้างวิดีโอคุณภาพสูง |
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview |
เสียง วิดีโอ และข้อความ | ข้อความ เสียง | การโต้ตอบด้วยเสียงและวิดีโอแบบ 2 ทางที่มีเวลาในการตอบสนองต่ำ |
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001 |
เสียง วิดีโอ และข้อความ | ข้อความ เสียง | การโต้ตอบด้วยเสียงและวิดีโอแบบ 2 ทางที่มีเวลาในการตอบสนองต่ำ |
คุณดูขีดจํากัดอัตราสําหรับแต่ละโมเดลได้ในหน้าขีดจํากัดอัตรา
Gemini 2.5 Pro
Gemini 2.5 Pro เป็นโมเดลการคิดที่ล้ำสมัยของเรา ซึ่งสามารถให้เหตุผลเกี่ยวกับปัญหาที่ซับซ้อนในโค้ด คณิตศาสตร์ และ STEM รวมถึงวิเคราะห์ชุดข้อมูล ฐานของโค้ด และเอกสารขนาดใหญ่โดยใช้บริบทแบบยาว
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | gemini-2.5-pro |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ ข้อความ และ PDF เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 65,536 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำได้ โหมดแบทช์ สิ่งที่ทำได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | มิถุนายน 2025 |
การตัดข้อมูล | มกราคม 2025 |
Gemini 2.5 Flash
โมเดลที่ดีที่สุดของเราในแง่ของราคาต่อประสิทธิภาพ ซึ่งมีความสามารถรอบด้าน 2.5 Flash เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ เวลาในการตอบสนองต่ำ งานที่มีปริมาณมากซึ่งต้องใช้ความคิด และ Use Case ของเอเจนต์
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.5-flash |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ รูปภาพ วิดีโอ เสียง เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 65,536 |
ความสามารถของ |
การสร้างเสียง สิ่งที่ทำไม่ได้ การแคช สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การคิด สิ่งที่ทำได้ โหมดแบทช์ สิ่งที่ทำได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | มิถุนายน 2025 |
การตัดข้อมูล | มกราคม 2025 |
Gemini 2.5 Flash-Lite
โมเดล Gemini 2.5 Flash ที่ได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่าและปริมาณงานสูง
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.5-flash-lite |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ, รูปภาพ, วิดีโอ, เสียง, PDF เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 65,536 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ บริบท URL สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำได้ โหมดแบทช์ สิ่งที่ทำได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | กรกฎาคม 2025 |
การตัดข้อมูล | มกราคม 2025 |
เสียงเนทีฟของ Gemini 2.5 Flash
โมเดลบทสนทนาเสียงแบบเนทีฟของเราที่มีและไม่มีการคิด ซึ่งพร้อมใช้งานผ่าน Live API โมเดลเหล่านี้มอบ ประสบการณ์การสนทนาแบบอินเทอร์แอกทีฟและไม่มีโครงสร้าง พร้อมด้วยการ แจ้งสไตล์และการควบคุม
ลองใช้เสียงแบบเนทีฟใน Google AI Studio
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.5-flash-preview-native-audio-dialog &models/gemini-2.5-flash-exp-native-audio-thinking-dialog |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง วิดีโอ ข้อความ เอาต์พุต เสียงและข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 128,000 ขีดจำกัดโทเค็นเอาต์พุต 8,000 |
ความสามารถของ |
การสร้างเสียง สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การรันโค้ด สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | พฤษภาคม 2025 |
การตัดข้อมูล | มกราคม 2025 |
การอ่านออกเสียงข้อความของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)
TTS ของ Gemini 2.5 Flash Preview เป็นโมเดลแปลงข้อความเป็นคำพูดที่คุ้มค่า ซึ่งให้การควบคุมและความโปร่งใสสูงสำหรับเวิร์กโฟลว์ที่มีโครงสร้าง เช่น การสร้างพอดแคสต์ หนังสือเสียง การสนับสนุนลูกค้า และอื่นๆ ขีดจำกัดอัตราของ Gemini 2.5 Flash จะถูกจำกัดมากกว่าเนื่องจากเป็นโมเดลทดลอง / โมเดลเวอร์ชันตัวอย่าง
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.5-flash-preview-tts |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต เสียง |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 8,000 ขีดจำกัดโทเค็นเอาต์พุต 16,000 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การรันโค้ด สิ่งที่ทำไม่ได้ ค้นหา สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | พฤษภาคม 2025 |
การอ่านออกเสียงข้อความของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)
TTS ของ Gemini 2.5 Pro เวอร์ชันตัวอย่างคือโมเดลแปลงข้อความเป็นคำพูดที่ทรงพลังที่สุดของเรา ซึ่งให้การควบคุมและความโปร่งใสสูงสำหรับเวิร์กโฟลว์ที่มีโครงสร้าง เช่น การสร้างพอดแคสต์ หนังสือเสียง การสนับสนุนลูกค้า และอื่นๆ ขีดจำกัดอัตราของ Gemini 2.5 Pro จะถูกจำกัดมากกว่าเนื่องจากเป็นโมเดลเวอร์ชันทดลอง / ตัวอย่าง
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.5-pro-preview-tts |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต เสียง |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 8,000 ขีดจำกัดโทเค็นเอาต์พุต 16,000 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การรันโค้ด สิ่งที่ทำไม่ได้ ค้นหา สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | พฤษภาคม 2025 |
Gemini 2.0 Flash
Gemini 2.0 Flash มาพร้อมฟีเจอร์รุ่นถัดไปและความสามารถที่ดียิ่งขึ้น รวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือแบบเนทีฟ และหน้าต่างบริบทขนาด 1 ล้านโทเค็น
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.0-flash |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำได้ การคิด ทดลอง โหมดแบทช์ สิ่งที่ทำได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | กุมภาพันธ์ 2025 |
การตัดข้อมูล | สิงหาคม 2024 |
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)
การสร้างรูปภาพตัวอย่างของ Gemini 2.0 Flash จะมอบฟีเจอร์การสร้างรูปภาพที่ได้รับการปรับปรุง ซึ่งรวมถึงการสร้างและแก้ไขรูปภาพในลักษณะการสนทนา
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.0-flash-preview-image-generation |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความและรูปภาพ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 32,000 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การรันโค้ด ไม่รองรับ ค้นหา ไม่รองรับ การสร้างรูปภาพ สิ่งที่ทำได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API ไม่รองรับ การคิด ไม่รองรับ |
เวอร์ชัน |
ขณะนี้ยังไม่รองรับ gemini-2.0-flash-preview-image-generation ในหลายประเทศในยุโรป ตะวันออกกลาง และแอฟริกา |
การอัปเดตล่าสุด | พฤษภาคม 2025 |
การตัดข้อมูล | สิงหาคม 2024 |
Gemini 2.0 Flash-Lite
โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อความคุ้มค่าและเวลาในการตอบสนองที่ต่ำ
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.0-flash-lite |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำไม่ได้ ค้นหา สิ่งที่ทำไม่ได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ Batch API สิ่งที่ทำได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | กุมภาพันธ์ 2025 |
การตัดข้อมูล | สิงหาคม 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดใน งานที่หลากหลาย
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-1.5-flash |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดด้านภาพและเสียง |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวสูงสุดของเสียง ประมาณ 9.5 ชั่วโมง |
ความสามารถของ |
คำสั่งของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
วันที่เลิกใช้งาน | กันยายน 2025 |
การอัปเดตล่าสุด | กันยายน 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้สติปัญญาต่ำ
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-1.5-flash-8b |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดด้านภาพและเสียง |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวสูงสุดของเสียง ประมาณ 9.5 ชั่วโมง |
ความสามารถของ |
คำสั่งของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
วันที่เลิกใช้งาน | กันยายน 2025 |
การอัปเดตล่าสุด | ตุลาคม 2024 |
Gemini 1.5 Pro
ลองใช้ Gemini 2.5 Pro เวอร์ชันตัวอย่าง ซึ่งเป็นโมเดล Gemini ที่ล้ำหน้าที่สุดของเราในปัจจุบัน
Gemini 1.5 Pro เป็นโมเดลมัลติโมดัลขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับ งานการให้เหตุผลที่หลากหลาย 1.5 Pro ประมวลผลข้อมูลจำนวนมากได้ พร้อมกัน รวมถึงวิดีโอ 2 ชั่วโมง เสียง 19 ชั่วโมง ฐานของโค้ดที่มี โค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-1.5-pro |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 2,097,152 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดด้านภาพและเสียง |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 7,200 ความยาววิดีโอสูงสุด 2 ชั่วโมง ความยาวสูงสุดของเสียง ประมาณ 19 ชั่วโมง |
ความสามารถของ |
คำสั่งของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ Live API สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
วันที่เลิกใช้งาน | กันยายน 2025 |
การอัปเดตล่าสุด | กันยายน 2024 |
Imagen 4
Imagen 4 เป็นโมเดลรูปภาพล่าสุดของเราที่สามารถสร้างรูปภาพที่มีรายละเอียดสูง พร้อมการจัดแสงที่สมบูรณ์ การแสดงข้อความที่ดีขึ้นอย่างมาก และเอาต์พุตที่มีความละเอียดสูงกว่า โมเดลก่อนหน้า
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต รูปภาพ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 480 โทเค็น (ข้อความ) รูปภาพเอาต์พุต 1 (สูงพิเศษ) |
การอัปเดตล่าสุด | มิถุนายน 2025 |
Imagen 3
Imagen 3 เป็นโมเดลเปลี่ยนข้อความเป็นรูปภาพคุณภาพสูงสุดของเรา ซึ่งสามารถสร้าง รูปภาพที่มีรายละเอียดดียิ่งขึ้น การจัดแสงที่เต็มอิ่มขึ้น และลดสิ่งรบกวนในภาพให้เหลือน้อยที่สุด เมื่อเทียบกับโมเดลก่อนหน้า
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต รูปภาพ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต ไม่มี รูปภาพเอาต์พุต สูงสุด 4 รายการ |
การอัปเดตล่าสุด | กุมภาพันธ์ 2025 |
ตัวอย่าง Veo 3
Veo 3 เวอร์ชันตัวอย่างเป็นโมเดลเปลี่ยนข้อความเป็นวิดีโอล่าสุดของเรา ซึ่งสามารถสร้าง วิดีโอที่มีรายละเอียดพร้อมเสียงในตัว ปฏิบัติตามพรอมต์ได้แม่นยำยิ่งขึ้น และควบคุมกล้องได้โดยตรง
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต วิดีโอพร้อมเสียง |
Limits |
การป้อนข้อความ 1,024 โทเค็น วิดีโอเอาต์พุต 1 |
การอัปเดตล่าสุด | กรกฎาคม 2025 |
Veo 2
Veo 2 เป็นโมเดลข้อความและรูปภาพเป็นวิดีโอคุณภาพสูงของเรา ซึ่งสามารถสร้าง วิดีโอที่มีรายละเอียด โดยจับภาพความแตกต่างทางศิลปะในพรอมต์ของคุณ
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ รูปภาพ เอาต์พุต วิดีโอ |
Limits |
การป้อนข้อความ ไม่มี อินพุตรูปภาพ ความละเอียดและสัดส่วนภาพใดก็ได้ที่มีขนาดไฟล์ไม่เกิน 20 MB วิดีโอเอาต์พุต สูงสุด 2 รายการ |
การอัปเดตล่าสุด | เมษายน 2025 |
Gemini 2.5 Flash Live
โมเดล Gemini 2.5 Flash Live ทำงานร่วมกับ Live API เพื่อเปิดใช้การโต้ตอบด้วยเสียงและวิดีโอแบบสองทางที่มีเวลาในการตอบสนองต่ำ กับ Gemini โมเดลนี้สามารถประมวลผลอินพุตข้อความ เสียง และวิดีโอ รวมถึง แสดงเอาต์พุตข้อความและเสียงได้
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-live-2.5-flash-preview |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง วิดีโอ และข้อความ เอาต์พุต ข้อความและเสียง |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ การคิด สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | มิถุนายน 2025 |
การตัดข้อมูล | มกราคม 2025 |
Gemini 2.0 Flash Live
โมเดล Gemini 2.0 Flash Live ทำงานร่วมกับ Live API เพื่อเปิดใช้การโต้ตอบด้วยเสียงและวิดีโอแบบสองทางที่มีเวลาในการตอบสนองต่ำ กับ Gemini โมเดลนี้สามารถประมวลผลอินพุตข้อความ เสียง และวิดีโอ รวมถึง แสดงเอาต์พุตข้อความและเสียงได้
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล | models/gemini-2.0-flash-live-001 |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง วิดีโอ และข้อความ เอาต์พุต ข้อความและเสียง |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 1,048,576 ขีดจำกัดโทเค็นเอาต์พุต 8,192 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกใช้ฟังก์ชัน สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำได้ การคิด สิ่งที่ทำไม่ได้ |
เวอร์ชัน |
|
การอัปเดตล่าสุด | เมษายน 2025 |
การตัดข้อมูล | สิงหาคม 2024 |
การฝัง Gemini
โมเดลการฝัง Gemini มีประสิทธิภาพ SOTA ในมิติข้อมูลที่สำคัญหลายอย่าง รวมถึงโค้ด หลายภาษา และการดึงข้อมูล
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต การฝังข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต ยืดหยุ่น รองรับ: 128 - 3072, แนะนำ: 768, 1536, 3072 |
เวอร์ชัน |
|
การอัปเดตล่าสุด | มิถุนายน 2025 |
โมเดลการฝังแบบเดิม
การฝังข้อความ (เดิม)
การฝังข้อความใช้เพื่อวัดความเกี่ยวข้องของสตริง และใช้กันอย่างแพร่หลายใน แอปพลิเคชัน AI หลายอย่าง
รายละเอียดโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสโมเดล |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต การฝังข้อความ |
[*] | ขีดจำกัดของโทเค็น
ขีดจำกัดโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768 |
[**] | ขีดจำกัดอัตราคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้ | สิ่งที่ทำไม่ได้ |
วันที่เลิกใช้งาน | มกราคม 2026 |
การอัปเดตล่าสุด | เมษายน 2024 |
ดูตัวอย่างเพื่อสำรวจความสามารถของโมเดล รูปแบบต่างๆ เหล่านี้
[*] โทเค็นเทียบเท่ากับอักขระประมาณ 4 ตัวสำหรับโมเดล Gemini โทเค็น 100 รายการ มีค่าประมาณ 60-80 คำในภาษาอังกฤษ
รูปแบบชื่อเวอร์ชันโมเดล
โมเดล Gemini มีให้ใช้งานในเวอร์ชันเสถียร ตัวอย่าง หรือทดลอง ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลต่อไปนี้รูปแบบใดรูปแบบหนึ่งเพื่อ ระบุโมเดลและเวอร์ชันที่ต้องการใช้
เสถียรล่าสุด
ชี้ไปยังเวอร์ชันที่เสถียรล่าสุดที่เผยแพร่สำหรับรุ่น รุ่นและรูปแบบที่ระบุ
หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>
เช่น gemini-2.0-flash
คงที่
ชี้ไปยังโมเดลที่เสถียรที่เฉพาะเจาะจง โดยปกติแล้วโมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้โมเดลที่เสถียรเฉพาะ
หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่น gemini-2.0-flash-001
Preview
ชี้ไปยังโมเดลเวอร์ชันตัวอย่างซึ่งอาจไม่เหมาะกับการใช้งานจริง มาพร้อมกับขีดจำกัดอัตราที่เข้มงวดกว่า แต่ก็อาจเปิดใช้การเรียกเก็บเงินได้
หากต้องการระบุเวอร์ชันตัวอย่าง ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่น gemini-2.5-pro-preview-06-05
โมเดลเวอร์ชันตัวอย่างไม่เสถียร และความพร้อมใช้งานของปลายทางโมเดลอาจมีการเปลี่ยนแปลง
ทดลอง
ชี้ไปยังโมเดลทดลองซึ่งอาจไม่เหมาะกับการใช้งานจริงและ มีขีดจำกัดอัตราที่เข้มงวดกว่า เราเปิดตัวโมเดลทดลองเพื่อรวบรวม ความคิดเห็นและส่งการอัปเดตล่าสุดให้แก่นักพัฒนาแอปอย่างรวดเร็ว
หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่น gemini-2.0-pro-exp-02-05
โมเดลทดลองไม่เสถียรและอาจมีการเปลี่ยนแปลงความพร้อมใช้งานของปลายทางโมเดล
โมเดลทดลอง
นอกจากโมเดลที่เสถียรแล้ว Gemini API ยังมีโมเดลเวอร์ชันทดลองซึ่ง อาจไม่เหมาะกับการใช้งานจริงและมีขีดจำกัดอัตราการใช้งานที่เข้มงวดกว่า
เราเปิดตัวโมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ให้ ข้อมูลอัปเดตล่าสุดแก่ผู้พัฒนาแอปอย่างรวดเร็ว และแสดงให้เห็นถึงความเร็วในการ สร้างสรรค์นวัตกรรมที่ Google การเรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จ คุณสามารถสลับโมเดลทดลองกับโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะ กลายเป็นโมเดลที่เสถียรในอนาคต
โมเดลทดลองก่อนหน้า
เมื่อมีเวอร์ชันใหม่หรือเวอร์ชันเสถียร เราจะนำโมเดลเวอร์ชันทดลองออกและแทนที่ด้วยเวอร์ชันใหม่ คุณดูโมเดลทดลองก่อนหน้าที่เราเปิดตัวได้ในส่วนต่อไปนี้พร้อมกับเวอร์ชันทดแทน
รหัสโมเดล | โมเดลฐาน | เวอร์ชันทดแทน |
---|---|---|
gemini-embedding-exp-03-07 |
การฝัง Gemini | gemini-embedding-001 |
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-05-20 |
gemini-2.0-flash-exp-image-generation |
Gemini 2.0 Flash | gemini-2.0-flash-preview-image-generation |
gemini-2.5-pro-preview-06-05 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.5-pro-preview-03-25 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.0-flash-thinking-exp-01-21 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-04-17 |
gemini-2.0-pro-exp-02-05 |
Gemini 2.0 Pro (เวอร์ชันทดลอง) | gemini-2.5-pro-preview-03-25 |
gemini-2.0-flash-exp |
Gemini 2.0 Flash | gemini-2.0-flash |
gemini-exp-1206 |
Gemini 2.0 Pro | gemini-2.0-pro-exp-02-05 |
gemini-2.0-flash-thinking-exp-1219 |
2.0 Flash Thinking ของ Gemini | gemini-2.0-flash-thinking-exp-01-21 |
gemini-exp-1121 |
Gemini | gemini-exp-1206 |
gemini-exp-1114 |
Gemini | gemini-exp-1206 |
gemini-1.5-pro-exp-0827 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-pro-exp-0801 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-flash-8b-exp-0924 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
gemini-1.5-flash-8b-exp-0827 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
ภาษาที่รองรับ
โมเดล Gemini ได้รับการฝึกให้ทำงานกับภาษาต่อไปนี้
- อาหรับ (
ar
) - เบงกาลี (
bn
) - บัลแกเรีย (
bg
) - จีนตัวย่อและตัวเต็ม (
zh
) - โครเอเชีย (
hr
) - เช็ก (
cs
) - เดนมาร์ก (
da
) - ดัตช์ (
nl
) - อังกฤษ (
en
) - เอสโตเนีย (
et
) - ฟินแลนด์ (
fi
) - ฝรั่งเศส (
fr
) - เยอรมัน (
de
) - กรีก (
el
) - ฮีบรู (
iw
) - ฮินดี (
hi
) - ฮังการี (
hu
) - อินโดนีเซีย (
id
) - อิตาลี (
it
) - ญี่ปุ่น (
ja
) - เกาหลี (
ko
) - ลัตเวีย (
lv
) - ลิทัวเนีย (
lt
) - นอร์เวย์ (
no
) - โปแลนด์ (
pl
) - โปรตุเกส (
pt
) - โรมาเนีย (
ro
) - รัสเซีย (
ru
) - เซอร์เบีย (
sr
) - สโลวัก (
sk
) - สโลวีเนีย (
sl
) - สเปน (
es
) - สวาฮีลี (
sw
) - สวีเดน (
sv
) - ไทย (
th
) - ตุรกี (
tr
) - ยูเครน (
uk
) - เวียดนาม (
vi
)