รูปแบบของ Gemini

โมเดลย่อย

Gemini API มีโมเดลต่างๆ ที่ได้รับการเพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมโดยย่อของโมเดล Gemini ที่พร้อมใช้งานมีดังนี้

รุ่นย่อยของโมเดล อินพุต เอาต์พุต เพิ่มประสิทธิภาพสำหรับ
Gemini 2.5 Pro
gemini-2.5-pro
เสียง รูปภาพ วิดีโอ ข้อความ และ PDF ข้อความ การคิดและการให้เหตุผลที่ได้รับการปรับปรุง ความเข้าใจแบบหลายโมดัล การเขียนโค้ดขั้นสูง และอื่นๆ
Gemini 2.5 Flash
gemini-2.5-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ การคิดแบบปรับตัว ประสิทธิภาพค่าใช้จ่าย
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
ข้อความ, รูปภาพ, วิดีโอ, เสียง ข้อความ โมเดลที่คุ้มค่าที่สุดซึ่งรองรับปริมาณงานสูง
เสียงดั้งเดิมของ Gemini 2.5 Flash
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog
เสียง วิดีโอ และข้อความ ข้อความและเสียงที่สลับกัน เอาต์พุตเสียงสนทนาที่เป็นธรรมชาติและมีคุณภาพสูง ไม่ว่าจะมีการคิดหรือไม่ก็ตาม
TTS ของ Gemini 2.5 Flash เวอร์ชันตัวอย่าง
gemini-2.5-flash-preview-tts
ข้อความ เสียง การสร้างเสียงอ่านออกเสียงข้อความแบบลำโพงเดี่ยวและหลายลำโพงที่ควบคุมได้และมีเวลาในการตอบสนองต่ำ
TTS ของ Gemini 2.5 Pro เวอร์ชันตัวอย่าง
gemini-2.5-pro-preview-tts
ข้อความ เสียง การสร้างเสียงอ่านออกเสียงข้อความแบบลำโพงเดี่ยวและหลายลำโพงที่ควบคุมได้และมีเวลาในการตอบสนองต่ำ
Gemini 2.0 Flash
gemini-2.0-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ ฟีเจอร์รุ่นใหม่ ความเร็ว และการสตรีมแบบเรียลไทม์
การสร้างรูปภาพเวอร์ชันตัวอย่างของ Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ รูปภาพ การสร้างและแก้ไขรูปภาพแบบสนทนา
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ ความคุ้มค่าและเวลาในการตอบสนองต่ำ
Gemini 1.5 Flash
gemini-1.5-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ ประสิทธิภาพที่รวดเร็วและหลากหลายในงานต่างๆ
เลิกใช้งานแล้ว
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานที่มีปริมาณมากและมีระดับความซับซ้อนต่ำ
เลิกใช้งานแล้ว
Gemini 1.5 Pro
gemini-1.5-pro
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานการให้เหตุผลที่ซับซ้อนซึ่งต้องใช้สติปัญญามากขึ้น
เลิกใช้งานแล้ว
การฝัง Gemini
gemini-embedding-001
ข้อความ การฝังข้อความ การวัดความเกี่ยวข้องของสตริงข้อความ
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06
ข้อความ รูปภาพ โมเดลการสร้างรูปภาพที่อัปเดตล่าสุดของเรา
Imagen 3
imagen-3.0-generate-002
ข้อความ รูปภาพ โมเดลการสร้างรูปภาพคุณภาพสูง
ตัวอย่าง Veo 3
veo-3.0-generate-preview
ข้อความ วิดีโอพร้อมเสียง การสร้างวิดีโอคุณภาพสูงพร้อมเอฟเฟกต์เสียง เสียงรอบข้าง และบทสนทนา
Veo 2
veo-2.0-generate-001
ข้อความ รูปภาพ วิดีโอ การสร้างวิดีโอคุณภาพสูง
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview
เสียง วิดีโอ และข้อความ ข้อความ เสียง การโต้ตอบด้วยเสียงและวิดีโอแบบ 2 ทางที่มีเวลาในการตอบสนองต่ำ
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
เสียง วิดีโอ และข้อความ ข้อความ เสียง การโต้ตอบด้วยเสียงและวิดีโอแบบ 2 ทางที่มีเวลาในการตอบสนองต่ำ

คุณดูขีดจํากัดอัตราสําหรับแต่ละโมเดลได้ในหน้าขีดจํากัดอัตรา

Gemini 2.5 Pro

Gemini 2.5 Pro เป็นโมเดลการคิดที่ล้ำสมัยของเรา ซึ่งสามารถให้เหตุผลเกี่ยวกับปัญหาที่ซับซ้อนในโค้ด คณิตศาสตร์ และ STEM รวมถึงวิเคราะห์ชุดข้อมูล ฐานของโค้ด และเอกสารขนาดใหญ่โดยใช้บริบทแบบยาว

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-2.5-pro
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ ข้อความ และ PDF

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

65,536

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำไม่ได้

Live API

สิ่งที่ทำไม่ได้

การคิด

สิ่งที่ทำได้

โหมดแบทช์

สิ่งที่ทำได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • Stable: gemini-2.5-pro
การอัปเดตล่าสุด มิถุนายน 2025
การตัดข้อมูล มกราคม 2025

Gemini 2.5 Flash

โมเดลที่ดีที่สุดของเราในแง่ของราคาต่อประสิทธิภาพ ซึ่งมีความสามารถรอบด้าน 2.5 Flash เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ เวลาในการตอบสนองต่ำ งานที่มีปริมาณมากซึ่งต้องใช้ความคิด และ Use Case ของเอเจนต์

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.5-flash
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ รูปภาพ วิดีโอ เสียง

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

65,536

ความสามารถของ

การสร้างเสียง

สิ่งที่ทำไม่ได้

การแคช

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำได้

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การคิด

สิ่งที่ทำได้

โหมดแบทช์

สิ่งที่ทำได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • เสถียร: gemini-2.5-flash
  • ตัวอย่าง: gemini-2.5-flash-preview-05-20
การอัปเดตล่าสุด มิถุนายน 2025
การตัดข้อมูล มกราคม 2025

Gemini 2.5 Flash-Lite

โมเดล Gemini 2.5 Flash ที่ได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่าและปริมาณงานสูง

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.5-flash-lite
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ, รูปภาพ, วิดีโอ, เสียง, PDF

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

65,536

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

บริบท URL

สิ่งที่ทำได้

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำไม่ได้

Live API

สิ่งที่ทำไม่ได้

การคิด

สิ่งที่ทำได้

โหมดแบทช์

สิ่งที่ทำได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • เสถียร: gemini-2.5-flash-lite
  • ตัวอย่าง: gemini-2.5-flash-lite-06-17
การอัปเดตล่าสุด กรกฎาคม 2025
การตัดข้อมูล มกราคม 2025

เสียงเนทีฟของ Gemini 2.5 Flash

โมเดลบทสนทนาเสียงแบบเนทีฟของเราที่มีและไม่มีการคิด ซึ่งพร้อมใช้งานผ่าน Live API โมเดลเหล่านี้มอบ ประสบการณ์การสนทนาแบบอินเทอร์แอกทีฟและไม่มีโครงสร้าง พร้อมด้วยการ แจ้งสไตล์และการควบคุม

ลองใช้เสียงแบบเนทีฟใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.5-flash-preview-native-audio-dialog &
models/gemini-2.5-flash-exp-native-audio-thinking-dialog
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง วิดีโอ ข้อความ

เอาต์พุต

เสียงและข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

128,000

ขีดจำกัดโทเค็นเอาต์พุต

8,000

ความสามารถของ

การสร้างเสียง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การรันโค้ด

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำได้

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำไม่ได้

การคิด

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ตัวอย่าง: gemini-2.5-flash-preview-05-20
  • ทดลอง: gemini-2.5-flash-exp-native-audio-thinking-dialog
การอัปเดตล่าสุด พฤษภาคม 2025
การตัดข้อมูล มกราคม 2025

การอ่านออกเสียงข้อความของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)

TTS ของ Gemini 2.5 Flash Preview เป็นโมเดลแปลงข้อความเป็นคำพูดที่คุ้มค่า ซึ่งให้การควบคุมและความโปร่งใสสูงสำหรับเวิร์กโฟลว์ที่มีโครงสร้าง เช่น การสร้างพอดแคสต์ หนังสือเสียง การสนับสนุนลูกค้า และอื่นๆ ขีดจำกัดอัตราของ Gemini 2.5 Flash จะถูกจำกัดมากกว่าเนื่องจากเป็นโมเดลทดลอง / โมเดลเวอร์ชันตัวอย่าง

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.5-flash-preview-tts
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

เสียง

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

8,000

ขีดจำกัดโทเค็นเอาต์พุต

16,000

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำไม่ได้

การแคช

สิ่งที่ทำไม่ได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำไม่ได้

การรันโค้ด

สิ่งที่ทำไม่ได้

ค้นหา

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำได้

Live API

สิ่งที่ทำไม่ได้

การคิด

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • gemini-2.5-flash-preview-tts
การอัปเดตล่าสุด พฤษภาคม 2025

การอ่านออกเสียงข้อความของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)

TTS ของ Gemini 2.5 Pro เวอร์ชันตัวอย่างคือโมเดลแปลงข้อความเป็นคำพูดที่ทรงพลังที่สุดของเรา ซึ่งให้การควบคุมและความโปร่งใสสูงสำหรับเวิร์กโฟลว์ที่มีโครงสร้าง เช่น การสร้างพอดแคสต์ หนังสือเสียง การสนับสนุนลูกค้า และอื่นๆ ขีดจำกัดอัตราของ Gemini 2.5 Pro จะถูกจำกัดมากกว่าเนื่องจากเป็นโมเดลเวอร์ชันทดลอง / ตัวอย่าง

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.5-pro-preview-tts
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

เสียง

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

8,000

ขีดจำกัดโทเค็นเอาต์พุต

16,000

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำไม่ได้

การแคช

สิ่งที่ทำไม่ได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำไม่ได้

การรันโค้ด

สิ่งที่ทำไม่ได้

ค้นหา

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำได้

Live API

สิ่งที่ทำไม่ได้

การคิด

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • gemini-2.5-pro-preview-tts
การอัปเดตล่าสุด พฤษภาคม 2025

Gemini 2.0 Flash

Gemini 2.0 Flash มาพร้อมฟีเจอร์รุ่นถัดไปและความสามารถที่ดียิ่งขึ้น รวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือแบบเนทีฟ และหน้าต่างบริบทขนาด 1 ล้านโทเค็น

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.0-flash
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

ค้นหา

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำไม่ได้

Live API

สิ่งที่ทำได้

การคิด

ทดลอง

โหมดแบทช์

สิ่งที่ทำได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ล่าสุด: gemini-2.0-flash
  • เสถียร: gemini-2.0-flash-001
  • ทดลอง: gemini-2.0-flash-exp
การอัปเดตล่าสุด กุมภาพันธ์ 2025
การตัดข้อมูล สิงหาคม 2024

การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)

การสร้างรูปภาพตัวอย่างของ Gemini 2.0 Flash จะมอบฟีเจอร์การสร้างรูปภาพที่ได้รับการปรับปรุง ซึ่งรวมถึงการสร้างและแก้ไขรูปภาพในลักษณะการสนทนา

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.0-flash-preview-image-generation
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความและรูปภาพ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

32,000

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำไม่ได้

การรันโค้ด

ไม่รองรับ

ค้นหา

ไม่รองรับ

การสร้างรูปภาพ

สิ่งที่ทำได้

การสร้างเสียง

สิ่งที่ทำไม่ได้

Live API

ไม่รองรับ

การคิด

ไม่รองรับ

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ตัวอย่าง: gemini-2.0-flash-preview-image-generation
  • ขณะนี้ยังไม่รองรับ gemini-2.0-flash-preview-image-generation ในหลายประเทศในยุโรป ตะวันออกกลาง และแอฟริกา

การอัปเดตล่าสุด พฤษภาคม 2025
การตัดข้อมูล สิงหาคม 2024

Gemini 2.0 Flash-Lite

โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อความคุ้มค่าและเวลาในการตอบสนองที่ต่ำ

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.0-flash-lite
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำไม่ได้

ค้นหา

สิ่งที่ทำไม่ได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำไม่ได้

Live API

สิ่งที่ทำไม่ได้

Batch API

สิ่งที่ทำได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ล่าสุด: gemini-2.0-flash-lite
  • เสถียร: gemini-2.0-flash-lite-001
การอัปเดตล่าสุด กุมภาพันธ์ 2025
การตัดข้อมูล สิงหาคม 2024

Gemini 1.5 Flash

Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดใน งานที่หลากหลาย

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-1.5-flash
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดด้านภาพและเสียง

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวสูงสุดของเสียง

ประมาณ 9.5 ชั่วโมง

ความสามารถของ

คำสั่งของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

Live API

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ล่าสุด: gemini-1.5-flash-latest
  • เวอร์ชันเสถียรล่าสุด: gemini-1.5-flash
  • เสถียร:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
วันที่เลิกใช้งาน กันยายน 2025
การอัปเดตล่าสุด กันยายน 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้สติปัญญาต่ำ

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-1.5-flash-8b
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดด้านภาพและเสียง

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวสูงสุดของเสียง

ประมาณ 9.5 ชั่วโมง

ความสามารถของ

คำสั่งของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

Live API

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ล่าสุด: gemini-1.5-flash-8b-latest
  • เวอร์ชันเสถียรล่าสุด: gemini-1.5-flash-8b
  • เสถียร:
    • gemini-1.5-flash-8b-001
วันที่เลิกใช้งาน กันยายน 2025
การอัปเดตล่าสุด ตุลาคม 2024

Gemini 1.5 Pro

ลองใช้ Gemini 2.5 Pro เวอร์ชันตัวอย่าง ซึ่งเป็นโมเดล Gemini ที่ล้ำหน้าที่สุดของเราในปัจจุบัน

Gemini 1.5 Pro เป็นโมเดลมัลติโมดัลขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับ งานการให้เหตุผลที่หลากหลาย 1.5 Pro ประมวลผลข้อมูลจำนวนมากได้ พร้อมกัน รวมถึงวิดีโอ 2 ชั่วโมง เสียง 19 ชั่วโมง ฐานของโค้ดที่มี โค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-1.5-pro
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

2,097,152

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดด้านภาพและเสียง

จำนวนรูปภาพสูงสุดต่อพรอมต์

7,200

ความยาววิดีโอสูงสุด

2 ชั่วโมง

ความยาวสูงสุดของเสียง

ประมาณ 19 ชั่วโมง

ความสามารถของ

คำสั่งของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

Live API

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ล่าสุด: gemini-1.5-pro-latest
  • เวอร์ชันเสถียรล่าสุด: gemini-1.5-pro
  • เสถียร:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
วันที่เลิกใช้งาน กันยายน 2025
การอัปเดตล่าสุด กันยายน 2024

Imagen 4

Imagen 4 เป็นโมเดลรูปภาพล่าสุดของเราที่สามารถสร้างรูปภาพที่มีรายละเอียดสูง พร้อมการจัดแสงที่สมบูรณ์ การแสดงข้อความที่ดีขึ้นอย่างมาก และเอาต์พุตที่มีความละเอียดสูงกว่า โมเดลก่อนหน้า

รายละเอียดโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

รูปภาพ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

480 โทเค็น (ข้อความ)

รูปภาพเอาต์พุต

1 (สูงพิเศษ)
1 ถึง 4 (มาตรฐาน)

การอัปเดตล่าสุด มิถุนายน 2025

Imagen 3

Imagen 3 เป็นโมเดลเปลี่ยนข้อความเป็นรูปภาพคุณภาพสูงสุดของเรา ซึ่งสามารถสร้าง รูปภาพที่มีรายละเอียดดียิ่งขึ้น การจัดแสงที่เต็มอิ่มขึ้น และลดสิ่งรบกวนในภาพให้เหลือน้อยที่สุด เมื่อเทียบกับโมเดลก่อนหน้า

รายละเอียดโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

imagen-3.0-generate-002

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

รูปภาพ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

ไม่มี

รูปภาพเอาต์พุต

สูงสุด 4 รายการ

การอัปเดตล่าสุด กุมภาพันธ์ 2025

ตัวอย่าง Veo 3

Veo 3 เวอร์ชันตัวอย่างเป็นโมเดลเปลี่ยนข้อความเป็นวิดีโอล่าสุดของเรา ซึ่งสามารถสร้าง วิดีโอที่มีรายละเอียดพร้อมเสียงในตัว ปฏิบัติตามพรอมต์ได้แม่นยำยิ่งขึ้น และควบคุมกล้องได้โดยตรง

ลองใช้ Veo 3

รายละเอียดโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

veo-3.0-generate-preview

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

วิดีโอพร้อมเสียง

Limits

การป้อนข้อความ

1,024 โทเค็น

วิดีโอเอาต์พุต

1

การอัปเดตล่าสุด กรกฎาคม 2025

Veo 2

Veo 2 เป็นโมเดลข้อความและรูปภาพเป็นวิดีโอคุณภาพสูงของเรา ซึ่งสามารถสร้าง วิดีโอที่มีรายละเอียด โดยจับภาพความแตกต่างทางศิลปะในพรอมต์ของคุณ

รายละเอียดโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

veo-2.0-generate-001

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ รูปภาพ

เอาต์พุต

วิดีโอ

Limits

การป้อนข้อความ

ไม่มี

อินพุตรูปภาพ

ความละเอียดและสัดส่วนภาพใดก็ได้ที่มีขนาดไฟล์ไม่เกิน 20 MB

วิดีโอเอาต์พุต

สูงสุด 2 รายการ

การอัปเดตล่าสุด เมษายน 2025

Gemini 2.5 Flash Live

โมเดล Gemini 2.5 Flash Live ทำงานร่วมกับ Live API เพื่อเปิดใช้การโต้ตอบด้วยเสียงและวิดีโอแบบสองทางที่มีเวลาในการตอบสนองต่ำ กับ Gemini โมเดลนี้สามารถประมวลผลอินพุตข้อความ เสียง และวิดีโอ รวมถึง แสดงเอาต์พุตข้อความและเสียงได้

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-live-2.5-flash-preview
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง วิดีโอ และข้อความ

เอาต์พุต

ข้อความและเสียง

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

ค้นหา

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำได้

การคิด

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ตัวอย่าง: gemini-live-2.5-flash-preview
การอัปเดตล่าสุด มิถุนายน 2025
การตัดข้อมูล มกราคม 2025

Gemini 2.0 Flash Live

โมเดล Gemini 2.0 Flash Live ทำงานร่วมกับ Live API เพื่อเปิดใช้การโต้ตอบด้วยเสียงและวิดีโอแบบสองทางที่มีเวลาในการตอบสนองต่ำ กับ Gemini โมเดลนี้สามารถประมวลผลอินพุตข้อความ เสียง และวิดีโอ รวมถึง แสดงเอาต์พุตข้อความและเสียงได้

ลองใช้ใน Google AI Studio

รายละเอียดโมเดล

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล models/gemini-2.0-flash-live-001
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง วิดีโอ และข้อความ

เอาต์พุต

ข้อความและเสียง

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

1,048,576

ขีดจำกัดโทเค็นเอาต์พุต

8,192

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

ค้นหา

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำได้

การคิด

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • ตัวอย่าง: gemini-2.0-flash-live-001
การอัปเดตล่าสุด เมษายน 2025
การตัดข้อมูล สิงหาคม 2024

การฝัง Gemini

โมเดลการฝัง Gemini มีประสิทธิภาพ SOTA ในมิติข้อมูลที่สำคัญหลายอย่าง รวมถึงโค้ด หลายภาษา และการดึงข้อมูล

รายละเอียดโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

gemini-embedding-001

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

การฝังข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

ยืดหยุ่น รองรับ: 128 - 3072, แนะนำ: 768, 1536, 3072

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • เสถียร: gemini-embedding-001
  • ตัวอย่าง: gemini-embedding-exp-03-07
การอัปเดตล่าสุด มิถุนายน 2025

โมเดลการฝังแบบเดิม

การฝังข้อความ (เดิม)

การฝังข้อความใช้เพื่อวัดความเกี่ยวข้องของสตริง และใช้กันอย่างแพร่หลายใน แอปพลิเคชัน AI หลายอย่าง

รายละเอียดโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

models/text-embedding-004

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

การฝังข้อความ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

768

ขีดจำกัดอัตรา[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำไม่ได้
วันที่เลิกใช้งาน มกราคม 2026
การอัปเดตล่าสุด เมษายน 2024

ดูตัวอย่างเพื่อสำรวจความสามารถของโมเดล รูปแบบต่างๆ เหล่านี้

[*] โทเค็นเทียบเท่ากับอักขระประมาณ 4 ตัวสำหรับโมเดล Gemini โทเค็น 100 รายการ มีค่าประมาณ 60-80 คำในภาษาอังกฤษ

รูปแบบชื่อเวอร์ชันโมเดล

โมเดล Gemini มีให้ใช้งานในเวอร์ชันเสถียร ตัวอย่าง หรือทดลอง ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลต่อไปนี้รูปแบบใดรูปแบบหนึ่งเพื่อ ระบุโมเดลและเวอร์ชันที่ต้องการใช้

เสถียรล่าสุด

ชี้ไปยังเวอร์ชันที่เสถียรล่าสุดที่เผยแพร่สำหรับรุ่น รุ่นและรูปแบบที่ระบุ

หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation> เช่น gemini-2.0-flash

คงที่

ชี้ไปยังโมเดลที่เสถียรที่เฉพาะเจาะจง โดยปกติแล้วโมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้โมเดลที่เสถียรเฉพาะ

หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-2.0-flash-001

Preview

ชี้ไปยังโมเดลเวอร์ชันตัวอย่างซึ่งอาจไม่เหมาะกับการใช้งานจริง มาพร้อมกับขีดจำกัดอัตราที่เข้มงวดกว่า แต่ก็อาจเปิดใช้การเรียกเก็บเงินได้

หากต้องการระบุเวอร์ชันตัวอย่าง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-2.5-pro-preview-06-05

โมเดลเวอร์ชันตัวอย่างไม่เสถียร และความพร้อมใช้งานของปลายทางโมเดลอาจมีการเปลี่ยนแปลง

ทดลอง

ชี้ไปยังโมเดลทดลองซึ่งอาจไม่เหมาะกับการใช้งานจริงและ มีขีดจำกัดอัตราที่เข้มงวดกว่า เราเปิดตัวโมเดลทดลองเพื่อรวบรวม ความคิดเห็นและส่งการอัปเดตล่าสุดให้แก่นักพัฒนาแอปอย่างรวดเร็ว

หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-2.0-pro-exp-02-05

โมเดลทดลองไม่เสถียรและอาจมีการเปลี่ยนแปลงความพร้อมใช้งานของปลายทางโมเดล

โมเดลทดลอง

นอกจากโมเดลที่เสถียรแล้ว Gemini API ยังมีโมเดลเวอร์ชันทดลองซึ่ง อาจไม่เหมาะกับการใช้งานจริงและมีขีดจำกัดอัตราการใช้งานที่เข้มงวดกว่า

เราเปิดตัวโมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ให้ ข้อมูลอัปเดตล่าสุดแก่ผู้พัฒนาแอปอย่างรวดเร็ว และแสดงให้เห็นถึงความเร็วในการ สร้างสรรค์นวัตกรรมที่ Google การเรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จ คุณสามารถสลับโมเดลทดลองกับโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะ กลายเป็นโมเดลที่เสถียรในอนาคต

โมเดลทดลองก่อนหน้า

เมื่อมีเวอร์ชันใหม่หรือเวอร์ชันเสถียร เราจะนำโมเดลเวอร์ชันทดลองออกและแทนที่ด้วยเวอร์ชันใหม่ คุณดูโมเดลทดลองก่อนหน้าที่เราเปิดตัวได้ในส่วนต่อไปนี้พร้อมกับเวอร์ชันทดแทน

รหัสโมเดล โมเดลฐาน เวอร์ชันทดแทน
gemini-embedding-exp-03-07 การฝัง Gemini gemini-embedding-001
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash gemini-2.5-flash-preview-05-20
gemini-2.0-flash-exp-image-generation Gemini 2.0 Flash gemini-2.0-flash-preview-image-generation
gemini-2.5-pro-preview-06-05 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-03-25 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro (เวอร์ชันทดลอง) gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 2.0 Flash Thinking ของ Gemini gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

ภาษาที่รองรับ

โมเดล Gemini ได้รับการฝึกให้ทำงานกับภาษาต่อไปนี้

  • อาหรับ (ar)
  • เบงกาลี (bn)
  • บัลแกเรีย (bg)
  • จีนตัวย่อและตัวเต็ม (zh)
  • โครเอเชีย (hr)
  • เช็ก (cs)
  • เดนมาร์ก (da)
  • ดัตช์ (nl)
  • อังกฤษ (en)
  • เอสโตเนีย (et)
  • ฟินแลนด์ (fi)
  • ฝรั่งเศส (fr)
  • เยอรมัน (de)
  • กรีก (el)
  • ฮีบรู (iw)
  • ฮินดี (hi)
  • ฮังการี (hu)
  • อินโดนีเซีย (id)
  • อิตาลี (it)
  • ญี่ปุ่น (ja)
  • เกาหลี (ko)
  • ลัตเวีย (lv)
  • ลิทัวเนีย (lt)
  • นอร์เวย์ (no)
  • โปแลนด์ (pl)
  • โปรตุเกส (pt)
  • โรมาเนีย (ro)
  • รัสเซีย (ru)
  • เซอร์เบีย (sr)
  • สโลวัก (sk)
  • สโลวีเนีย (sl)
  • สเปน (es)
  • สวาฮีลี (sw)
  • สวีเดน (sv)
  • ไทย (th)
  • ตุรกี (tr)
  • ยูเครน (uk)
  • เวียดนาม (vi)