Veo 3 พร้อมให้ใช้งานแล้วใน Gemini API ดูข้อมูลเพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

บันทึกประจำรุ่น

หน้านี้มีบันทึกการอัปเดตของ Gemini API

22 กรกฎาคม 2025

เปิดตัว gemini-2.5-flash-lite โมเดล Gemini 2.5 ที่รวดเร็ว ต้นทุนต่ำ และมีประสิทธิภาพสูง ดูข้อมูลเพิ่มเติมได้ที่ Gemini 2.5 Flash-Lite

17 กรกฎาคม 2025

เปิดตัวเมื่อวันที่ veo-3.0-generate-preview การอัปเดตล่าสุดของ Veo ที่มาพร้อม การสร้างวิดีโอพร้อมเสียง ดูข้อมูลเพิ่มเติมเกี่ยวกับ Veo 3 ได้ที่หน้ารุ่น
เพิ่มขีดจำกัดอัตราการใช้งานสำหรับ Imagen 4 Standard และ Ultra ดูรายละเอียดเพิ่มเติมได้ที่หน้าการจำกัดอัตรา

14 กรกฎาคม 2025

เปิดตัว gemini-embedding-001 โมเดลการฝังข้อความเวอร์ชันเสถียร ดูข้อมูลเพิ่มเติมได้ที่การฝัง gemini-embedding-exp-03-07 เราจะเลิกใช้งานโมเดลในวันที่ 14 สิงหาคม 2025

7 กรกฎาคม 2025

เปิดตัวโหมดกลุ่มของ Gemini API จัดกลุ่มคำขอและส่งไปประมวลผล แบบไม่พร้อมกัน ดูข้อมูลเพิ่มเติมได้ที่โหมดกลุ่ม

26 มิถุนายน 2025

ตอนนี้โมเดลเวอร์ชันตัวอย่าง gemini-2.5-pro-preview-05-06 และ gemini-2.5-pro-preview-03-25 จะเปลี่ยนเส้นทางไปยัง เวอร์ชันล่าสุดที่เสถียร gemini-2.5-pro
gemini-2.5-pro-exp-03-25 เลิกใช้งานแล้ว

24 มิถุนายน 2025

เปิดตัวโมเดล Imagen 4 Ultra และ Standard Preview ดูข้อมูลเพิ่มเติมได้ที่หน้าการสร้างรูปภาพ

17 มิถุนายน 2025

เราได้เปิดตัว gemini-2.5-pro ซึ่งเป็นเวอร์ชันเสถียรของโมเดลที่ทรงพลังที่สุด พร้อมด้วยการคิดเชิงปรับตัว ดูข้อมูลเพิ่มเติมได้ที่ Gemini 2.5 Pro และการคิด gemini-2.5-pro-preview-05-06 จะเปลี่ยนเส้นทางไปยัง gemini-2.5-pro ในวันที่ 26 มิถุนายน 2025
เปิดตัว gemini-2.5-flash โมเดล 2.5 Flash ที่เสถียรตัวแรกของเรา ดูข้อมูลเพิ่มเติมได้ที่ Gemini 2.5 Flash gemini-2.5-flash-preview-04-17 จะเลิกใช้งานในวันที่ 15 กรกฎาคม 2025
เปิดตัว gemini-2.5-flash-lite-preview-06-17 โมเดล Gemini 2.5 ที่มีต้นทุนต่ำและประสิทธิภาพสูง ดูข้อมูลเพิ่มเติมได้ที่เวอร์ชันตัวอย่างของ Gemini 2.5 Flash-Lite

5 มิถุนายน 2025

เปิดตัว gemini-2.5-pro-preview-06-05 ซึ่งเป็นโมเดลเวอร์ชันใหม่ที่ทรงพลังที่สุดของเรา ซึ่งมาพร้อมการคิดแบบปรับเปลี่ยนได้ ดูข้อมูลเพิ่มเติมได้ที่ ตัวอย่าง Gemini 2.5 Pro และการคิด ระบบจะเปลี่ยนเส้นทาง gemini-2.5-pro-preview-05-06 ไปยัง gemini-2.5-pro ในวันที่ 26 มิถุนายน 2025

20 พฤษภาคม 2025

การอัปเดต API:

เปิดตัวการรองรับ การประมวลผลวิดีโอก่อนแสดงผลที่กำหนดเอง โดยใช้ช่วงการตัดและอัตราการสุ่มตัวอย่างเฟรมที่กำหนดค่าได้
เปิดตัวการใช้เครื่องมือหลายอย่าง ซึ่งรองรับการกำหนดค่าการเรียกใช้โค้ดและการอ้างอิงจาก Google Search ในgenerateContentคำขอเดียวกัน
เปิดตัวการรองรับ การเรียกใช้ฟังก์ชันแบบไม่พร้อมกัน ใน Live API
เปิดตัวเครื่องมือบริบท URL เวอร์ชันทดลอง เพื่อระบุ URL เป็นบริบทเพิ่มเติมในพรอมต์

การอัปเดตโมเดล:

เปิดตัว gemini-2.5-flash-preview-05-20 โมเดลเวอร์ชันตัวอย่างของ Gemini ที่เพิ่มประสิทธิภาพเพื่อ ประสิทธิภาพด้านราคาและการคิดแบบปรับเปลี่ยนได้ ดูข้อมูลเพิ่มเติมได้ที่ ตัวอย่าง Gemini 2.5 Flash และการคิด
เปิดตัวโมเดล gemini-2.5-pro-preview-tts และ gemini-2.5-flash-preview-tts ซึ่งสามารถสร้างคำพูดจากผู้พูด 1 หรือ 2 คน
เปิดตัวโมเดล lyria-realtime-exp ซึ่งสร้างเพลงแบบเรียลไทม์
เปิดตัว gemini-2.5-flash-preview-native-audio-dialog และ gemini-2.5-flash-exp-native-audio-thinking-dialog โมเดล Gemini ใหม่สำหรับ Live API ที่มีความสามารถในการแสดงผลเสียงแบบเนทีฟ ดูข้อมูลเพิ่มเติมได้ที่คู่มือ Live API และเสียงเนทีฟของ Gemini 2.5 Flash
เปิดตัวgemma-3n-e4b-itเวอร์ชันตัวอย่างที่พร้อมใช้งานใน AI Studio และผ่าน Gemini API ซึ่งเป็นส่วนหนึ่งของการเปิดตัว Gemma 3n

7 พฤษภาคม 2025

เปิดตัว gemini-2.0-flash-preview-image-generation โมเดลเวอร์ชันตัวอย่างสำหรับ การสร้างและแก้ไขรูปภาพ ดูข้อมูลเพิ่มเติมได้ที่การสร้างรูปภาพและการสร้างรูปภาพตัวอย่างของ Gemini 2.0 Flash

6 พฤษภาคม 2025

เปิดตัว gemini-2.5-pro-preview-05-06 โมเดลเวอร์ชันใหม่ที่ทรงพลังที่สุดของเรา พร้อมการปรับปรุงด้านโค้ดและการเรียกใช้ฟังก์ชัน gemini-2.5-pro-preview-03-25 จะชี้ไปยังโมเดลเวอร์ชันใหม่โดยอัตโนมัติ

17 เมษายน 2025

เปิดตัว gemini-2.5-flash-preview-04-17 โมเดลเวอร์ชันตัวอย่างของ Gemini ที่เพิ่มประสิทธิภาพเพื่อ ประสิทธิภาพด้านราคาและการคิดแบบปรับเปลี่ยนได้ ดูข้อมูลเพิ่มเติมได้ที่ ตัวอย่าง Gemini 2.5 Flash และการคิด

16 เมษายน 2025

เปิดตัวการแคชบริบทสำหรับ Gemini 2.0 Flash

9 เมษายน 2025

การอัปเดตโมเดล:

เปิดตัว veo-2.0-generate-001 โมเดลข้อความและรูปภาพเป็นวิดีโอที่พร้อมให้บริการแก่บุคคลทั่วไป (GA) ซึ่งสามารถสร้างวิดีโอที่มีรายละเอียดและมีความแตกต่างทางศิลปะ ดูข้อมูลเพิ่มเติมได้ที่เอกสารของ Veo
เปิดตัว gemini-2.0-flash-live-001 ซึ่งเป็นเวอร์ชันตัวอย่างแบบสาธารณะของโมเดล Live API ที่เปิดใช้การเรียกเก็บเงิน
- การจัดการเซสชันและความน่าเชื่อถือที่ดียิ่งขึ้น
  - การกลับมาใช้เซสชันต่อ: ทำให้เซสชันยังคงใช้งานได้แม้เครือข่ายจะหยุดชะงักชั่วคราว ตอนนี้ API รองรับการจัดเก็บสถานะเซสชันฝั่งเซิร์ฟเวอร์ (นานสูงสุด 24 ชั่วโมง) และมีแฮนเดิล (session_resumption) เพื่อเชื่อมต่ออีกครั้งและดำเนินการต่อจากจุดที่ค้างไว้
  - เซสชันที่ยาวขึ้นผ่านการบีบอัดบริบท: เปิดใช้การโต้ตอบที่ยาวขึ้นโดยไม่จำกัดเวลาเหมือนที่ผ่านมา กำหนดค่าการบีบอัดหน้าต่างบริบท ด้วยกลไกหน้าต่างเลื่อนเพื่อจัดการความยาวบริบท โดยอัตโนมัติ ซึ่งจะช่วยป้องกันการสิ้นสุดอย่างกะทันหันเนื่องจากขีดจำกัดบริบท
  - การแจ้งเตือนการยกเลิกการเชื่อมต่ออย่างราบรื่น: รับข้อความGoAwayเซิร์ฟเวอร์ ที่ระบุเวลาที่การเชื่อมต่อกำลังจะปิด เพื่อให้จัดการได้อย่างราบรื่นก่อนสิ้นสุด
- ควบคุมการโต้ตอบได้มากขึ้น
- การตรวจหาการพูด (VAD) ที่กำหนดค่าได้: เลือกความไว หรือปิดใช้ VAD อัตโนมัติทั้งหมด แล้วใช้เหตุการณ์ไคลเอ็นต์ใหม่ (activityStart, activityEnd) เพื่อควบคุมการเปิด/ปิดด้วยตนเอง
- การจัดการการหยุดชะงักที่กำหนดค่าได้: กำหนดว่าอินพุตของผู้ใช้ ควรขัดจังหวะการตอบกลับของโมเดลหรือไม่
- ความครอบคลุมของผลัดที่กำหนดค่าได้: เลือกว่า API จะประมวลผลอินพุตเสียงและวิดีโอทั้งหมดอย่างต่อเนื่อง หรือจะบันทึกเฉพาะเมื่อตรวจพบว่าผู้ใช้ปลายทางกำลังพูด
- ความละเอียดของสื่อที่กำหนดค่าได้: เพิ่มประสิทธิภาพเพื่อคุณภาพหรือการใช้โทเค็น โดยเลือกความละเอียดสำหรับสื่ออินพุต
- เอาต์พุตและฟีเจอร์ที่สมบูรณ์ยิ่งขึ้น
- ตัวเลือกเสียงและภาษาที่เพิ่มขึ้น: เลือกจากเสียงใหม่ 2 แบบและภาษาใหม่ 30 ภาษาสำหรับเอาต์พุตเสียง ตอนนี้คุณกำหนดค่าภาษาเอาต์พุตได้ภายใน speechConfig แล้ว
- การสตรีมข้อความ: รับการตอบกลับเป็นข้อความทีละรายการขณะที่ระบบสร้างข้อความ เพื่อให้แสดงต่อผู้ใช้ได้เร็วขึ้น
- การรายงานการใช้โทเค็น: รับข้อมูลเชิงลึกเกี่ยวกับการใช้งานด้วยจำนวนโทเค็นโดยละเอียดที่ระบุในฟิลด์ usageMetadata ของข้อความเซิร์ฟเวอร์ ซึ่งแบ่งตามรูปแบบและเฟสของพรอมต์หรือการตอบกลับ

4 เมษายน 2025

เปิดตัว gemini-2.5-pro-preview-03-25 เวอร์ชันตัวอย่างแบบสาธารณะของ Gemini 2.5 Pro พร้อมเปิดใช้การเรียกเก็บเงิน คุณยังใช้ gemini-2.5-pro-exp-03-25 ใน ระดับฟรีต่อไปได้

25 มีนาคม 2025

เปิดตัว gemini-2.5-pro-exp-03-25 โมเดล Gemini เวอร์ชันทดลองแบบสาธารณะ ซึ่งมีโหมดการคิดเปิดอยู่เสมอโดยค่าเริ่มต้น ดูข้อมูลเพิ่มเติมได้ที่Gemini 2.5 Pro เวอร์ชันทดลอง

12 มีนาคม 2025

การอัปเดตโมเดล:

เปิดตัวโมเดล Gemini 2.0 Flash เวอร์ชันทดลองที่สามารถสร้างและแก้ไขรูปภาพได้
เปิดตัวgemma-3-27b-itแล้ว พร้อมให้ใช้งานใน AI Studio และผ่าน Gemini API ซึ่งเป็นส่วนหนึ่งของการเปิดตัว Gemma 3

การอัปเดต API:

เพิ่มการรองรับURL ของ YouTube เป็นแหล่งที่มาของสื่อ
เพิ่มการรองรับการใส่วิดีโอในบรรทัดที่มีขนาดไม่เกิน 20 MB

11 มีนาคม 2025

การอัปเดต SDK:

เปิดตัว Gen AI SDK ของ Google สำหรับ TypeScript และ JavaScript ในเวอร์ชันตัวอย่างแบบสาธารณะ

7 มีนาคม 2025

การอัปเดตโมเดล:

เปิดตัวgemini-embedding-exp-03-07โมเดลการฝังเวอร์ชันทดลอง ที่ใช้ Gemini ในเวอร์ชันตัวอย่างแบบสาธารณะ

28 กุมภาพันธ์ 2025

การอัปเดต API:

เพิ่มการรองรับSearch เป็นเครื่องมือ ใน gemini-2.0-pro-exp-02-05 ซึ่งเป็นโมเดลทดลองที่อิงตาม Gemini 2.0 Pro

25 กุมภาพันธ์ 2025

การอัปเดตโมเดล:

เราได้เปิดตัว gemini-2.0-flash-lite ซึ่งเป็นเวอร์ชันพร้อมให้บริการแก่บุคคลทั่วไป (GA) ของ Gemini 2.0 Flash-Lite ซึ่งได้รับการเพิ่มประสิทธิภาพด้านความเร็ว การปรับขนาด และความคุ้มค่า

19 กุมภาพันธ์ 2025

การอัปเดต AI Studio:

รองรับภูมิภาคอื่นๆ (โคโซโว กรีนแลนด์ และหมู่เกาะแฟโร)

การอัปเดต API:

รองรับภูมิภาคอื่นๆ (โคโซโว กรีนแลนด์ และหมู่เกาะแฟโร)

18 กุมภาพันธ์ 2025

การอัปเดตโมเดล:

ระบบไม่รองรับ Gemini 1.0 Pro อีกต่อไป ดูรายการโมเดลที่รองรับได้ที่ โมเดล Gemini

11 กุมภาพันธ์ 2025

การอัปเดต API:

ข้อมูลอัปเดตเกี่ยวกับความเข้ากันได้ของไลบรารี OpenAI

6 กุมภาพันธ์ 2025

การอัปเดตโมเดล:

เปิดตัว imagen-3.0-generate-002 ซึ่งเป็นเวอร์ชันสำหรับผู้ใช้ทั่วไป (GA) ของ Imagen 3 ใน Gemini API

การอัปเดต SDK:

เปิดตัว Google Gen AI SDK สำหรับ Java ในเวอร์ชันตัวอย่างแบบสาธารณะ

5 กุมภาพันธ์ 2025

การอัปเดตโมเดล:

เปิดตัว gemini-2.0-flash-001 ซึ่งเป็นเวอร์ชันพร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) ของ Gemini 2.0 Flash ที่ รองรับเอาต์พุตที่เป็นข้อความเท่านั้น
เปิดตัว gemini-2.0-pro-exp-02-05, Gemini 2.0 Pro เวอร์ชันทดลองแบบสาธารณะ
เปิดตัว gemini-2.0-flash-lite-preview-02-05 ซึ่งเป็นโมเดลเวอร์ชันทดลอง แบบสาธารณะที่เพิ่มประสิทธิภาพเพื่อความคุ้มค่า

การอัปเดต API:

เพิ่มการรองรับอินพุตไฟล์และเอาต์พุตกราฟ ในการเรียกใช้โค้ด

การอัปเดต SDK:

เปิดตัว Google Gen AI SDK สำหรับ Python ในเวอร์ชันสำหรับผู้ใช้ทั่วไป (GA)

21 มกราคม 2025

การอัปเดตโมเดล:

เปิดตัวgemini-2.0-flash-thinking-exp-01-21เวอร์ชันตัวอย่างล่าสุดของโมเดลที่อยู่เบื้องหลังโมเดล Gemini 2.0 Flash Thinking

19 ธันวาคม 2024

การอัปเดตโมเดล:

เปิดตัวโหมด Gemini 2.0 Flash Thinking สำหรับเวอร์ชันตัวอย่างแบบสาธารณะ โหมดการคิดเป็นโมเดลการคำนวณในเวลาทดสอบที่ช่วยให้คุณเห็นกระบวนการคิดของโมเดลขณะที่สร้างคำตอบ และสร้างคำตอบที่มีความสามารถในการให้เหตุผลที่แข็งแกร่งยิ่งขึ้น

อ่านเพิ่มเติมเกี่ยวกับโหมด Gemini 2.0 Flash Thinking ได้ในหน้าภาพรวม

11 ธันวาคม 2024

การอัปเดตโมเดล:

เปิดตัว Gemini 2.0 Flash Experimental สำหรับเวอร์ชันตัวอย่างแบบสาธารณะ รายการฟีเจอร์บางส่วนของ Gemini 2.0 Flash Experimental มีดังนี้
- เร็วกว่า Gemini 1.5 Pro ถึง 2 เท่า
- การสตรีมแบบ 2 ทางด้วย Live API
- การสร้างคำตอบแบบมัลติโมดัลในรูปแบบข้อความ รูปภาพ และคำพูด
- ใช้เครื่องมือในตัวพร้อมการให้เหตุผลแบบหลายรอบเพื่อใช้ฟีเจอร์ต่างๆ เช่น การดำเนินการโค้ด การค้นหา การเรียกใช้ฟังก์ชัน และอื่นๆ

อ่านข้อมูลเพิ่มเติมเกี่ยวกับ Gemini 2.0 Flash ได้ในหน้าภาพรวม

21 พฤศจิกายน 2024

การอัปเดตโมเดล:

เปิดตัว gemini-exp-1121 โมเดล Gemini API เวอร์ชันทดลองที่ทรงพลังยิ่งกว่าเดิม

การอัปเดตโมเดล:

อัปเดตนามแฝงของโมเดล gemini-1.5-flash-latest และ gemini-1.5-flash เพื่อใช้ gemini-1.5-flash-002
- การเปลี่ยนแปลงพารามิเตอร์ top_k: โมเดล gemini-1.5-flash-002 รองรับค่า top_k ระหว่าง 1 ถึง 41 (ไม่รวม) ค่าที่มากกว่า 40 จะเปลี่ยนเป็น 40

14 พฤศจิกายน 2024

การอัปเดตโมเดล:

เปิดตัว gemini-exp-1114 ซึ่งเป็นโมเดล Gemini API เวอร์ชันทดลองที่มีประสิทธิภาพ

8 พฤศจิกายน 2024

การอัปเดต API:

เพิ่มการรองรับ Gemini ในไลบรารี OpenAI / REST API

31 ตุลาคม 2024

การอัปเดต API:

เพิ่มการรองรับการอ้างอิงจาก Google Search

3 ตุลาคม 2024

การอัปเดตโมเดล:

เปิดตัว gemini-1.5-flash-8b-001 โมเดล Gemini API ที่เล็กที่สุดของเราในเวอร์ชันเสถียร

24 กันยายน 2024

การอัปเดตโมเดล:

เปิดตัว gemini-1.5-pro-002 และ gemini-1.5-flash-002 ซึ่งเป็น Gemini 1.5 Pro และ 1.5 Flash เวอร์ชันเสถียรใหม่ 2 เวอร์ชัน สำหรับการใช้งานทั่วไป
อัปเดตโค้ดโมเดล gemini-1.5-pro-latest ให้ใช้ gemini-1.5-pro-002 และโค้ดโมเดล gemini-1.5-flash-latest ให้ใช้ gemini-1.5-flash-002
เปิดตัว gemini-1.5-flash-8b-exp-0924 เพื่อแทนที่ gemini-1.5-flash-8b-exp-0827
เปิดตัวตัวกรองความปลอดภัยด้านความซื่อสัตย์ทางแพ่ง สำหรับ Gemini API และ AI Studio
เปิดตัวการรองรับพารามิเตอร์ใหม่ 2 รายการสำหรับ Gemini 1.5 Pro และ 1.5 Flash ใน Python และ NodeJS ดังนี้ frequencyPenalty และ presencePenalty

19 กันยายน 2024

การอัปเดต AI Studio:

เพิ่มปุ่มชอบและไม่ชอบในคำตอบของโมเดลเพื่อให้ผู้ใช้แสดงความคิดเห็นเกี่ยวกับคุณภาพของคำตอบได้

การอัปเดต API:

เพิ่มการรองรับเครดิต Google Cloud ซึ่งตอนนี้สามารถใช้กับการใช้งาน Gemini API ได้แล้ว

17 กันยายน 2024

การอัปเดต AI Studio:

เพิ่มปุ่มเปิดใน Colab ที่ส่งออกพรอมต์และโค้ดเพื่อเรียกใช้ไปยังสมุดบันทึก Colab ฟีเจอร์นี้ยังไม่รองรับ การแจ้งด้วยเครื่องมือ (โหมด JSON, การเรียกใช้ฟังก์ชัน หรือการดำเนินการโค้ด)

13 กันยายน 2024

การอัปเดต AI Studio:

เพิ่มการรองรับโหมดเปรียบเทียบ ซึ่งช่วยให้คุณเปรียบเทียบคำตอบในโมเดลและพรอมต์ต่างๆ เพื่อค้นหาคำตอบที่เหมาะกับกรณีการใช้งานของคุณมากที่สุด

30 สิงหาคม 2024

การอัปเดตโมเดล:

Gemini 1.5 Flash รองรับการระบุสคีมา JSON ผ่านการกำหนดค่าโมเดล

27 สิงหาคม 2024

การอัปเดตโมเดล:

เปิดตัวโมเดลทดลองต่อไปนี้
- gemini-1.5-pro-exp-0827
- gemini-1.5-flash-exp-0827
- gemini-1.5-flash-8b-exp-0827

9 สิงหาคม 2024

การอัปเดต API:

เพิ่มการรองรับการประมวลผล PDF

5 สิงหาคม 2024

การอัปเดตโมเดล:

เปิดตัวการรองรับการปรับแต่งสำหรับ Gemini 1.5 Flash

1 สิงหาคม 2024

การอัปเดตโมเดล:

เปิดตัว gemini-1.5-pro-exp-0801 ซึ่งเป็น Gemini 1.5 Pro เวอร์ชันทดลองใหม่

12 กรกฎาคม 2024

การอัปเดตโมเดล:

นำการรองรับ Gemini 1.0 Pro Vision ออกจากบริการและเครื่องมือ Google AI

27 มิถุนายน 2024

การอัปเดตโมเดล:

เปิดตัวความพร้อมใช้งานทั่วไปสำหรับหน้าต่างบริบทขนาด 2 ล้านของ Gemini 1.5 Pro

การอัปเดต API:

เพิ่มการรองรับ การเรียกใช้โค้ด

18 มิถุนายน 2024

การอัปเดต API:

เพิ่มการรองรับการแคชบริบท

12 มิถุนายน 2024

การอัปเดตโมเดล:

เลิกใช้งาน Gemini 1.0 Pro Vision

23 พฤษภาคม 2024

การอัปเดตโมเดล:

Gemini 1.5 Pro (gemini-1.5-pro-001) พร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) แล้ว
Gemini 1.5 Flash (gemini-1.5-flash-001) พร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) แล้ว

14 พฤษภาคม 2024

การอัปเดต API:

เปิดตัวหน้าต่างบริบทขนาด 2 ล้านโทเค็นสำหรับ Gemini 1.5 Pro (รายชื่อรอ)
เปิดตัวการเรียกเก็บเงินแบบจ่ายเมื่อใช้สำหรับ Gemini 1.0 Pro โดยการเรียกเก็บเงินสำหรับ Gemini 1.5 Pro และ Gemini 1.5 Flash จะพร้อมให้บริการเร็วๆ นี้
เปิดตัวการเพิ่มขีดจำกัดอัตราสำหรับ Gemini 1.5 Pro ระดับแบบชำระเงินที่กำลังจะเปิดตัว
เพิ่มการรองรับวิดีโอบิวท์อินลงใน File API
เพิ่มการรองรับข้อความธรรมดาใน File API
เพิ่มการรองรับการเรียกใช้ฟังก์ชันแบบขนาน ซึ่งจะแสดงผลการเรียกมากกว่า 1 รายการพร้อมกัน

10 พฤษภาคม 2024

การอัปเดตโมเดล:

เปิดตัว Gemini 1.5 Flash (gemini-1.5-flash-latest) ในเวอร์ชันตัวอย่าง

9 เมษายน 2024

การอัปเดตโมเดล:

เปิดตัว Gemini 1.5 Pro (gemini-1.5-pro-latest) ในเวอร์ชันตัวอย่าง
เปิดตัวโมเดลการฝังข้อความใหม่ text-embeddings-004 ซึ่งรองรับ การฝังแบบยืดหยุ่น ที่มีขนาดต่ำกว่า 768

การอัปเดต API:

เปิดตัว File API สำหรับจัดเก็บไฟล์สื่อชั่วคราว เพื่อใช้ในการแจ้ง
เพิ่มการรองรับการเขียนพรอมต์ด้วยข้อมูลข้อความ รูปภาพ และเสียง หรือที่เรียกว่าการเขียนพรอมต์หลายรูปแบบ ดูข้อมูลเพิ่มเติมได้ที่ การพรอมต์ด้วยสื่อ
เปิดตัวคำสั่งของระบบในเวอร์ชันเบต้า
เพิ่ม โหมดการเรียกใช้ฟังก์ชัน ซึ่งกำหนดลักษณะการทำงานของการเรียกใช้ฟังก์ชัน
เพิ่มการรองรับresponse_mime_typeตัวเลือกการกำหนดค่า ซึ่งช่วยให้คุณขอคำตอบในรูปแบบ JSON ได้

19 มีนาคม 2024

การอัปเดตโมเดล:

เพิ่มการรองรับ การปรับแต่ง Gemini 1.0 Pro ใน Google AI Studio หรือด้วย Gemini API

13 ธันวาคม 2023

การอัปเดตโมเดล:

gemini-pro: โมเดลข้อความใหม่สำหรับงานที่หลากหลาย ปรับสมดุลความสามารถ และประสิทธิภาพ
gemini-pro-vision: โมเดลมัลติโมดัลใหม่สำหรับงานที่หลากหลาย รักษาสมดุลระหว่างความสามารถและประสิทธิภาพ
embedding-001: โมเดลการฝังใหม่
aqa: โมเดลใหม่ที่ได้รับการปรับแต่งเป็นพิเศษซึ่งได้รับการฝึกให้ตอบคำถาม โดยใช้ข้อความเพื่ออ้างอิงคำตอบที่สร้างขึ้น

ดูรายละเอียดเพิ่มเติมได้ที่โมเดล Gemini

การอัปเดตเวอร์ชัน API:

v1: ช่อง API ที่เสถียร
v1beta: เวอร์ชันเบต้า ช่องนี้มีฟีเจอร์ที่อาจอยู่ระหว่าง การพัฒนา

ดูรายละเอียดเพิ่มเติมได้ที่หัวข้อเกี่ยวกับเวอร์ชัน API

การอัปเดต API:

GenerateContent เป็นปลายทางแบบรวมเดียวสำหรับแชทและข้อความ
สตรีมได้ผ่านเมธอด StreamGenerateContent
ความสามารถแบบหลายรูปแบบ: รูปภาพเป็นรูปแบบใหม่ที่รองรับ
ฟีเจอร์เบต้าใหม่
- การเรียกฟังก์ชัน
- Semantic Retriever
- การตอบคำถามโดยอิงตามแหล่งที่มา (AQA)
จำนวนคำตอบที่เป็นไปได้ที่อัปเดตแล้ว: โมเดล Gemini จะแสดงคำตอบที่เป็นไปได้เพียง 1 รายการเท่านั้น
หมวดหมู่การตั้งค่าความปลอดภัยและการจัดประเภทความปลอดภัยที่แตกต่างกัน ดูรายละเอียดเพิ่มเติมได้ที่การตั้งค่าความปลอดภัย
ระบบยังไม่รองรับการปรับแต่งโมเดลสำหรับโมเดล Gemini (อยู่ระหว่างดำเนินการ)