หน้านี้มีบันทึกการอัปเดตของ Gemini API
22 กรกฎาคม 2025
- เปิดตัว
gemini-2.5-flash-lite
โมเดล Gemini 2.5 ที่รวดเร็ว ต้นทุนต่ำ และมีประสิทธิภาพสูง ดูข้อมูลเพิ่มเติมได้ที่ Gemini 2.5 Flash-Lite
17 กรกฎาคม 2025
เปิดตัวเมื่อวันที่
veo-3.0-generate-preview
การอัปเดตล่าสุดของ Veo ที่มาพร้อม การสร้างวิดีโอพร้อมเสียง ดูข้อมูลเพิ่มเติมเกี่ยวกับ Veo 3 ได้ที่หน้ารุ่นเพิ่มขีดจำกัดอัตราการใช้งานสำหรับ Imagen 4 Standard และ Ultra ดูรายละเอียดเพิ่มเติมได้ที่หน้าการจำกัดอัตรา
14 กรกฎาคม 2025
- เปิดตัว
gemini-embedding-001
โมเดลการฝังข้อความเวอร์ชันเสถียร ดูข้อมูลเพิ่มเติมได้ที่การฝังgemini-embedding-exp-03-07
เราจะเลิกใช้งานโมเดลในวันที่ 14 สิงหาคม 2025
7 กรกฎาคม 2025
- เปิดตัวโหมดกลุ่มของ Gemini API จัดกลุ่มคำขอและส่งไปประมวลผล แบบไม่พร้อมกัน ดูข้อมูลเพิ่มเติมได้ที่โหมดกลุ่ม
26 มิถุนายน 2025
ตอนนี้โมเดลเวอร์ชันตัวอย่าง
gemini-2.5-pro-preview-05-06
และgemini-2.5-pro-preview-03-25
จะเปลี่ยนเส้นทางไปยัง เวอร์ชันล่าสุดที่เสถียรgemini-2.5-pro
gemini-2.5-pro-exp-03-25
เลิกใช้งานแล้ว
24 มิถุนายน 2025
- เปิดตัวโมเดล Imagen 4 Ultra และ Standard Preview ดูข้อมูลเพิ่มเติมได้ที่หน้าการสร้างรูปภาพ
17 มิถุนายน 2025
- เราได้เปิดตัว
gemini-2.5-pro
ซึ่งเป็นเวอร์ชันเสถียรของโมเดลที่ทรงพลังที่สุด พร้อมด้วยการคิดเชิงปรับตัว ดูข้อมูลเพิ่มเติมได้ที่ Gemini 2.5 Pro และการคิดgemini-2.5-pro-preview-05-06
จะเปลี่ยนเส้นทางไปยังgemini-2.5-pro
ในวันที่ 26 มิถุนายน 2025 - เปิดตัว
gemini-2.5-flash
โมเดล 2.5 Flash ที่เสถียรตัวแรกของเรา ดูข้อมูลเพิ่มเติมได้ที่ Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
จะเลิกใช้งานในวันที่ 15 กรกฎาคม 2025 - เปิดตัว
gemini-2.5-flash-lite-preview-06-17
โมเดล Gemini 2.5 ที่มีต้นทุนต่ำและประสิทธิภาพสูง ดูข้อมูลเพิ่มเติมได้ที่เวอร์ชันตัวอย่างของ Gemini 2.5 Flash-Lite
5 มิถุนายน 2025
- เปิดตัว
gemini-2.5-pro-preview-06-05
ซึ่งเป็นโมเดลเวอร์ชันใหม่ที่ทรงพลังที่สุดของเรา ซึ่งมาพร้อมการคิดแบบปรับเปลี่ยนได้ ดูข้อมูลเพิ่มเติมได้ที่ ตัวอย่าง Gemini 2.5 Pro และการคิด ระบบจะเปลี่ยนเส้นทางgemini-2.5-pro-preview-05-06
ไปยังgemini-2.5-pro
ในวันที่ 26 มิถุนายน 2025
20 พฤษภาคม 2025
การอัปเดต API:
- เปิดตัวการรองรับ การประมวลผลวิดีโอก่อนแสดงผลที่กำหนดเอง โดยใช้ช่วงการตัดและอัตราการสุ่มตัวอย่างเฟรมที่กำหนดค่าได้
- เปิดตัวการใช้เครื่องมือหลายอย่าง ซึ่งรองรับการกำหนดค่าการเรียกใช้โค้ดและการอ้างอิงจาก Google Search ใน
generateContent
คำขอเดียวกัน - เปิดตัวการรองรับ การเรียกใช้ฟังก์ชันแบบไม่พร้อมกัน ใน Live API
- เปิดตัวเครื่องมือบริบท URL เวอร์ชันทดลอง เพื่อระบุ URL เป็นบริบทเพิ่มเติมในพรอมต์
การอัปเดตโมเดล:
- เปิดตัว
gemini-2.5-flash-preview-05-20
โมเดลเวอร์ชันตัวอย่างของ Gemini ที่เพิ่มประสิทธิภาพเพื่อ ประสิทธิภาพด้านราคาและการคิดแบบปรับเปลี่ยนได้ ดูข้อมูลเพิ่มเติมได้ที่ ตัวอย่าง Gemini 2.5 Flash และการคิด - เปิดตัวโมเดล
gemini-2.5-pro-preview-tts
และgemini-2.5-flash-preview-tts
ซึ่งสามารถสร้างคำพูดจากผู้พูด 1 หรือ 2 คน - เปิดตัวโมเดล
lyria-realtime-exp
ซึ่งสร้างเพลงแบบเรียลไทม์ - เปิดตัว
gemini-2.5-flash-preview-native-audio-dialog
และgemini-2.5-flash-exp-native-audio-thinking-dialog
โมเดล Gemini ใหม่สำหรับ Live API ที่มีความสามารถในการแสดงผลเสียงแบบเนทีฟ ดูข้อมูลเพิ่มเติมได้ที่คู่มือ Live API และเสียงเนทีฟของ Gemini 2.5 Flash - เปิดตัว
gemma-3n-e4b-it
เวอร์ชันตัวอย่างที่พร้อมใช้งานใน AI Studio และผ่าน Gemini API ซึ่งเป็นส่วนหนึ่งของการเปิดตัว Gemma 3n
7 พฤษภาคม 2025
- เปิดตัว
gemini-2.0-flash-preview-image-generation
โมเดลเวอร์ชันตัวอย่างสำหรับ การสร้างและแก้ไขรูปภาพ ดูข้อมูลเพิ่มเติมได้ที่การสร้างรูปภาพและการสร้างรูปภาพตัวอย่างของ Gemini 2.0 Flash
6 พฤษภาคม 2025
- เปิดตัว
gemini-2.5-pro-preview-05-06
โมเดลเวอร์ชันใหม่ที่ทรงพลังที่สุดของเรา พร้อมการปรับปรุงด้านโค้ดและการเรียกใช้ฟังก์ชันgemini-2.5-pro-preview-03-25
จะชี้ไปยังโมเดลเวอร์ชันใหม่โดยอัตโนมัติ
17 เมษายน 2025
- เปิดตัว
gemini-2.5-flash-preview-04-17
โมเดลเวอร์ชันตัวอย่างของ Gemini ที่เพิ่มประสิทธิภาพเพื่อ ประสิทธิภาพด้านราคาและการคิดแบบปรับเปลี่ยนได้ ดูข้อมูลเพิ่มเติมได้ที่ ตัวอย่าง Gemini 2.5 Flash และการคิด
16 เมษายน 2025
- เปิดตัวการแคชบริบทสำหรับ Gemini 2.0 Flash
9 เมษายน 2025
การอัปเดตโมเดล:
- เปิดตัว
veo-2.0-generate-001
โมเดลข้อความและรูปภาพเป็นวิดีโอที่พร้อมให้บริการแก่บุคคลทั่วไป (GA) ซึ่งสามารถสร้างวิดีโอที่มีรายละเอียดและมีความแตกต่างทางศิลปะ ดูข้อมูลเพิ่มเติมได้ที่เอกสารของ Veo เปิดตัว
gemini-2.0-flash-live-001
ซึ่งเป็นเวอร์ชันตัวอย่างแบบสาธารณะของโมเดล Live API ที่เปิดใช้การเรียกเก็บเงินการจัดการเซสชันและความน่าเชื่อถือที่ดียิ่งขึ้น
- การกลับมาใช้เซสชันต่อ: ทำให้เซสชันยังคงใช้งานได้แม้เครือข่ายจะหยุดชะงักชั่วคราว ตอนนี้ API รองรับการจัดเก็บสถานะเซสชันฝั่งเซิร์ฟเวอร์ (นานสูงสุด 24 ชั่วโมง) และมีแฮนเดิล (session_resumption) เพื่อเชื่อมต่ออีกครั้งและดำเนินการต่อจากจุดที่ค้างไว้
- เซสชันที่ยาวขึ้นผ่านการบีบอัดบริบท: เปิดใช้การโต้ตอบที่ยาวขึ้นโดยไม่จำกัดเวลาเหมือนที่ผ่านมา กำหนดค่าการบีบอัดหน้าต่างบริบท ด้วยกลไกหน้าต่างเลื่อนเพื่อจัดการความยาวบริบท โดยอัตโนมัติ ซึ่งจะช่วยป้องกันการสิ้นสุดอย่างกะทันหันเนื่องจากขีดจำกัดบริบท
- การแจ้งเตือนการยกเลิกการเชื่อมต่ออย่างราบรื่น: รับข้อความ
GoAway
เซิร์ฟเวอร์ ที่ระบุเวลาที่การเชื่อมต่อกำลังจะปิด เพื่อให้จัดการได้อย่างราบรื่นก่อนสิ้นสุด
ควบคุมการโต้ตอบได้มากขึ้น
การตรวจหาการพูด (VAD) ที่กำหนดค่าได้: เลือกความไว หรือปิดใช้ VAD อัตโนมัติทั้งหมด แล้วใช้เหตุการณ์ไคลเอ็นต์ใหม่ (
activityStart
,activityEnd
) เพื่อควบคุมการเปิด/ปิดด้วยตนเองการจัดการการหยุดชะงักที่กำหนดค่าได้: กำหนดว่าอินพุตของผู้ใช้ ควรขัดจังหวะการตอบกลับของโมเดลหรือไม่
ความครอบคลุมของผลัดที่กำหนดค่าได้: เลือกว่า API จะประมวลผลอินพุตเสียงและวิดีโอทั้งหมดอย่างต่อเนื่อง หรือจะบันทึกเฉพาะเมื่อตรวจพบว่าผู้ใช้ปลายทางกำลังพูด
ความละเอียดของสื่อที่กำหนดค่าได้: เพิ่มประสิทธิภาพเพื่อคุณภาพหรือการใช้โทเค็น โดยเลือกความละเอียดสำหรับสื่ออินพุต
เอาต์พุตและฟีเจอร์ที่สมบูรณ์ยิ่งขึ้น
ตัวเลือกเสียงและภาษาที่เพิ่มขึ้น: เลือกจากเสียงใหม่ 2 แบบและภาษาใหม่ 30 ภาษาสำหรับเอาต์พุตเสียง ตอนนี้คุณกำหนดค่าภาษาเอาต์พุตได้ภายใน
speechConfig
แล้วการสตรีมข้อความ: รับการตอบกลับเป็นข้อความทีละรายการขณะที่ระบบสร้างข้อความ เพื่อให้แสดงต่อผู้ใช้ได้เร็วขึ้น
การรายงานการใช้โทเค็น: รับข้อมูลเชิงลึกเกี่ยวกับการใช้งานด้วยจำนวนโทเค็นโดยละเอียดที่ระบุในฟิลด์
usageMetadata
ของข้อความเซิร์ฟเวอร์ ซึ่งแบ่งตามรูปแบบและเฟสของพรอมต์หรือการตอบกลับ
4 เมษายน 2025
- เปิดตัว
gemini-2.5-pro-preview-03-25
เวอร์ชันตัวอย่างแบบสาธารณะของ Gemini 2.5 Pro พร้อมเปิดใช้การเรียกเก็บเงิน คุณยังใช้gemini-2.5-pro-exp-03-25
ใน ระดับฟรีต่อไปได้
25 มีนาคม 2025
- เปิดตัว
gemini-2.5-pro-exp-03-25
โมเดล Gemini เวอร์ชันทดลองแบบสาธารณะ ซึ่งมีโหมดการคิดเปิดอยู่เสมอโดยค่าเริ่มต้น ดูข้อมูลเพิ่มเติมได้ที่Gemini 2.5 Pro เวอร์ชันทดลอง
12 มีนาคม 2025
การอัปเดตโมเดล:
- เปิดตัวโมเดล Gemini 2.0 Flash เวอร์ชันทดลองที่สามารถสร้างและแก้ไขรูปภาพได้
- เปิดตัว
gemma-3-27b-it
แล้ว พร้อมให้ใช้งานใน AI Studio และผ่าน Gemini API ซึ่งเป็นส่วนหนึ่งของการเปิดตัว Gemma 3
การอัปเดต API:
- เพิ่มการรองรับURL ของ YouTube เป็นแหล่งที่มาของสื่อ
- เพิ่มการรองรับการใส่วิดีโอในบรรทัดที่มีขนาดไม่เกิน 20 MB
11 มีนาคม 2025
การอัปเดต SDK:
- เปิดตัว Gen AI SDK ของ Google สำหรับ TypeScript และ JavaScript ในเวอร์ชันตัวอย่างแบบสาธารณะ
7 มีนาคม 2025
การอัปเดตโมเดล:
- เปิดตัว
gemini-embedding-exp-03-07
โมเดลการฝังเวอร์ชันทดลอง ที่ใช้ Gemini ในเวอร์ชันตัวอย่างแบบสาธารณะ
28 กุมภาพันธ์ 2025
การอัปเดต API:
- เพิ่มการรองรับSearch เป็นเครื่องมือ
ใน
gemini-2.0-pro-exp-02-05
ซึ่งเป็นโมเดลทดลองที่อิงตาม Gemini 2.0 Pro
25 กุมภาพันธ์ 2025
การอัปเดตโมเดล:
- เราได้เปิดตัว
gemini-2.0-flash-lite
ซึ่งเป็นเวอร์ชันพร้อมให้บริการแก่บุคคลทั่วไป (GA) ของ Gemini 2.0 Flash-Lite ซึ่งได้รับการเพิ่มประสิทธิภาพด้านความเร็ว การปรับขนาด และความคุ้มค่า
19 กุมภาพันธ์ 2025
การอัปเดต AI Studio:
- รองรับภูมิภาคอื่นๆ (โคโซโว กรีนแลนด์ และหมู่เกาะแฟโร)
การอัปเดต API:
- รองรับภูมิภาคอื่นๆ (โคโซโว กรีนแลนด์ และหมู่เกาะแฟโร)
18 กุมภาพันธ์ 2025
การอัปเดตโมเดล:
- ระบบไม่รองรับ Gemini 1.0 Pro อีกต่อไป ดูรายการโมเดลที่รองรับได้ที่ โมเดล Gemini
11 กุมภาพันธ์ 2025
การอัปเดต API:
- ข้อมูลอัปเดตเกี่ยวกับความเข้ากันได้ของไลบรารี OpenAI
6 กุมภาพันธ์ 2025
การอัปเดตโมเดล:
- เปิดตัว
imagen-3.0-generate-002
ซึ่งเป็นเวอร์ชันสำหรับผู้ใช้ทั่วไป (GA) ของ Imagen 3 ใน Gemini API
การอัปเดต SDK:
- เปิดตัว Google Gen AI SDK สำหรับ Java ในเวอร์ชันตัวอย่างแบบสาธารณะ
5 กุมภาพันธ์ 2025
การอัปเดตโมเดล:
- เปิดตัว
gemini-2.0-flash-001
ซึ่งเป็นเวอร์ชันพร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) ของ Gemini 2.0 Flash ที่ รองรับเอาต์พุตที่เป็นข้อความเท่านั้น - เปิดตัว
gemini-2.0-pro-exp-02-05
, Gemini 2.0 Pro เวอร์ชันทดลองแบบสาธารณะ - เปิดตัว
gemini-2.0-flash-lite-preview-02-05
ซึ่งเป็นโมเดลเวอร์ชันทดลอง แบบสาธารณะที่เพิ่มประสิทธิภาพเพื่อความคุ้มค่า
การอัปเดต API:
- เพิ่มการรองรับอินพุตไฟล์และเอาต์พุตกราฟ ในการเรียกใช้โค้ด
การอัปเดต SDK:
- เปิดตัว Google Gen AI SDK สำหรับ Python ในเวอร์ชันสำหรับผู้ใช้ทั่วไป (GA)
21 มกราคม 2025
การอัปเดตโมเดล:
- เปิดตัว
gemini-2.0-flash-thinking-exp-01-21
เวอร์ชันตัวอย่างล่าสุดของโมเดลที่อยู่เบื้องหลังโมเดล Gemini 2.0 Flash Thinking
19 ธันวาคม 2024
การอัปเดตโมเดล:
เปิดตัวโหมด Gemini 2.0 Flash Thinking สำหรับเวอร์ชันตัวอย่างแบบสาธารณะ โหมดการคิดเป็นโมเดลการคำนวณในเวลาทดสอบที่ช่วยให้คุณเห็นกระบวนการคิดของโมเดลขณะที่สร้างคำตอบ และสร้างคำตอบที่มีความสามารถในการให้เหตุผลที่แข็งแกร่งยิ่งขึ้น
อ่านเพิ่มเติมเกี่ยวกับโหมด Gemini 2.0 Flash Thinking ได้ในหน้าภาพรวม
11 ธันวาคม 2024
การอัปเดตโมเดล:
- เปิดตัว Gemini 2.0 Flash Experimental
สำหรับเวอร์ชันตัวอย่างแบบสาธารณะ รายการฟีเจอร์บางส่วนของ Gemini 2.0 Flash Experimental มีดังนี้
- เร็วกว่า Gemini 1.5 Pro ถึง 2 เท่า
- การสตรีมแบบ 2 ทางด้วย Live API
- การสร้างคำตอบแบบมัลติโมดัลในรูปแบบข้อความ รูปภาพ และคำพูด
- ใช้เครื่องมือในตัวพร้อมการให้เหตุผลแบบหลายรอบเพื่อใช้ฟีเจอร์ต่างๆ เช่น การดำเนินการโค้ด การค้นหา การเรียกใช้ฟังก์ชัน และอื่นๆ
อ่านข้อมูลเพิ่มเติมเกี่ยวกับ Gemini 2.0 Flash ได้ในหน้าภาพรวม
21 พฤศจิกายน 2024
การอัปเดตโมเดล:
- เปิดตัว
gemini-exp-1121
โมเดล Gemini API เวอร์ชันทดลองที่ทรงพลังยิ่งกว่าเดิม
การอัปเดตโมเดล:
- อัปเดตนามแฝงของโมเดล
gemini-1.5-flash-latest
และgemini-1.5-flash
เพื่อใช้gemini-1.5-flash-002
- การเปลี่ยนแปลงพารามิเตอร์
top_k
: โมเดลgemini-1.5-flash-002
รองรับค่าtop_k
ระหว่าง 1 ถึง 41 (ไม่รวม) ค่าที่มากกว่า 40 จะเปลี่ยนเป็น 40
- การเปลี่ยนแปลงพารามิเตอร์
14 พฤศจิกายน 2024
การอัปเดตโมเดล:
- เปิดตัว
gemini-exp-1114
ซึ่งเป็นโมเดล Gemini API เวอร์ชันทดลองที่มีประสิทธิภาพ
8 พฤศจิกายน 2024
การอัปเดต API:
- เพิ่มการรองรับ Gemini ในไลบรารี OpenAI / REST API
31 ตุลาคม 2024
การอัปเดต API:
3 ตุลาคม 2024
การอัปเดตโมเดล:
- เปิดตัว
gemini-1.5-flash-8b-001
โมเดล Gemini API ที่เล็กที่สุดของเราในเวอร์ชันเสถียร
24 กันยายน 2024
การอัปเดตโมเดล:
- เปิดตัว
gemini-1.5-pro-002
และgemini-1.5-flash-002
ซึ่งเป็น Gemini 1.5 Pro และ 1.5 Flash เวอร์ชันเสถียรใหม่ 2 เวอร์ชัน สำหรับการใช้งานทั่วไป - อัปเดตโค้ดโมเดล
gemini-1.5-pro-latest
ให้ใช้gemini-1.5-pro-002
และโค้ดโมเดลgemini-1.5-flash-latest
ให้ใช้gemini-1.5-flash-002
- เปิดตัว
gemini-1.5-flash-8b-exp-0924
เพื่อแทนที่gemini-1.5-flash-8b-exp-0827
- เปิดตัวตัวกรองความปลอดภัยด้านความซื่อสัตย์ทางแพ่ง สำหรับ Gemini API และ AI Studio
- เปิดตัวการรองรับพารามิเตอร์ใหม่ 2 รายการสำหรับ Gemini 1.5 Pro และ 1.5 Flash ใน
Python และ NodeJS ดังนี้
frequencyPenalty
และpresencePenalty
19 กันยายน 2024
การอัปเดต AI Studio:
- เพิ่มปุ่มชอบและไม่ชอบในคำตอบของโมเดลเพื่อให้ผู้ใช้แสดงความคิดเห็นเกี่ยวกับคุณภาพของคำตอบได้
การอัปเดต API:
- เพิ่มการรองรับเครดิต Google Cloud ซึ่งตอนนี้สามารถใช้กับการใช้งาน Gemini API ได้แล้ว
17 กันยายน 2024
การอัปเดต AI Studio:
- เพิ่มปุ่มเปิดใน Colab ที่ส่งออกพรอมต์และโค้ดเพื่อเรียกใช้ไปยังสมุดบันทึก Colab ฟีเจอร์นี้ยังไม่รองรับ การแจ้งด้วยเครื่องมือ (โหมด JSON, การเรียกใช้ฟังก์ชัน หรือการดำเนินการโค้ด)
13 กันยายน 2024
การอัปเดต AI Studio:
- เพิ่มการรองรับโหมดเปรียบเทียบ ซึ่งช่วยให้คุณเปรียบเทียบคำตอบในโมเดลและพรอมต์ต่างๆ เพื่อค้นหาคำตอบที่เหมาะกับกรณีการใช้งานของคุณมากที่สุด
30 สิงหาคม 2024
การอัปเดตโมเดล:
- Gemini 1.5 Flash รองรับการระบุสคีมา JSON ผ่านการกำหนดค่าโมเดล
27 สิงหาคม 2024
การอัปเดตโมเดล:
- เปิดตัวโมเดลทดลองต่อไปนี้
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
9 สิงหาคม 2024
การอัปเดต API:
- เพิ่มการรองรับการประมวลผล PDF
5 สิงหาคม 2024
การอัปเดตโมเดล:
- เปิดตัวการรองรับการปรับแต่งสำหรับ Gemini 1.5 Flash
1 สิงหาคม 2024
การอัปเดตโมเดล:
12 กรกฎาคม 2024
การอัปเดตโมเดล:
- นำการรองรับ Gemini 1.0 Pro Vision ออกจากบริการและเครื่องมือ Google AI
27 มิถุนายน 2024
การอัปเดตโมเดล:
- เปิดตัวความพร้อมใช้งานทั่วไปสำหรับหน้าต่างบริบทขนาด 2 ล้านของ Gemini 1.5 Pro
การอัปเดต API:
- เพิ่มการรองรับการเรียกใช้โค้ด
18 มิถุนายน 2024
การอัปเดต API:
- เพิ่มการรองรับการแคชบริบท
12 มิถุนายน 2024
การอัปเดตโมเดล:
- เลิกใช้งาน Gemini 1.0 Pro Vision
23 พฤษภาคม 2024
การอัปเดตโมเดล:
- Gemini 1.5 Pro
(
gemini-1.5-pro-001
) พร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) แล้ว - Gemini 1.5 Flash
(
gemini-1.5-flash-001
) พร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) แล้ว
14 พฤษภาคม 2024
การอัปเดต API:
- เปิดตัวหน้าต่างบริบทขนาด 2 ล้านโทเค็นสำหรับ Gemini 1.5 Pro (รายชื่อรอ)
- เปิดตัวการเรียกเก็บเงินแบบจ่ายเมื่อใช้สำหรับ Gemini 1.0 Pro โดยการเรียกเก็บเงินสำหรับ Gemini 1.5 Pro และ Gemini 1.5 Flash จะพร้อมให้บริการเร็วๆ นี้
- เปิดตัวการเพิ่มขีดจำกัดอัตราสำหรับ Gemini 1.5 Pro ระดับแบบชำระเงินที่กำลังจะเปิดตัว
- เพิ่มการรองรับวิดีโอบิวท์อินลงใน File API
- เพิ่มการรองรับข้อความธรรมดาใน File API
- เพิ่มการรองรับการเรียกใช้ฟังก์ชันแบบขนาน ซึ่งจะแสดงผลการเรียกมากกว่า 1 รายการพร้อมกัน
10 พฤษภาคม 2024
การอัปเดตโมเดล:
- เปิดตัว Gemini 1.5 Flash
(
gemini-1.5-flash-latest
) ในเวอร์ชันตัวอย่าง
9 เมษายน 2024
การอัปเดตโมเดล:
- เปิดตัว Gemini 1.5 Pro
(
gemini-1.5-pro-latest
) ในเวอร์ชันตัวอย่าง - เปิดตัวโมเดลการฝังข้อความใหม่
text-embeddings-004
ซึ่งรองรับ การฝังแบบยืดหยุ่น ที่มีขนาดต่ำกว่า 768
การอัปเดต API:
- เปิดตัว File API สำหรับจัดเก็บไฟล์สื่อชั่วคราว เพื่อใช้ในการแจ้ง
- เพิ่มการรองรับการเขียนพรอมต์ด้วยข้อมูลข้อความ รูปภาพ และเสียง หรือที่เรียกว่าการเขียนพรอมต์หลายรูปแบบ ดูข้อมูลเพิ่มเติมได้ที่ การพรอมต์ด้วยสื่อ
- เปิดตัวคำสั่งของระบบในเวอร์ชันเบต้า
- เพิ่ม โหมดการเรียกใช้ฟังก์ชัน ซึ่งกำหนดลักษณะการทำงานของการเรียกใช้ฟังก์ชัน
- เพิ่มการรองรับ
response_mime_type
ตัวเลือกการกำหนดค่า ซึ่งช่วยให้คุณขอคำตอบในรูปแบบ JSON ได้
19 มีนาคม 2024
การอัปเดตโมเดล:
- เพิ่มการรองรับ การปรับแต่ง Gemini 1.0 Pro ใน Google AI Studio หรือด้วย Gemini API
13 ธันวาคม 2023
การอัปเดตโมเดล:
- gemini-pro: โมเดลข้อความใหม่สำหรับงานที่หลากหลาย ปรับสมดุลความสามารถ และประสิทธิภาพ
- gemini-pro-vision: โมเดลมัลติโมดัลใหม่สำหรับงานที่หลากหลาย รักษาสมดุลระหว่างความสามารถและประสิทธิภาพ
- embedding-001: โมเดลการฝังใหม่
- aqa: โมเดลใหม่ที่ได้รับการปรับแต่งเป็นพิเศษซึ่งได้รับการฝึกให้ตอบคำถาม โดยใช้ข้อความเพื่ออ้างอิงคำตอบที่สร้างขึ้น
ดูรายละเอียดเพิ่มเติมได้ที่โมเดล Gemini
การอัปเดตเวอร์ชัน API:
- v1: ช่อง API ที่เสถียร
- v1beta: เวอร์ชันเบต้า ช่องนี้มีฟีเจอร์ที่อาจอยู่ระหว่าง การพัฒนา
ดูรายละเอียดเพิ่มเติมได้ที่หัวข้อเกี่ยวกับเวอร์ชัน API
การอัปเดต API:
GenerateContent
เป็นปลายทางแบบรวมเดียวสำหรับแชทและข้อความ- สตรีมได้ผ่านเมธอด
StreamGenerateContent
- ความสามารถแบบหลายรูปแบบ: รูปภาพเป็นรูปแบบใหม่ที่รองรับ
- ฟีเจอร์เบต้าใหม่
- การเรียกฟังก์ชัน
- Semantic Retriever
- การตอบคำถามโดยอิงตามแหล่งที่มา (AQA)
- จำนวนคำตอบที่เป็นไปได้ที่อัปเดตแล้ว: โมเดล Gemini จะแสดงคำตอบที่เป็นไปได้เพียง 1 รายการเท่านั้น
- หมวดหมู่การตั้งค่าความปลอดภัยและการจัดประเภทความปลอดภัยที่แตกต่างกัน ดูรายละเอียดเพิ่มเติมได้ที่การตั้งค่าความปลอดภัย
- ระบบยังไม่รองรับการปรับแต่งโมเดลสำหรับโมเดล Gemini (อยู่ระหว่างดำเนินการ)