11 ธ.ค. 2024
พลิกโฉมการสร้างวิดีโอด้วย Gemini 2.0 Flash
API ของ Gemini ไม่เพียงแต่ช่วยปรับปรุงแอปเท่านั้น แต่ยังเป็นจุดเริ่มต้นของการปฏิวัติในการแสดงออกทางความคิดสร้างสรรค์อีกด้วย Viggle วิดีโอ AI ที่กำลังเป็นกระแสไวรัลซึ่งช่วยให้ใครก็ตามสามารถเปลี่ยนภาพถ่ายให้กลายเป็นแอนิเมชั่นอันน่าดึงดูดใจ ถือเป็นแนวหน้าของการปฏิวัติครั้งนี้ ด้วยการทดลองใช้ความมหัศจรรย์แบบมัลติโมดัลของ Gemini 2.0 Flash ซึ่งปัจจุบันพร้อมให้บริการในเวอร์ชันทดลองเท่านั้น โดยเฉพาะความสามารถในการทำความเข้าใจวิดีโอขั้นสูงและเอาต์พุตเสียงควบคู่ไปกับการสร้างรูปภาพโดย Imagen 3 Viggle กำลังสร้างฟีเจอร์ที่จะช่วยให้ผู้ใช้สามารถเปลี่ยนจินตนาการที่แปลกประหลาดที่สุดให้กลายเป็นจริงได้อย่างง่ายดายในแบบที่ไม่เคยมีมาก่อน
เบื้องหลัง Viggle: ขับเคลื่อนการสร้างวิดีโอ AI ด้วย Gemini 2.0 Flash และ Imagen 3
Viggle ได้ดึงดูดผู้ใช้หลายล้านคนด้วยความสามารถในการเปลี่ยนรูปภาพนิ่งให้เป็นวิดีโอเคลื่อนไหวที่มีการเคลื่อนไหวทั้งตัวได้อย่างง่ายดาย ซึ่งจุดประกายให้เกิดเนื้อหาที่กลายเป็นไวรัลในแพลตฟอร์มโซเชียลมีเดียต่างๆ Viggle มุ่งเน้นที่เนื้อหาเกี่ยวกับมุกตลกและเนื้อหาการเต้น โดยมีแอปบนอุปกรณ์เคลื่อนที่ (iOS และ Android) และแพลตฟอร์มเว็บ (viggle.ai) ฟีเจอร์ต่างๆ เช่น การสลับใบหน้า การทำให้รูปภาพเคลื่อนไหวด้วยท่าเต้น และการแทรกผู้ใช้ลงในฉากภาพยนตร์ได้รับความนิยมในฐานผู้ใช้ของ Viggle อยู่แล้ว และตอนนี้ Viggle กำลังหาวิธีใหม่ๆ ในการยกระดับความคิดสร้างสรรค์ไปอีกขั้น
ตอนนี้ Viggle กำลังสร้างต้นแบบฟีเจอร์ 2 อย่างที่ใช้ประโยชน์จากพลังของ Gemini 2.0 Flash และ Imagen 3 ดังนี้
เปลี่ยนรูปภาพเป็นตัวละครวิดีโอเสมือน: Viggle ใช้ Imagen 3 ในการสร้างรูปภาพเพื่อสร้างโรงหล่อตัวละครที่ทำงานด้วยระบบ AI ผู้ใช้สามารถป้อนข้อความแนะนำแบบง่ายๆ เช่น "หุ่นยนต์เต้นรำที่มีตาเรืองแสง" หรือ "มังกรขนปุยสีรุ้ง" จากนั้นโมเดลจะเสกตัวละครเสมือนจริงที่มีเอกลักษณ์เฉพาะตัวเพื่อเตรียมแสดงในวิดีโอของพวกเขา จากนั้นระบบจะผสานรวมตัวละครเหล่านี้เข้ากับเอนจินภาพเคลื่อนไหวของ Viggle อย่างราบรื่น ซึ่งจะเปิดจักรวาลแห่งความเป็นไปได้ในการเล่าเรื่องที่ปรับเปลี่ยนในแบบของคุณ ลองจินตนาการถึงการกำกับภาพยนตร์สั้นแบบเคลื่อนไหวของคุณเองโดยมีตัวละครที่เกิดจากจินตนาการของคุณทั้งหมด นั่นคือพลังที่ Viggle และ Imagen 3 มอบให้คุณ
คำบรรยาย AI แบบไดนามิก: Viggle ยังใช้ความสามารถของ Gemini 2.0 Flash ในการสร้างคำพูดและความเข้าใจวิดีโออย่างลึกซึ้งเพื่อพัฒนาฟีเจอร์ที่จะเพิ่มเสียงบรรยายที่สมบูรณ์ตามบริบทลงในวิดีโอใดก็ได้ นี่ไม่ใช่แค่เสียงพูดที่อ่านสคริปต์แบบเรียบๆ แต่เป็นผู้เล่าเรื่องโดย AI ที่วิเคราะห์เนื้อหาของวิดีโอ โดยจะระบุช่วงเวลาสำคัญ การกระทำ และแม้แต่อารมณ์ เพื่อสร้างคำบรรยายที่เสริมภาพได้อย่างลงตัว ไม่ว่าจะเป็นการแสดงความคิดเห็นแบบขำๆ ในวิดีโอการเต้นหรือคำอธิบายสุดอลังการของฉากแฟนตาซี ผู้บรรยาย AI จะช่วยเพิ่มมิติใหม่ๆ ในการมีส่วนร่วม
ปลดล็อกความคิดสร้างสรรค์และการมีส่วนร่วมไปอีกขั้น
การผสานรวม Generative AI พร้อมที่จะปรับปรุงประสบการณ์การใช้งาน Viggle ในหลายๆ ด้านที่สำคัญ ดังนี้
การสร้างตัวละครที่ง่ายขึ้น: การสร้างรูปภาพของ Imagen 3 ช่วยเพิ่มประสิทธิภาพกระบวนการสร้างและปรับแต่งตัวละครในวิดีโอ ตอนนี้ผู้ใช้สามารถสร้างตัวละครที่ไม่ซ้ำใครได้ตามไอเดียของตนเอง โดยไม่ต้องมีทักษะการออกแบบขั้นสูงหรือการพึ่งพาตัวเลือกที่ตั้งค่าไว้ล่วงหน้าที่มีจำกัด เวิร์กโฟลว์ที่เรียบง่ายนี้ช่วยให้ผู้ใช้สามารถนำวิสัยทัศน์สร้างสรรค์ของตนมาสู่ชีวิตได้มากขึ้น
เนื้อหาที่ปรับเปลี่ยนในแบบของคุณมากขึ้น: Gemini 2.0 Flash ช่วยให้ผู้ใช้สร้างเรื่องราววิดีโอที่ปรับเปลี่ยนในแบบของคุณได้อย่างมาก ตัวละครที่ออกแบบเอง รวมกับคำบรรยาย AI แบบไดนามิก ช่วยให้การเล่าเรื่องมีความเป็นเอกลักษณ์ ซึ่งช่วยเสริมสร้างความเชื่อมโยงระหว่างผู้สร้างและผู้ชม
ความเป็นไปได้ด้านครีเอทีฟโฆษณาที่เพิ่มขึ้น: การผสมผสานตัวละครเสมือนจริงและการบรรยายด้วย AI จะช่วยขยายศักยภาพด้านครีเอทีฟโฆษณาของวิดีโอแบบสั้นบน Viggle ผู้ใช้สามารถสำรวจรูปแบบการเล่าเรื่องใหม่ๆ ที่นอกเหนือจากรูปแบบวิดีโอดั้งเดิม
ในอนาคต
Viggle ตื่นเต้นที่จะได้สำรวจศักยภาพของ Gemini 2.0 และโมเดล Image Gen เพิ่มเติมเพื่อปรับปรุงแพลตฟอร์มของตน และมองเห็นอนาคตที่ AI จะผสานรวมเข้ากับทุกขั้นตอนของกระบวนการสร้างสรรค์ได้อย่างราบรื่น ซึ่งจะช่วยให้ทุกคนเป็นครีเอเตอร์วิดีโอได้
"ที่ Viggle ทุกคนเป็นครีเอเตอร์ เรากำลังสร้างมีม สำรวจการจับภาพเคลื่อนไหวสำหรับโปรเจ็กต์ระดับถัดไป และสร้างมัลติเวิร์สของเราเอง ความสามารถในการบรรยายด้วยเสียงที่สมจริงของ Gemini 2.0 Flash จะช่วยให้ผู้ใช้ปลดล็อกศักยภาพใหม่ๆ และสร้างสรรค์การเล่าเรื่องได้อย่างที่ไม่เคยมีมาก่อน"
การทำงานของ Viggle ร่วมกับ Gemini 2.0 Flash และ Imagen 3 แสดงให้เห็นถึงศักยภาพของ AI ในการพลิกโฉมการสร้างวิดีโอและเพิ่มศักยภาพให้ผู้ใช้ด้วยเครื่องมือใหม่ๆ สำหรับการแสดงออกถึงตัวตน การทำงานร่วมกันครั้งนี้ถือเป็นก้าวหนึ่งสู่อนาคตของการเล่าเรื่องที่ทำงานด้วยระบบ AI ดูข้อมูลเพิ่มเติมเกี่ยวกับการสร้างด้วย Gemini ได้ที่เอกสารประกอบของ Gemini API และอ่านเพิ่มเติมเกี่ยวกับ Imagen 3 เพื่อดูความก้าวหน้าล่าสุดของเราในการสร้างรูปภาพ