Ngày 11 tháng 12 năm 2024
Tái tạo quy trình sáng tạo video bằng Gemini 2.0 Flash
Gemini API không chỉ nâng cao các ứng dụng mà còn tạo ra một cuộc cách mạng trong việc thể hiện sự sáng tạo. Viggle, một ứng dụng video AI đang gây sốt trên mạng xã hội, cho phép mọi người biến ảnh thành ảnh động hấp dẫn, đang đi đầu trong cuộc cách mạng này. Bằng cách thử nghiệm khả năng kỳ diệu đa phương thức của Gemini 2.0 Flash (hiện chỉ có trong bản xem trước thử nghiệm) – cụ thể là khả năng hiểu video nâng cao và khả năng xuất âm thanh cùng với khả năng tạo hình ảnh của Imagen 3 – Viggle đang xây dựng các tính năng giúp người dùng dễ dàng biến những ý tưởng táo bạo nhất thành hiện thực theo những cách chưa từng có trước đây.
Bên trong Viggle: Hỗ trợ tính năng tạo video bằng AI nhờ Gemini 2.0 Flash và Imagen 3
Viggle đã thu hút hàng triệu người dùng nhờ khả năng dễ dàng biến những bức ảnh tĩnh thành video có chuyển động toàn thân, tạo ra nội dung lan truyền trên các nền tảng mạng xã hội. Tập trung vào nội dung về ảnh chế và nội dung khiêu vũ, Viggle cung cấp ứng dụng di động (iOS và Android) và một nền tảng web (viggle.ai). Các tính năng như hoán đổi khuôn mặt, tạo ảnh động cho hình ảnh bằng các động tác nhảy và chèn người dùng vào các cảnh trong phim đã được cộng đồng người dùng của Viggle ưa chuộng. Giờ đây, họ đang khám phá những cách thức mới để nâng cao khả năng sáng tạo.
Viggle hiện đang tạo mẫu cho 2 tính năng tận dụng sức mạnh của Gemini 2.0 Flash và Imagen 3:
Hình ảnh thành nhân vật ảo trong video: Viggle đang sử dụng Imagen 3 để tạo hình ảnh nhằm tạo ra một xưởng nhân vật dựa trên AI. Người dùng có thể đưa ra câu lệnh bằng văn bản đơn giản – "một chú robot đang nhảy với đôi mắt phát sáng" hoặc "một chú rồng mềm mại có màu cầu vồng" – và mô hình này sẽ tạo ra các nhân vật ảo độc đáo sẵn sàng xuất hiện trong video của họ. Sau đó, những nhân vật này sẽ được tích hợp liền mạch vào công cụ hoạt hoạ của Viggle, mở ra một vũ trụ với vô vàn khả năng kể chuyện theo cách riêng của bạn. Hãy tưởng tượng bạn đang đạo diễn một bộ phim hoạt hình ngắn của riêng mình với các nhân vật hoàn toàn do bạn tưởng tượng ra – đó là sức mạnh mà Viggle và Imagen 3 mang đến cho bạn.
Tính năng tường thuật bằng AI linh hoạt: Viggle cũng khai thác khả năng tạo lời nói và khả năng hiểu video chuyên sâu của Gemini 2.0 Flash để phát triển một tính năng bổ sung giọng lồng tiếng giàu ngữ cảnh cho mọi video. Đây không chỉ là giọng nói đơn điệu đọc kịch bản mà còn là một người kể chuyện AI phân tích nội dung video (xác định các khoảnh khắc, hành động và thậm chí cả cảm xúc chính) để tạo ra lời tường thuật bổ sung hoàn hảo cho hình ảnh. Cho dù đó là một bình luận hài hước về một video khiêu vũ hay một nội dung mô tả hoành tráng về một cảnh trong phim giả tưởng, thì người dẫn chuyện bằng AI sẽ mang đến một khía cạnh hoàn toàn mới cho mức độ tương tác.
Khai phá những cấp độ mới về khả năng sáng tạo và mức độ tương tác
Việc tích hợp AI tạo sinh sẽ giúp cải thiện trải nghiệm trên Viggle theo một số cách chính:
Đơn giản hoá quy trình tạo nhân vật: Tính năng tạo hình ảnh của Imagen 3 giúp đơn giản hoá quy trình tạo và tuỳ chỉnh nhân vật trong video. Giờ đây, người dùng có thể tạo các nhân vật độc đáo dựa trên ý tưởng của mình, mà không cần có kỹ năng thiết kế nâng cao hoặc phụ thuộc vào các lựa chọn đặt sẵn có hạn. Quy trình đơn giản này giúp nhiều người dùng hiện thực hoá tầm nhìn sáng tạo của mình hơn.
Nội dung phù hợp hơn: Gemini 2.0 Flash giúp người dùng tạo ra những câu chuyện video phù hợp với từng cá nhân. Các nhân vật được thiết kế riêng, kết hợp với giọng đọc linh hoạt của AI, giúp tạo nên những câu chuyện độc đáo, thắt chặt mối gắn kết giữa nhà sáng tạo và khán giả.
Mở rộng khả năng sáng tạo: Sự kết hợp giữa nhân vật ảo và lời tường thuật bằng AI giúp mở rộng tiềm năng sáng tạo của video dạng ngắn trên Viggle. Người dùng có thể khám phá những hình thức kể chuyện mới, vượt ra ngoài các định dạng video truyền thống.
Trong tương lai
Viggle rất mong muốn khám phá thêm tiềm năng của Gemini 2.0 và các mô hình tạo hình ảnh để cải thiện nền tảng của mình, đồng thời hình dung một tương lai mà AI được tích hợp liền mạch vào mọi bước của quy trình sáng tạo, giúp mọi người đều có thể trở thành nhà sáng tạo video.
"Tại Viggle, ai cũng là nhà sáng tạo. Chúng tôi đang tạo meme, khám phá công nghệ ghi hình chuyển động cho các dự án cấp cao và xây dựng đa vũ trụ của riêng mình. Với khả năng tường thuật bằng giọng nói chân thực của Gemini 2.0 Flash, chúng tôi tin rằng người dùng sẽ khai thác được tiềm năng mới, sáng tạo nội dung kể chuyện theo cách chưa từng có."
Việc Viggle hợp tác với Gemini 2.0 Flash và Imagen 3 cho thấy tiềm năng của AI trong việc chuyển đổi quy trình sáng tạo video và cung cấp cho người dùng các công cụ mới để thể hiện bản thân. Sự hợp tác này đánh dấu một bước tiến hướng tới tương lai của hoạt động kể chuyện dựa trên AI. Để tìm hiểu thêm về cách xây dựng bằng Gemini, hãy truy cập vào tài liệu về Gemini API và đọc thêm về Imagen 3 để biết những tiến bộ mới nhất của chúng tôi trong việc tạo hình ảnh.