ทำภาพนิ่งให้มีชีวิต Google เปิดตัวฟีเจอร์ “VLOGGER” ใช้เทคโนโลยี AI สร้างวิดีโอสั้น
“VLOGGER: Multimodal Diffusion for Embodied Avatar Sclusion” เป็นโมเดล AI ประมวลภาพให้ตรงกับเสียง การแสดงออกทางสีหน้า การเคลื่อนไหวศีรษะ และท่าทางมือเหมือนอัดคลิปวิดีโอจริง ๆ
นักวิจัยของ Google เผยว่าฟีเจอร์เกิดมาเพื่อซับพอร์ตคนขี้อาย ผู้ที่มีปัญหาในการพูดคุยหน้ากล้อง หรือผู้ใช้ YouTube ต้องการสร้างเนื้อหาอย่างรวดเร็ว
โดยเริ่มสร้างวิดีโอผสมแอนิเมชันนี้รวมถึงการซิงค์การเคลื่อนไหวของริมฝีปากและเพิ่มภาษากายที่เป็นธรรมชาติ โดยมุ่งเป้าไปที่ผลลัพธ์ที่ให้ความรู้สึกเหมือนจริงไม่ใช่หุ่นยนต์
แต่มันเป็นแค่การเริ่มต้นเท่านั้น เพราะ VLOGGER ยังคงมีข้อจำกัดหลายด้าน เนื่องจากวิดีโอที่สร้างขึ้นนั้นต้องเป็นวิดีโอสั้นและมีพื้นหลังแบบคงที่ จะไม่สามารถใช้กับการเคลื่อนไหวอื่น ๆ เช่น ลุกเดิน หรือมีสภาพแวดล้อม 3 มิติ
แต่ถือเป็นก้าวสำคัญในอนาคตที่เมื่อพัฒนาให้ฟีเจอร์สามารถใช้ได้จริง หลายคนจะได้สร้างผลงานด้วย AI กันมากขึ้น แต่ก็ต้องมีข้อจำกัดเพราะก็กลัวว่ามิจฉาชีพจะเอาประโยชน์ของ AI ไปใช้ในทางที่ผิด
ที่มา : venturebeat
#VLOGGER #Google #AI #TechhubUpdate