ง่ายเกินไป VASA-1 AI ใหม่ สร้าง Deepfake ได้ใช้รูปถ่ายแค่ใบเดียว

VASA-1

Microsoft Research Asia ได้เปิดตัวงานวิจัยใหม่เกี่ยวกับ AI ที่พวกเขาได้พัฒนาขึ้น นั่นคือ Visual Affective Skills Animator หรือ VASA -1

VASA-1 เป็นเฟรมเวิร์กแมชชีนเลิร์นนิงที่วิเคราะห์ภาพถ่ายใบหน้าแล้วทำให้เคลื่อนไหว พร้อมทั้งใส่เสียงประกอบเข้าไปได้ด้วย ความพิเศษของมันคือ มันสร้างวีดีโอได้ง่าย ๆ โดยใช้รูปถ่ายต้นแบบหรือไฟล์เสียงเพียงไฟล์เดียว

นอกจากนี้ VASA-1 ยังจำลองการแสดงออกทางสีหน้า การเคลื่อนไหวของศีรษะ และแม้กระทั่งการเคลื่อนไหวของร่างกายที่อาจไม่มีในไฟล์รูปได้ด้วยนะ (หากไฟล์ภาพเป็นแบบเต็มตัว การแสดงการเคลื่อนไหว ก็คงสมบูรณ์แบบขึ้น)

ถึงจะเจ๋งกว่า AI ในอดีต แต่ VASA-1 มันยังมีข้อบกพร่องเหมือนกับ Generative AI อื่น ๆ นั่นคือ รายละเอียดต่าง ๆ ที่ยังไม่สมจริง เช่น ฟันที่มักไม่สมส่วน ซึ่งทำให้เรามองออกได้ง่ายเลยว่าเขาไม่ใช่คนจริง ๆ นอกจากนี้ ยังมีเรื่องของการแสดงท่าทางและสายตาขณะพูดครับ

มีความกังวลเหมือนกันนะว่า เทคโนโลยีนี้จะถูกนำไปใช้กับ Deepfake หรือเปล่า มันต้องมีผู้ไม่หวังดีแน่นอน แต่ทีมวิจัยยืนยันว่า ยังไม่มีแผนที่จะเผยแพร่การสาธิตออนไลน์, API, รายละเอียดการใช้งานเพิ่มเติม หรือข้อเสนอใดๆ ที่เกี่ยวข้อง จนกว่าจะแน่ใจว่า VASA-1 จะถูกนำไปใช้อย่างถูกต้อง

ที่มา
techspot