AI mới của Microsoft ‘hô biến’ ảnh chân dung thành loạt biểu cảm sinh động

(SHTT) - VASA-1, công cụ AI mới của Microsoft, có thể chuyển đổi ảnh chân dung thành video nói hoặc hát với âm thanh cho trước một cách chân thực.

Công cụ này được phát triển bởi nhóm các chuyên gia AI tại Trung tâm Nghiên cứu Microsoft Châu Á. Trong bài viết đã xuất bản, nhóm cho biết đã tạo ra ứng dụng trên cơ sở lưu trữ dữ liệu mở arXiv và các video mẫu có sẵn trên trang dự án.

Nhóm nghiên cứu đã tìm cách tạo ra chuyển động cho các hình ảnh tĩnh để chúng có thể nói và hát với nét mặt tự nhiên bằng cách sử dụng bất kỳ đoạn âm thanh nào được cung cấp.

VASA-1 cho phép hình ảnh tĩnh thể hiện các biểu cảm khuôn mặt sống động. Ảnh: arXiv 

Sản phẩm do công cụ VASA-1 sản xuất được mô tả là đã biến các hình ảnh tĩnh, dù là ảnh chụp bằng camera hay bức tranh vẽ, thành những hoạt ảnh "được đồng bộ hóa một cách tinh tế”.

Nhóm đã đăng tải nhiều đoạn video ngắn về kết quả thử nghiệm nhằm chứng minh hiệu quả của công cụ này. Trong đó, các video cho thấy bức họa Mona Lisa đang biểu diễn một bài hát rap, hình ảnh của một người phụ nữ biến thành một tiết mục ca hát, và tranh vẽ một người đàn ông đang phát biểu.

Trong các hoạt ảnh, với từng lời nói, biểu cảm của người trong ảnh cũng sẽ thay đổi theo cách nhấn mạnh những nội dung đang được trình bày.

Các tác giả lưu ý dù các video có tính sống động nhưng nếu quan sát kỹ vẫn có thể phát hiện ra sai sót để khẳng định chúng là sản phẩm của trí tuệ nhân tạo.

VASA-1 là thành quả của việc huấn luyện AI với hàng nghìn hình ảnh thể hiện nhiều biểu cảm khuôn mặt khác nhau. Hệ thống này hiện đang tạo ra các hoạt ảnh có độ phân giải 512 x 512 pixel chạy ở tốc độ 45 khung hình mỗi giây. Một  video sẽ cần trung bình hai phút để sản xuất bằng bộ xử lý đồ họa Nvidia RTX 4090 dành cho máy tính để bàn.

Nhận thức được khả năng bị lợi dụng cho mục đích xấu, nhóm tác giả hiện không cung cấp hệ thống này cho mục đích sử dụng chung. Nhóm không có kế hoạch phát hành bản demo trực tuyến, giao diện lập trình ứng dụng, sản phẩm, chi tiết triển khai hoặc bất kỳ dịch vụ liên quan nào cho đến khi chắc chắn công nghệ này sẽ được sử dụng một cách có trách nhiệm và tuân thủ các quy định thích đáng.

Hà Anh