SO HUU TRI TUE
Thứ sáu, 24/05/2024
  • Click để copy

AI mới của Microsoft ‘hô biến’ ảnh chân dung thành loạt biểu cảm sinh động

07:55, 24/04/2024
(SHTT) - VASA-1, công cụ AI mới của Microsoft, có thể chuyển đổi ảnh chân dung thành video nói hoặc hát với âm thanh cho trước một cách chân thực.

Công cụ này được phát triển bởi nhóm các chuyên gia AI tại Trung tâm Nghiên cứu Microsoft Châu Á. Trong bài viết đã xuất bản, nhóm cho biết đã tạo ra ứng dụng trên cơ sở lưu trữ dữ liệu mở arXiv và các video mẫu có sẵn trên trang dự án.

Nhóm nghiên cứu đã tìm cách tạo ra chuyển động cho các hình ảnh tĩnh để chúng có thể nói và hát với nét mặt tự nhiên bằng cách sử dụng bất kỳ đoạn âm thanh nào được cung cấp.

a1

VASA-1 cho phép hình ảnh tĩnh thể hiện các biểu cảm khuôn mặt sống động. Ảnh: arXiv 

Sản phẩm do công cụ VASA-1 sản xuất được mô tả là đã biến các hình ảnh tĩnh, dù là ảnh chụp bằng camera hay bức tranh vẽ, thành những hoạt ảnh "được đồng bộ hóa một cách tinh tế”.

Nhóm đã đăng tải nhiều đoạn video ngắn về kết quả thử nghiệm nhằm chứng minh hiệu quả của công cụ này. Trong đó, các video cho thấy bức họa Mona Lisa đang biểu diễn một bài hát rap, hình ảnh của một người phụ nữ biến thành một tiết mục ca hát, và tranh vẽ một người đàn ông đang phát biểu.

Trong các hoạt ảnh, với từng lời nói, biểu cảm của người trong ảnh cũng sẽ thay đổi theo cách nhấn mạnh những nội dung đang được trình bày.

Các tác giả lưu ý dù các video có tính sống động nhưng nếu quan sát kỹ vẫn có thể phát hiện ra sai sót để khẳng định chúng là sản phẩm của trí tuệ nhân tạo.

VASA-1 là thành quả của việc huấn luyện AI với hàng nghìn hình ảnh thể hiện nhiều biểu cảm khuôn mặt khác nhau. Hệ thống này hiện đang tạo ra các hoạt ảnh có độ phân giải 512 x 512 pixel chạy ở tốc độ 45 khung hình mỗi giây. Một  video sẽ cần trung bình hai phút để sản xuất bằng bộ xử lý đồ họa Nvidia RTX 4090 dành cho máy tính để bàn.

Nhận thức được khả năng bị lợi dụng cho mục đích xấu, nhóm tác giả hiện không cung cấp hệ thống này cho mục đích sử dụng chung. Nhóm không có kế hoạch phát hành bản demo trực tuyến, giao diện lập trình ứng dụng, sản phẩm, chi tiết triển khai hoặc bất kỳ dịch vụ liên quan nào cho đến khi chắc chắn công nghệ này sẽ được sử dụng một cách có trách nhiệm và tuân thủ các quy định thích đáng.

Hà Anh

Tin khác

Khoa học Công nghệ 9 giờ trước
(SHTT) - UBND thành phố Hà Nội vừa thống nhất với kiến nghị của Sở Giao thông vận tải triển khai thí điểm hệ thống giao thông thông minh trên địa bàn thành phố trong thời gian từ tháng 6 đến tháng 12/2024.
Khoa học Công nghệ 13 giờ trước
(SHTT) - Các nhà khoa học quốc tế mới đây đã phát triển thành công hệ thống xúc giác nhân tạo cho phép robot có những bàn tay giả có khả năng cảm nhận nhạy cảm như con người.
Khoa học Công nghệ 1 ngày trước
(SHTT) - Mới đây, Hội nghị thượng đỉnh toàn cầu về trí tuệ nhân tạo (AI) do Hàn Quốc và Anh đồng tổ chức đã thông qua tuyên bố về việc thúc đẩy AI an toàn, sáng tạo và toàn diện để giải quyết các thách thức và cơ hội liên quan đến công nghệ đang phát triển nhanh chóng này.
Khoa học Công nghệ 1 ngày trước
(SHTT) - Bộ Khoa học và Công nghệ đang dự thảo Thông tư quy định đánh giá, nghiệm thu kết quả thực hiện nhiệm vụ khoa học và công nghệ cấp quốc gia sử dụng ngân sách nhà nước.
Khoa học Công nghệ 2 ngày trước
(SHTT) - Hôm 20/5/2024, Microsoft chính thức trình làng dòng máy tính cá nhân mới được tích hợp tính năng AI tiên tiến. Đây là động thái cho thấy gã khổng lồ công nghệ này đang đẩy mạnh ứng dụng AI vào các sản phẩm của mình, nhằm gia tăng lợi thế cạnh tranh trong bối cảnh thị trường AI đang ngày càng sôi động.