SO HUU TRI TUE
Chủ nhật, 05/05/2024
  • Click để copy

AI mới của Microsoft ‘hô biến’ ảnh chân dung thành loạt biểu cảm sinh động

07:55, 24/04/2024
(SHTT) - VASA-1, công cụ AI mới của Microsoft, có thể chuyển đổi ảnh chân dung thành video nói hoặc hát với âm thanh cho trước một cách chân thực.

Công cụ này được phát triển bởi nhóm các chuyên gia AI tại Trung tâm Nghiên cứu Microsoft Châu Á. Trong bài viết đã xuất bản, nhóm cho biết đã tạo ra ứng dụng trên cơ sở lưu trữ dữ liệu mở arXiv và các video mẫu có sẵn trên trang dự án.

Nhóm nghiên cứu đã tìm cách tạo ra chuyển động cho các hình ảnh tĩnh để chúng có thể nói và hát với nét mặt tự nhiên bằng cách sử dụng bất kỳ đoạn âm thanh nào được cung cấp.

a1

VASA-1 cho phép hình ảnh tĩnh thể hiện các biểu cảm khuôn mặt sống động. Ảnh: arXiv 

Sản phẩm do công cụ VASA-1 sản xuất được mô tả là đã biến các hình ảnh tĩnh, dù là ảnh chụp bằng camera hay bức tranh vẽ, thành những hoạt ảnh "được đồng bộ hóa một cách tinh tế”.

Nhóm đã đăng tải nhiều đoạn video ngắn về kết quả thử nghiệm nhằm chứng minh hiệu quả của công cụ này. Trong đó, các video cho thấy bức họa Mona Lisa đang biểu diễn một bài hát rap, hình ảnh của một người phụ nữ biến thành một tiết mục ca hát, và tranh vẽ một người đàn ông đang phát biểu.

Trong các hoạt ảnh, với từng lời nói, biểu cảm của người trong ảnh cũng sẽ thay đổi theo cách nhấn mạnh những nội dung đang được trình bày.

Các tác giả lưu ý dù các video có tính sống động nhưng nếu quan sát kỹ vẫn có thể phát hiện ra sai sót để khẳng định chúng là sản phẩm của trí tuệ nhân tạo.

VASA-1 là thành quả của việc huấn luyện AI với hàng nghìn hình ảnh thể hiện nhiều biểu cảm khuôn mặt khác nhau. Hệ thống này hiện đang tạo ra các hoạt ảnh có độ phân giải 512 x 512 pixel chạy ở tốc độ 45 khung hình mỗi giây. Một  video sẽ cần trung bình hai phút để sản xuất bằng bộ xử lý đồ họa Nvidia RTX 4090 dành cho máy tính để bàn.

Nhận thức được khả năng bị lợi dụng cho mục đích xấu, nhóm tác giả hiện không cung cấp hệ thống này cho mục đích sử dụng chung. Nhóm không có kế hoạch phát hành bản demo trực tuyến, giao diện lập trình ứng dụng, sản phẩm, chi tiết triển khai hoặc bất kỳ dịch vụ liên quan nào cho đến khi chắc chắn công nghệ này sẽ được sử dụng một cách có trách nhiệm và tuân thủ các quy định thích đáng.

Hà Anh

Tin khác

Khoa học Công nghệ 3 giờ trước
(SHTT) - Là sân chơi sáng tạo công nghệ kỹ thuật gắn bó với sinh viên trong hơn 20 năm, cuộc thi Sáng tạo Robot Việt Nam - Robocon Việt Nam 2024 đã chính thức khởi tranh.
Khoa học Công nghệ 11 giờ trước
(SHTT) - Ngày càng có nhiều tập đoàn lớn của Nhật Bản, Hàn Quốc, Đài Loan (Trung Quốc) và đặc biệt là các tập đoàn của Hoa Kỳ đang đầu tư, hợp tác cụ thể tại Việt Nam ở ngành bán dẫn.
Khoa học Công nghệ 11 giờ trước
(SHTT) - Theo Bộ trưởng Bộ Thông tin và Truyền thông Nguyễn Mạnh Hùng, một trong những bước đi của chiến lược quốc gia về công nghiệp bán dẫn là xây dựng để Việt Nam trở thành trung tâm (hub) nhân lực toàn cầu về công nghiệp bán dẫn, từ đó tiến tới xây dựng nền công nghiệp bán dẫn tại Việt Nam.
Khoa học Công nghệ 2 ngày trước
(SHTT) - Theo tờ Interesting Engineering hôm 2/5 đưa tin, nhóm các công ty Nhật Bản đã mở đường cho kỷ nguyên 6G. Trong thử nghiệm gần đây, họ đã truyền siêu nhanh 100 gigabit mỗi giây (Gbps) ở tần số 100 GHz và 300 GHz qua khoảng cách 100 m.
Khoa học Công nghệ 2 ngày trước
(SHTT) - Vừa qua, UBND tỉnh Bắc Giang đã tổ chức phát động cuộc thi Robocon lần thứ nhất năm 2024, theo hình thức trực tiếp kết hợp với trực tuyến đến 9 điểm cầu của các phòng GD&ĐT các huyện, thị xã.