SO HUU TRI TUE
Thứ ba, 11/02/2025
  • Click để copy

AI mới của Microsoft ‘hô biến’ ảnh chân dung thành loạt biểu cảm sinh động

07:55, 24/04/2024
(SHTT) - VASA-1, công cụ AI mới của Microsoft, có thể chuyển đổi ảnh chân dung thành video nói hoặc hát với âm thanh cho trước một cách chân thực.

Công cụ này được phát triển bởi nhóm các chuyên gia AI tại Trung tâm Nghiên cứu Microsoft Châu Á. Trong bài viết đã xuất bản, nhóm cho biết đã tạo ra ứng dụng trên cơ sở lưu trữ dữ liệu mở arXiv và các video mẫu có sẵn trên trang dự án.

Nhóm nghiên cứu đã tìm cách tạo ra chuyển động cho các hình ảnh tĩnh để chúng có thể nói và hát với nét mặt tự nhiên bằng cách sử dụng bất kỳ đoạn âm thanh nào được cung cấp.

a1

VASA-1 cho phép hình ảnh tĩnh thể hiện các biểu cảm khuôn mặt sống động. Ảnh: arXiv 

Sản phẩm do công cụ VASA-1 sản xuất được mô tả là đã biến các hình ảnh tĩnh, dù là ảnh chụp bằng camera hay bức tranh vẽ, thành những hoạt ảnh "được đồng bộ hóa một cách tinh tế”.

Nhóm đã đăng tải nhiều đoạn video ngắn về kết quả thử nghiệm nhằm chứng minh hiệu quả của công cụ này. Trong đó, các video cho thấy bức họa Mona Lisa đang biểu diễn một bài hát rap, hình ảnh của một người phụ nữ biến thành một tiết mục ca hát, và tranh vẽ một người đàn ông đang phát biểu.

Trong các hoạt ảnh, với từng lời nói, biểu cảm của người trong ảnh cũng sẽ thay đổi theo cách nhấn mạnh những nội dung đang được trình bày.

Các tác giả lưu ý dù các video có tính sống động nhưng nếu quan sát kỹ vẫn có thể phát hiện ra sai sót để khẳng định chúng là sản phẩm của trí tuệ nhân tạo.

VASA-1 là thành quả của việc huấn luyện AI với hàng nghìn hình ảnh thể hiện nhiều biểu cảm khuôn mặt khác nhau. Hệ thống này hiện đang tạo ra các hoạt ảnh có độ phân giải 512 x 512 pixel chạy ở tốc độ 45 khung hình mỗi giây. Một  video sẽ cần trung bình hai phút để sản xuất bằng bộ xử lý đồ họa Nvidia RTX 4090 dành cho máy tính để bàn.

Nhận thức được khả năng bị lợi dụng cho mục đích xấu, nhóm tác giả hiện không cung cấp hệ thống này cho mục đích sử dụng chung. Nhóm không có kế hoạch phát hành bản demo trực tuyến, giao diện lập trình ứng dụng, sản phẩm, chi tiết triển khai hoặc bất kỳ dịch vụ liên quan nào cho đến khi chắc chắn công nghệ này sẽ được sử dụng một cách có trách nhiệm và tuân thủ các quy định thích đáng.

Hà Anh

Tin khác

Khoa học Công nghệ 6 giờ trước
(SHTT) - Năm 2024 chứng kiến sự bùng nổ mạnh mẽ của trí tuệ nhân tạo (AI) với hàng loạt công nghệ đột phá. Tuy nhiên, bước sang năm 2025, cuộc cạnh tranh trong lĩnh vực AI còn trở nên khốc liệt hơn bao giờ hết, khi các ông lớn công nghệ chạy đua để giành lấy vị trí dẫn đầu trong kỷ nguyên AI.
Khoa học Công nghệ 14 giờ trước
(SHTT) - Giải thưởng Sáng tạo châu Á của Quỹ toàn cầu Hitachi vừa công bố các nhà khoa học khu vực ASEAN đoạt giải năm 2024, trong đó có đến 6 nhà khoa học Việt Nam.
Khoa học Công nghệ 1 ngày trước
(SHTT) - Kết thúc vòng chung kết cuộc thi Công nghệ trẻ châu Á - Youth Tech Asia Challenge (YTAC 2025) đoàn Việt Nam đã xuất sắc giành được 2 Huy chương vàng và 2 Huy chương bạc.
Khoa học Công nghệ 1 ngày trước
(SHTT) - Diễn đàn Đổi mới Sáng tạo Việt Nam Toàn cầu 2025 (Vietnam Global Innovation Connect – VGIC 2025) sẽ diễn ra từ ngày 20-22/2/2025 tại Singapore. Sự kiện do AVSE Global – Tổ chức Khoa học và Chuyên gia Việt Nam Toàn cầu (Pháp) phối hợp cùng Ban Liên lạc Cộng Đồng Người Việt Nam tại Singapore (VNAS) tổ chức.
Khoa học Công nghệ 1 ngày trước
CTCP Trạm sạc Fast+, V-GREEN - công ty chuyên phát triển mạng lưới trạm sạc ô tô điện cho VinFast - vừa ra mắt công nghệ mới mang tên LINK, ghi dấu ấn đột phá mới trong hệ thống sạc xe điện công suất cao.
.
Liên kết hữu ích
..