Tencent ra mắt công cụ AI biến hình ảnh thành video sinh động
Công cụ tạo hoạt ảnh mới mang tên Follow-Your-Click, được phát hành trên trang web mã nguồn mở GitHub của Microsoft, cho phép người dùng nhấp chuột vào các điểm nhất định của một bức tranh, kèm theo dòng văn bản ngắn mô tả cách mà người dùng muốn hình ảnh chuyển động, từ đó biến hình ảnh tĩnh thành video hoạt ảnh ngắn.
Follow-Your-Click được tạo ra nhằm giải quyết vấn đề mà các mô hình chuyển đổi hình ảnh thành video khác thường gặp phải trên thị trường. Thay vì di chuyển toàn bộ cảnh, Follow-Your-Click tập trung vào các đối tượng cụ thể trong hình ảnh.
Theo nội dung mô tả cách thức hoạt động của công cụ mới, với đầu vào là hình ảnh con chim kèm dòng mô tả “vỗ cánh”, từ bức ảnh tĩnh, hình ảnh con chim có màu sắc cầu vồng đã được công cụ của Tencent biến thành cảnh động với chuyển động vẫy cánh bay mượt mà trong định dạng video MP4. Hình ảnh khác về cô gái đứng ngoài trời kèm theo dòng mô tả là “giông bão” đã biến bầu trời thành hình ảnh động với những tia sét lóe sáng ở phía sau.
Dự án này là kết quả của sự hợp tác giữa nhóm Hunyuan của Tencent với Đại học Khoa học và Công nghệ Hồng Kông và Đại học Thanh Hoa - hai trong số những trường đại học hàng đầu tại Bắc Kinh, Trung Quốc.
Tencent dự kiến sẽ phát hành toàn bộ mã nguồn cho công cụ này vào tháng 4. Tuy nhiên, người dùng có thể trải nghiệm phiên bản dùng thử đã có sẵn trên GitHub.
Nhóm nghiên cứu cho biết: "Mô hình chuyển đổi hoạt ảnh của chúng tôi mang lại sự kiểm soát đơn giản nhưng chính xác cho người dùng và hiệu suất tạo ra cũng tốt hơn so với các phương pháp trước đó".
Kể từ khi OpenAI, với sự hỗ trợ từ Microsoft, phát hành mô hình Sora chuyển đổi văn bản thành video, việc tạo video đã trở thành một đề tài nóng hổi. Kết quả ấn tượng từ mô hình này đã tạo ra một làn sóng mới trong ngành công nghiệp AI của Trung Quốc, khi các nhà khoa học đang nỗ lực để bắt kịp xu hướng trong lĩnh vực này.
Các đối thủ tại Trung Quốc của Tencent cũng đã bước vào cuộc đua công nghệ hoạt ảnh. Tập đoàn Alibaba gần đây đã ra mắt một công cụ tạo video chân dung có tên là EMO, có khả năng chuyển đổi hình ảnh và lời nhắc âm thanh thành video với khả năng hát và nói chuyện.
Được biết, trước Follow-Your-Click, Tencent đã phát hành VideoCrafter2, bộ công cụ chỉnh sửa và tạo video từ văn bản vào đầu năm nay. Đây là phiên bản cập nhật của VideoCrafter1, ra mắt vào tháng 10/2023, nhưng giới hạn chỉ tạo video có độ dài 2 giây.
Xuân Hiếu
TIN LIÊN QUAN
-
Phát minh mới: Anh chế tạo thiết bị trong áo ngực giúp tầm soát ung thư vú
-
Apple đang trong quá trình đàm phán để Gemini hỗ trợ các tính năng AI của iPhone
-
Elon Musk dự đoán trí tuệ nhân tạo sẽ vượt trội hơn con người trong năm 2025
-
Công nghệ in 3D mới: Vượt trội với độ bền và tốc độ nhanh gấp 5 lần