Khoa học Công nghệ

Click để copy

Tiến sĩ Việt phát triển thành công mô hình AI có khả năng chuyển văn bản thành hình ảnh minh họa

10:33, 25/08/2022

(SHTT) - TS Lương Minh Thắng (34 tuổi) cùng các cộng sự thuộc nhóm chuyên gia tại Google Brain mới đây đã thành công trong việc xây dựng mô hình Parti có khả năng dạy AI vẽ tranh dựa trên các văn bản mô tả.

Bắt đầu tiến hành nghiên cứu từ năm 2021, nhóm nghiên cứu chủ chốt về mô hình Parti (Pathways Autoregressive Text-to-Image) - tự chuyển văn bản thành hình ảnh tại Google Brain do TS Lương Minh thắng cùng 10 cộng sự quốc tế khác đã tìm ra cách dạy cho trí tuệ nhân tạo (AI) cách để tạo ra các bức tranh minh họa.

ai-ve-tranh-3-jpeg-2284-166073-3433-6552-1661247764 — **TS Lương Minh Thắng hiện làm việc cho Google Brain chuyên phát triển các sản phẩm AI. Ảnh: NVCC**

Chia sẻ với VNE, TS Thắng cho biết, các mô hình AI hiện nay ứng dụng trong ngôn ngữ thông qua mô hình chatbot có thể tương tác với con người bằng văn bản. Còn trong lĩnh vực hình ảnh, AI có thể nhận diện các vật thể trong ảnh.

Nếu kết hợp hai thứ này để chuyển hóa từ ngôn ngữ dạng văn bản thành hình ảnh sẽ tạo ra một mô hình AI rất hiện đại, hỗ trợ đắc lực cho con người trong lĩnh vực sáng tạo hình ảnh. Đây cũng chính là lý do khiến Parti được bắt đầu.

Mô hình Parti cho phép tạo hình ảnh đúng như mô tả và mong muốn của người dùng. Công nghệ này có thể hỗ trợ những người chuyên làm công việc sáng tạo hình ảnh như nghệ sĩ, nhiếp ảnh gia, nhà thiết kế thời trang, đồ họa... Khi họ có ý tưởng về một bức ảnh, chỉ cần viết các chi tiết mong muốn, AI sẽ phân tích và cho ra bức ảnh gợi ý cho ý tưởng đó giúp họ tăng khả năng sáng tạo. Chỉ cần thay đổi một câu, từ, hay chi tiết trong văn bản có thể cho ra bức ảnh khác nhau.

Để tạo ra mô hình Parti, nhóm chuyên gia đã sử dụng hàng trăm triệu cặp dữ liệu văn bản - hình ảnh tương ứng, huấn luyện cho mô hình AI. Dữ liệu được sử dụng từ các website, xử lý bằng mạng nơ-ron nhân tạo có dung lượng khoảng 20 tỷ nơ-ron. "Dựa trên những dữ liệu văn bản và hình ảnh, AI sẽ kết hợp lại để tạo ra một bức ảnh mới, giúp con người có những ý tưởng mới", TS Thắng chia sẻ.

Các chủ đề được mô hình Parti thể hiện nhiều nhất về thiên nhiên, động vật, đồ vật... Trên website của Google Reseach giới thiệu nhiều hình ảnh được tạo từ AI như ảnh thật.

Theo nhóm nghiên cứu, với những hình ảnh liên quan đến con người được nhóm xử lý cẩn trọng dựa trên nguyên tắc không gây ảnh hưởng tiêu cực đến cộng đồng về giới tính, sắc tộc, tôn giáo...

AI-ve-tranh-9299-1660732893 — **Những bức tranh sơn dầu theo phong cách họa sĩ nổi tiếng Van Gogh do AI thực hiện. Ảnh chụp màn hình**

Tuy nhiên, nếu phần mô tả là các văn bản quá dài, yêu cầu quá nhiều chi tiết, hay mô tả những hình ảnh có tính xung đột (như biển đặt cạnh sa mạc) thì AI có thể hiểu sai hoặc không cho ra kết quả.

TS Thắng cho biết, thời gian tới nhóm sẽ khắc phục hạn chế này để xây dựng mô hình AI hoàn thiện. Nhóm tính tới huấn luyện AI có thể chỉnh sửa hình ảnh theo yêu cầu trên văn bản của người dùng để phục vụ họ tốt hơn cũng như nghiên cứu tạo video từ nhiều tấm ảnh có nội dung tương tự nhau.

Nhật Lam

Tin khác

Xe máy điện Pega eSmart AI vừa ra mắt tại Việt Nam có gì ấn tượng?

Khoa học Công nghệ 12 giờ trước

(SHTT) - Công ty xe điện Pega Việt Nam vừa ra mắt sản phẩm xe máy điện mới Pega eSmart AI - sản phẩm được giới thiệu là "chiếc xe máy điện thông minh nhất hiện nay".

Triển lãm sản phẩm khoa học, công nghệ và đổi mới sáng tạo: Không gian xúc tiến giao dịch công nghệ

Khoa học Công nghệ 18 giờ trước

(SHTT) - Ngày 25/4, tại Hà Nội, "Triển lãm sản phẩm khoa học, công nghệ và đổi mới sáng tạo" đã chính thức diễn ra. Chương trình với 20 gian hàng đến từ các đơn vị, doanh nghiệp được kỳ vọng sẽ trở thành nơi hỗ trợ kết nối, xúc tiến giao dịch công nghệ.

Vì sao các ông lớn lại thích sử dụng hình ảnh nhân vật hoạt hình trong marketing?

Siêu lợi nhuận từ việc sản xuất thực phẩm chức năng giả

Xe máy điện Pega eSmart AI vừa ra mắt tại Việt Nam có gì ấn tượng?

Doanh nghiệp trăn trở về quảng cáo ngoài trời

Shimano tiết lộ sáng chế bộ truyền động không dây đột phá cho xe đạp

Ngân hàng ứng dụng số hóa giúp doanh nghiệp giải ngân khoản vay trong 5 phút

TikTok dừng tính năng kiếm tiền tại Mỹ, nguyên nhân do đâu?

Hà Nội tổ chức sự kiện hưởng ứng Ngày Sở hữu trí tuệ thế giới năm 2024

Chính thức Phát động Tháng Công nhân và Tháng hành động An toàn vệ sinh lao động năm 2024

ĐHCĐ Vinamilk: Cổ đông quan tâm về chiến lược thương hiệu, sản phẩm và phát triển bền vững

Giải cờ vua chuyên nghiệp Đà Nẵng mở rộng tranh cúp Sở hữu trí tuệ

Công ty TNHH Đại lý Bảo hiểm ANT: Xây dựng cộng đồng bảo hiểm tử tế

Triển lãm sản phẩm khoa học, công nghệ và đổi mới sáng tạo: Không gian xúc tiến giao dịch công nghệ

Hải Dương: Bắt giữ và tiêu hủy hơn 10.000 con vịt giống lậu

Những lưu ý mới trong thủ tục Đăng ký dự thi tốt nghiệp trung học phổ thông

Tiến sĩ Việt phát triển thành công mô hình AI có khả năng chuyển văn bản thành hình ảnh minh họa

TIN LIÊN QUAN

Hà Nội: Bắt giữ nhiều sản phẩm đồ chơi gắn hình ảnh bản đồ 'đường lưỡi bò' nhập lậu

Long An: Bảo hộ chỉ dẫn địa lý cho sản phẩm khoai mỡ Bến Kè

Thuốc giả, TPCN giả hoành hành: Nguyên nhân do đâu?

Gas lậu: Đừng ham rẻ mà mang 'bom nổ chậm' về nhà!

Tin khác

Xe máy điện Pega eSmart AI vừa ra mắt tại Việt Nam có gì ấn tượng?

Triển lãm sản phẩm khoa học, công nghệ và đổi mới sáng tạo: Không gian xúc tiến giao dịch công nghệ

Lỗi phụ tùng, hàng trăm nghìn ô tô Hyundai và Kia bị triệu hồi

Sáng tạo và đổi mới đã trở thành một phần không thể thiếu của cuộc sống

AI mới của Microsoft ‘hô biến’ ảnh chân dung thành loạt biểu cảm sinh động