SO HUU TRI TUE
Thứ năm, 18/04/2024
  • Click để copy

Phát triển phương pháp ngăn chặn chatbot sử dụng ngôn ngữ độc hại

11:19, 26/04/2022
(SHTT) - Các nhà nghiên cứu tại Đại học California (UC), San Diego đã phát triển thuật toán, nhằm loại bỏ ngôn ngữ mang tính xúc phạm do phần mềm tự động hóa (hay còn được gọi là bot) tạo ra trên mạng xã hội và những nền tảng khác.

Chatbot sử dụng ngôn ngữ độc hại đang là một vấn đề “nóng hổi” nhưng có lẽ, ví dụ tiêu biểu nhất là Tay, một chatbot trên Twitter được Microsoft công bố vào tháng 3/2016.

Trong vòng chưa đầy 24 giờ, Tay đã học hỏi từ các cuộc trò chuyện trên Twitter và bắt đầu lặp lại một số câu nói xúc phạm, bao gồm phân biệt chủng tộc và kỳ thị nữ giới.

rb

Chatbot có thể phát tán những nội dung mang tính công kích, không lành mạnh 

Chatbot thường được đào tạo để lặp lại câu nói của những đối tượng tham gia cuộc trò chuyện. Ngoài ra, bot có thể tiếp thu nhiều nội dung (thường chứa ngôn ngữ độc hại và hướng đến định kiến xã hội) từ các cuộc trò chuyện thực tế.

Tuy nhiên, bot chỉ học ngôn ngữ của nhóm một số nhóm người nhất định. Ví dụ, bot đưa ra tuyên bố tiêu cực và những định kiến về một quốc gia vì nó đang học hỏi từ nhóm mọi người có cái nhìn tiêu cực về quốc gia đó.

Canwen Xu, nghiên cứu sinh ngành khoa học máy tính tại UC, San Diego, đồng thời là tác giả chính của đề tài này, cho rằng: “Ngành công nghiệp đang cố gắng phá vỡ giới hạn của các mô hình ngôn ngữ”.

“Với tư cách là các nhà nghiên cứu, chúng tôi đang xem xét toàn diện tác động xã hội của mô hình ngôn ngữ và giải quyết những mối lo ngại”, ông Canwen cho biết.

Các nhà nghiên cứu và chuyên gia trong ngành đã thử nghiệm một số phương pháp tiếp cận để điều chỉnh cách nói chuyện của bot nhưng không thành công.

Việc thiết lập danh sách các từ độc hại sẽ bỏ sót những từ lành mạnh khi được sử dụng riêng lẻ nhưng lại mang tính công kích khi kết hợp với các từ khác. Điều này tiêu tốn nhiều thời gian mà đem lại hiệu quả. Giải pháp phát triển mạng thần kinh nhân tạo có thể giúp phân loại ngôn ngữ độc hại cũng đối mặt vấn đề tương tự.

Thay vào đó, nhóm các nhà khoa học máy tính tại UC, San Diego sẽ đưa nội dung độc hại vào một mô hình ngôn ngữ được đào tạo trước. Sau đó, họ huấn luyện “mô hình ác ý” dự đoán khả năng độc hại và “mô hình lành mạnh” có khả năng lọc tất cả các nội dung có tính tiêu cực cao.

Theo kết quả xác minh, mô hình lành mạnh cũng như các phương pháp hiện đại mang lại hiệu quả lên tới 23%.

rb1

 

Họ đã trình bày công trình nghiên cứu của mình tại Hội nghị về Trí tuệ nhân tạo của Hiệp hội vì sự tiến bộ của trí tuệ nhân tạo (AAAI) được tổ chức trực tuyến vào tháng 3/2022.

Giáo sư Julian McAuley tại Khoa Kỹ thuật và Khoa học Máy tính tại UC, San Diego, đồng thời là tác giả chính của đề tài khẳng định các nhà nghiên cứu có thể phát triển giải pháp này vì nó có tính ứng dụng cao trên nhiều lĩnh vực chuyên môn.

Ông cũng chia sẻ thêm: “Phòng thí nghiệm của chúng tôi có chuyên môn về ngôn ngữ lập trình, xử lý ngôn ngữ tự nhiên và loại bỏ thuật toán. Vấn đề và giải pháp của chúng tôi nằm ở giao điểm của tất cả các chủ đề này”.

Tuy nhiên, mô hình ngôn ngữ này vẫn còn nhiều thiếu sót. Ví dụ, từ đánh giá sai lệch, bot tránh các cuộc thảo luận của một số nhóm, vì chủ đề của họ này thường gắn với ngôn từ kích động thù địch và nội dung độc hại. Các nhà nghiên cứu dự định sẽ tập trung vào vấn đề này trong tương lai.

Zexue He, nghiên cứu sinh khoa học máy tính, đồng thời là một trong những đồng tác giả của đề tài, cho biết: “Chúng tôi muốn tạo ra một mô hình ngôn ngữ thân thiện hơn với các nhóm người khác nhau”.

Đồng tác giả khác của đề tài, nghiên cứu sinh Zhankui He nhận định công trình có thể được ứng dụng trong các lĩnh vực khác ngoài chatbots, như đa dạng hóa và khử độc các hệ thống gợi ý.

Thu Nga

Tin khác

Khoa học Công nghệ 2 phút trước
(SHTT) - Bộ trưởng Bộ KH&CN Huỳnh Thành Đạt đánh giá ngành công nghiệp bán dẫn đang có vai trò ngày càng quan trọng đối với nền kinh tế toàn cầu, với quy mô trên 520 tỷ USD năm 2023 và vẫn tiếp tục tăng trưởng nhanh.
Khoa học Công nghệ 1 giờ trước
(SHTT) - Patlytics là một nền tảng phân tích bằng sáng chế được hỗ trợ bởi AI, nhằm giúp các doanh nghiệp, chuyên gia sở hữu trí tuệ và công ty luật tăng tốc quy trình làm việc liên quan đến bằng sáng chế.
Khoa học Công nghệ 7 giờ trước
(SHTT) - Spotify không phải là công ty duy nhất thử nghiệm việc sử dụng trí tuệ nhân tạo để tạo danh sách phát. Amazon vừa thông báo họ cũng sẽ làm điều tương tự, và hiện đang thử nghiệm một công cụ tạo danh sách phát AI - Maestro.
Khoa học Công nghệ 7 giờ trước
(SHTT) - Một nghiên cứu mới từ Turnitin, nhà phát triển nền tảng chống đạo văn hàng đầu, đã khám phá xu hướng mới trong việc viết bài của sinh viên trên toàn cầu, từ đó mở ra cuộc thảo luận về vai trò của AI trong giáo dục hiện đại.
Khoa học Công nghệ 1 ngày trước
(SHTT) - Hãng xe Mercedes-Benz vừa phát đi thông tin triệu hồi dòng xe E-Class vì lỗi bơm nhiên liệu tại Việt Nam.