Công nghệ tai nghe mới khử tiếng ồn bằng AI cho phép chọn lọc âm thanh để nghe

(SHTT) - Một nhóm do các nhà nghiên cứu tại Đại học Washington dẫn đầu đã phát triển các thuật toán học sâu cho phép người dùng chọn âm thanh nào lọc qua tai nghe của họ trong thời gian thực.

 Hầu hết những ai đã sử dụng tai nghe khử tiếng ồn, đều biết rằng việc nghe đúng tiếng ồn vào thời điểm thích hợp rất quan trọng. Ai đó muốn loại bỏ tiếng còi ô tô khi làm việc trong nhà, nhưng lại không phải khi đi dọc những con phố đông đúc. Tuy nhiên, mọi người không thể chọn lọc âm thanh để tai nghe loại bỏ.

 

Giờ đây, nhóm nghiên cứu do các nhà khoa học tại Đại học Washington, Hoa Kỳ dẫn đầu, đã phát triển các thuật toán học sâu cho phép người dùng lựa chọn âm thanh mà tai nghe có thể lọc trong thời gian thực. Hệ thống này được gọi là “nghe ngữ nghĩa”. Tai nghe truyền âm thanh thu được đến điện thoại thông minh kết nối, giúp loại bỏ tất cả các âm thanh trong môi trường.

Thông qua khẩu lệnh bằng giọng nói hoặc ứng dụng điện thoại thông minh, người đeo tai nghe có thể chọn lọc những âm thanh mà họ muốn nghe từ 20 loại âm thanh như còi báo động, tiếng khóc của em bé, lời nói, tiếng máy hút bụi và tiếng chim hót. Chỉ những âm thanh đã chọn mới được phát qua tai nghe. Trong tương lai, các nhà nghiên cứu dự kiến sẽ phát hành phiên bản thương mại của hệ thống.

GS. Shyam Gollakota, đồng tác giả nghiên cứu cho biết: “Hiểu được âm thanh của con chim và tách nó khỏi các âm thanh khác trong môi trường đòi hỏi phải có thiết bị thông minh theo thời gian thực mà tai nghe khử tiếng ồn hiện nay chưa làm được. Thách thức nằm ở chỗ âm thanh mà người đeo tai nghe nghe được, cần phải đồng bộ với giác quan thị giác của họ. Bạn không thể nghe thấy giọng nói của ai đó hai giây sau khi họ nói chuyện với bạn. Điều này có nghĩa là các thuật toán thần kinh phải xử lý âm thanh trong thời gian dưới một phần trăm giây".

Do sự gò bó về thời gian nên hệ thống thính giác ngữ nghĩa phải xử lý âm thanh trên một thiết bị như điện thoại thông minh được kết nối, thay vì trên các máy chủ đám mây. Ngoài ra, âm thanh phát ra từ các hướng khác nhau đến tai mọi người vào những thời điểm khác nhau nên hệ thống phải duy trì độ trễ này và các tín hiệu không gian khác để mọi người vẫn có thể nghe hiểu âm thanh trong môi trường xung quanh.

Hệ thống mới đã được thử nghiệm trong các môi trường như văn phòng, đường phố và công viên với khả năng trích xuất tiếng còi báo động, tiếng chim hót, chuông báo thức và các âm thanh khác trong mục tiêu, đồng thời loại bỏ tất cả tiếng ồn khác trong môi trường xung quanh. Khi 22 người tham gia đánh giá đầu ra âm thanh của hệ thống với âm thanh mục tiêu, nhìn chung, âm thanh được cải tiến so với bản ghi âm thanh gốc.

Trong một số trường hợp, hệ thống gặp khó khăn trong việc phân biệt giữa các âm thanh có nhiều đặc tính như giọng hát và lời nói của con người. Tuy nhiên, việc đào tạo các mô hình dựa trên dữ liệu thực tế hơn có thể cải thiện những kết quả này.

T/H (Theo Techxplore)