Nghiên cứu AI xử lý giọng nói của nhóm kỹ sư trẻ Việt được quốc tế công nhận

(SHTT) - Mới đây, nhóm kỹ sư Zalo AI đã được công nhận tại Hội nghị châu Á - Thái Bình Dương về trí tuệ nhân tạo quốc tế với hai đề tài nghiên cứu liên quan đến công nghệ xử lý tiếng nói.

Hội nghị châu Á - Thái Bình Dương về trí tuệ nhân tạo quốc tế (PRICAI) là một trong rất ít hội nghị về công nghệ thông tin có thứ hạng cao trên thế giới. Đây là hội nghị quốc tế tập trung nghiên cứu về AI và ứng dụng trong lĩnh vực kinh tế - xã hội trên phạm vi châu Á - Thái Bình Dương, được tổ chức lần đầu vào năm 1990.

Năm 2021, PRICAI được tổ chức tại Hà Nội (Việt Nam) và quy tụ rất nhiều chuyên gia xuất sắc trên thế giới trong trong lĩnh vực tuệ nhân tạo nói riêng và lĩnh vực công nghệ thông tin nói chung. 

Trong năm nay, Hội nghị đã công nhận hai đề tài nghiên cứu của các kỹ sư Việt Nam, đây là tín hiệu vui, phản ánh sự rút ngắn khoảng cách giữa Việt Nam và thế giới trong lĩnh vực mới mẻ như trí tuệ nhân tạo.

 Nghiên cứu AI xử lý giọng nói của nhóm kỹ sư trẻ Việt được quốc tế công nhận

Các công trình nghiên cứu được công nhận của nhóm kỹ sư Việt Nam đều liên quan đến công nghệ xử lý giọng nói (Speech Processing): Nghiên cứu về việc chuẩn hóa văn bản đa tác vụ cho hệ thống thống tổng hợp giọng nói (Multi-task Text Normalization Approach for Speech Synthesis) và Nghiên cứu các giải pháp để xây dựng hệ thống tổng hợp giọng nói đa ngôn ngữ (Learning Vietnamese-English Code-Switching Speech Synthesis Model Under Limited Code-Switched Data Scenario). Thực hiện đề tài này là các nhà nghiên cứu trẻ tuổi đến từ Zalo AI với tuổi đời chưa tới 30 là: Trang Trương (1994), Việt Lâm (1995), Cúc Bùi (1997) và Mạnh Cường (1999).

Được biết, đội ngũ đã mất khoảng 6 tháng để nghiên cứu, thử nghiệm và 2 tháng để hoàn thành phần bài báo khoa học. Các đề tài đều xuất phát từ nhu cầu thực tiễn trong quá trình xây dựng các sản phẩm AI để phục vụ người dùng.

Hiện tại, cả 2 nghiên cứu trên đều đang được ứng dụng vào thực tiễn. Cụ thể là 2 nghiên cứu đang được áp dụng vào hệ thống tổng hợp giọng nói nhằm hỗ trợ sản phẩm thực tế chạy trên trang Báo Mới và loa thông minh Kiki.

Chia sẻ về niềm vinh dự này, kỹ sư Mạnh Cường cho biết: "Việc mang những kiến thức về trí tuệ nhân tạo của người Việt Nam ra thế giới là mong muốn của rất nhiều kỹ sư AI. Và mình cảm thấy khá tự hào khi được góp một phần nhỏ trong hành trình ấy".

Sau khi tham dự PRICAI 2021, nhóm kỹ sư vẫn tiếp tục các nghiên cứu còn dang dở nhằm cải thiện sản phẩm họ đang phụ trách tại Zalo. Nếu có cơ hội hay ý tưởng tốt, nhóm vẫn vẫn sẵn sàng thực hiện các bài báo khoa học để chia sẻ tri thức tới cộng đồng AI.

Hạ Linh