OpenAI phát triển công nghệ tái tạo giọng nói

(SHTT) - OpenAI vừa công bố kết quả sơ bộ từ một thử nghiệm về phần mềm có khả năng tái tạo giọng nói. Điều này không chỉ là một bước tiến mới trong lĩnh vực trí tuệ nhân tạo (AI) mà còn đặt ra mối lo ngại về nguy cơ giả mạo.

Được biết, phiên bản thử nghiệm có tên gọi là Voice Engine, một công cụ sử dụng trí tuệ nhân tạo để tạo ra giọng nói dựa trên các đoạn ghi âm ngắn chỉ 15 giây.

Tuy nhiên, OpenAI cho biết công ty đã quyết định chưa phát hành sau khi nhận được phản hồi từ các bên liên quan do lo ngại về nguy cơ bị lạm dụng. Theo thông tin từ cuộc họp báo trước đó, công ty ban đầu đã dự định phát hành công cụ này tới 100 nhà phát triển thông qua quy trình đăng ký.

Trong một tuyên bố gần đây, OpenAI đã thừa nhận rằng việc tạo ra giọng nói mang theo những nguy cơ nghiêm trọng, đặc biệt là trong bối cảnh của một cuộc bầu cử quan trọng. Ví dụ điển hình vào tháng 1, công nghệ giả giọng AI gây chú ý sau khi một bản ghi âm bắt chước giọng của Tổng thống Mỹ Joe Biden kêu gọi người dân không tham gia bầu cử sơ bộ của đảng Dân chủ ở New Hampshire, được lan truyền trên mạng xã hội.

"Đây là một công nghệ nhạy cảm và việc triển khai cần được thực hiện cẩn thận", Jeff Harris, giám đốc của OpenAI, nhấn mạnh trong một cuộc phỏng vấn.

 

Tuy nhiên, công ty này đã cho biết đang hợp tác chặt chẽ với các đối tác trong và ngoài nước, từ các cơ quan chính phủ, tổ chức truyền thông, ngành giải trí, giáo dục, xã hội dân sự và các lĩnh vực khác, nhằm tiếp thu các ý kiến phản hồi để phát triển công cụ này một cách an toàn.

OpenAI cũng đã thông báo về việc triển khai một loạt các biện pháp an toàn, bao gồm việc đánh dấu nguồn gốc của mọi âm thanh được tạo ra bởi Voice Engine, cũng như theo dõi tự động cách thức sử dụng công cụ này.

Một trong những đối tác phát triển hiện tại của OpenAI, Viện Khoa học não bộ Norman Prince đang sử dụng công nghệ này để giúp bệnh nhân phục hồi giọng nói của họ. Trong trường hợp cụ thể, Voice Engine đã được ứng dụng vào một bệnh nhân mất khả năng nói do u não qua việc tái tạo giọng nói từ một bản ghi âm trước đó.

Mô hình giọng nói tùy chỉnh của OpenAI cũng có thể dịch ngữ âm mà nó tạo ra sang các ngôn ngữ khác nhau. Điều này cực kỳ hữu ích đối với các công ty trong ngành kinh doanh âm nhạc, như Spotify Technology SA. Spotify đã sử dụng công nghệ này trong chương trình thử nghiệm riêng của mình để dịch podcast của những người dẫn chương trình phổ biến như Lex Fridman.

OpenAI cũng công nhận các lợi ích khác của công nghệ này, chẳng hạn như tạo ra một loạt các giọng nói cho nội dung giáo dục dành cho trẻ em.

Qua chương trình thử nghiệm, OpenAI yêu cầu các đối tác phải chấp thuận chính sách sử dụng, nhận sự đồng ý từ người nói gốc, cũng như tiết lộ cho người nghe biết rằng giọng nói được tạo ra bởi AI.

Xuân Hiếu