AI của Microsoft nay đã có thể "nhại" giọng của con người giống tới 99,84%

(SHTT) - Với việc đưa 1 phần nguyên lý hoạt động của não người vào công nghệ AI, Microsoft đã tạo ra được phần mềm có thể nói được ngôn ngữ nhanh hơn với độ chính xác và thuần thục lên tới 99, 84%.

Các AI Text-to-speech đang ngày càng thông minh hơn, cùng với đó, khả năng đọc các văn bản đầu vào thành tiếng cũng có độ chính xác so với phát âm của người thật cũng cao hơn. Tuy nhiên, trước đây, cách phát âm và nối thanh của AI vẫn còn khá vấp váp và cứng nhắc, có thể phân biệt rõ ràng là giọng hệ thống. Chính vì thế các nhà khoa học của Microsoft và Trung Quốc đã đưa ra một thuật toán mới, nhằm giúp xây dựng các AI nói trong tương lai hiệu quả hơn.

Nhóm nghiên cứu đã tạo ra một text-to-speech AI có thể nói mà chỉ cần 200 mẫu giọng nói (khoảng 20 phút thu âm) và phiên âm phù hợp. AI mới này dựa một phần vào nguyên lý hoạt động có tên gọi là Transformers - một mạng lưới thần kinh sâu mô phỏng các tế bào thần kinh trong não người.

Giọng nói do AI Microsoft nay đã có độ chính xác lên tới 99,84% 

Transformers giúp xử lý các thông tin đầu vào và đầu ra một cách nhanh chóng như quá trình liên kết khớp thần kinh, giúp hệ thống AI mã hóa các thông tin dài, các câu phức, từ ghép nhanh hơn. Kết hợp Transformers với một thành phần mã hóa loại bỏ nhiễu đã giúp cho AI của Microsoft có thể làm được rất nhiều với tương đối ít data lưu trữ.

Hiện tại, AI của Microsoft đã có được giọng nói tuy chưa "đủ nuột", nhưng độ chính xác và dễ hiểu của chúng rất cao tới 99,84%. với tốc độ xử lý văn bản thành giọng nhanh chóng và đơn giản hơn. Các nhà lập trình không phải bỏ nhiều công sức để tạo ra tiếng nói ảo, giúp các công ty nhỏ, thậm chí là người nghiệp dư có thể tạo ra hệ thống giọng nói riêng.

An An