Google AI nay đã có thể dịch trực tiếp giọng nói nguồn chỉ bằng 1 bước
Việc dịch lời nói thông qua công cụ dịch thuật của Google trước đây khá rắc rối và mất nhiều thời gian, thậm chí độ chính xác còn không quá cao do phải trải qua nhiều bước bao gồm: dịch lời nói thành văn bản, sau đó dịch văn bản sang ngôn ngữ mới, cuối cùng chuyển đổi văn bản thành lời nói.
Quy trình rườm rà này đôi khi dẫn tới hiện tượng "tam sao thất bản" do càng thông qua nhiều bước càng xuất hiện các sai lệch lớn hơn.
Để giải quyết vấn đề này, Google đang phát triển công nghệ trí thông minh nhân tạo (AI) mới có tên Translatotron với khả năng dịch trực tiếp từ giọng nói ra giọng nói theo nhiều ngôn ngữ khác nhau mà không cần trải qua các bước trung gian nói trên.
Google cho biết, Translatotron sử dụng công nghệ AI với một mạng lưới thần kinh cho phép dịch nhanh, loại bỏ lỗi và xác định các từ danh từ không cần dịch như tên riêng, tên địa danh,... . Bên cạnh đó, công cụ này còn có thể giữ lại giọng điệu của người nói, giúp sản phẩm đầu ra có giọng dịch gần gũi với âm thanh tự nhiên của con người hơn.
Google coi đây là những bước đầu tiên trong quá trình xây dựng các hệ thống dịch đầu - cuối giọng nói trong tương lai. Hiện nay, Google chưa có ý định sử dụng Translatotron vào mục đích thương mại, nhưng điều này có thể sẽ xảy ra khi công ty hoàn thiện công nghệ của mình.
Minh An
TIN LIÊN QUAN
-
Dịch vụ quảng cáo Google AdSense bị "chết máy" trên toàn cầu - Nhà phát triển lo mất tiền oan
-
Công ty mẹ của Google mất trắng 60 tỷ USD sau báo cáo tài chính thấp hơn kỳ vọng
-
Google đang triển khai Wi-Fi miễn phí tại các trường đại học Việt Nam
-
Luật bản quyền mới của châu Âu bị Facebook, Google phản đối