Việc dịch lời nói thông qua công cụ dịch thuật của Google trước đây khá rắc rối và mất nhiều thời gian, thậm chí độ chính xác còn không quá cao do phải trải qua nhiều bước bao gồm: dịch lời nói thành văn bản, sau đó dịch văn bản sang ngôn ngữ mới, cuối cùng chuyển đổi văn bản thành lời nói.
Quy trình rườm rà này đôi khi dẫn tới hiện tượng "tam sao thất bản" do càng thông qua nhiều bước càng xuất hiện các sai lệch lớn hơn.
Để giải quyết vấn đề này, Google đang phát triển công nghệ trí thông minh nhân tạo (AI) mới có tên Translatotron với khả năng dịch trực tiếp từ giọng nói ra giọng nói theo nhiều ngôn ngữ khác nhau mà không cần trải qua các bước trung gian nói trên.
Google cho biết, Translatotron sử dụng công nghệ AI với một mạng lưới thần kinh cho phép dịch nhanh, loại bỏ lỗi và xác định các từ danh từ không cần dịch như tên riêng, tên địa danh,... . Bên cạnh đó, công cụ này còn có thể giữ lại giọng điệu của người nói, giúp sản phẩm đầu ra có giọng dịch gần gũi với âm thanh tự nhiên của con người hơn.
Google coi đây là những bước đầu tiên trong quá trình xây dựng các hệ thống dịch đầu - cuối giọng nói trong tương lai. Hiện nay, Google chưa có ý định sử dụng Translatotron vào mục đích thương mại, nhưng điều này có thể sẽ xảy ra khi công ty hoàn thiện công nghệ của mình.
Minh An