Google AI nay đã có thể dịch trực tiếp giọng nói nguồn chỉ bằng 1 bước

(SHTT) - Không cần qua các bước trung gian, việc dịch lời nói của con người từ ngôn ngữ nguồn sang ngôn ngữ đích thông qua Google Translatotron có thể nâng hiệu suất phiên dịch nhanh gấp 3 lần với hiệu quả truyển tải nội dung cao hơn nhiều lần so với các công cụ thông thường.

Việc dịch lời nói thông qua công cụ dịch thuật của Google trước đây khá rắc rối và mất nhiều thời gian, thậm chí độ chính xác còn không quá cao do phải trải qua nhiều bước bao gồm: dịch lời nói thành văn bản, sau đó dịch văn bản sang ngôn ngữ mới, cuối cùng chuyển đổi văn bản thành lời nói.

Quy trình rườm rà này đôi khi dẫn tới hiện tượng "tam sao thất bản" do càng thông qua nhiều bước càng xuất hiện các sai lệch lớn hơn. 

Việc dịch lời nói từ ngôn ngữ nguồn tới ngôn ngữ địch trước đây cần phải trải qua khá nhiều bước nhưng hiệu quả không cao do hiện tượng "tam sao thất bản". 

Để giải quyết vấn đề này, Google đang phát triển công nghệ trí thông minh nhân tạo (AI) mới có tên Translatotron với khả năng dịch trực tiếp từ giọng nói ra giọng nói theo nhiều ngôn ngữ khác nhau mà không cần trải qua các bước trung gian nói trên.

Công cụ mới của Google có thể nâng cao hiệu suất và hiệu quả dịch ngôn ngữ bằng lời nói hiện nay.

Google cho biết, Translatotron sử dụng công nghệ AI với một mạng lưới thần kinh cho phép dịch nhanh, loại bỏ lỗi và xác định các từ danh từ không cần dịch như tên riêng, tên địa danh,... . Bên cạnh đó, công cụ này còn có thể giữ lại giọng điệu của người nói, giúp sản phẩm đầu ra có giọng dịch gần gũi với âm thanh tự nhiên của con người hơn.

 Việc dịch trực tiếp giọng nói nguồn thành âm thanh ngôn ngữ đích sẽ giúp giảm bớt sai lệch về nội dung cần truyền tải.

Google coi đây là những bước đầu tiên trong quá trình xây dựng các hệ thống dịch đầu - cuối giọng nói trong tương lai. Hiện nay, Google chưa có ý định sử dụng Translatotron vào mục đích thương mại, nhưng điều này có thể sẽ xảy ra khi công ty hoàn thiện công nghệ của mình.

Minh An