Sinh viên RMIT phát triển thành công công nghệ nhận diện chữ viết tay tiếng Việt

(SHTT) - Sinh viên năm cuối trường ĐH RMIT, Phùng Minh Tuấn mới đây đã phát triển thành công công nghệ giúp giải quyết thách thức lớn nhất trong quá trình số hóa bệnh án tiếng Việt bằng việc phát triển thành công hệ thống nhận diện và giải mã chữ viết tay của bác sĩ Việt Nam.

Cụ thể, để có thể số hóa được bệnh án khó đọc từ chữ bác sĩ, Phùng Minh Tuấn, sinh viên năm cuối ngành kỹ sư phần mềm của Trường ĐH RMIT - đã phát triển thành công một tập hợp đầu cuối để nhận diện chữ viết trên bản quét bệnh án tiếng Việt. Đây là công nghệ giàu tiềm năng hỗ trợ việc đẩy mạnh số hóa bệnh án mà Chính phủ triển khai từ năm 2019.

Phùng Minh Tuấn, sinh viên năm cuối ngành kỹ sư phần mềm của Trường ĐH RMIT  

Tuấn cho biết công nghệ nhận diện chữ viết đã tiến bộ rất nhiều nhưng hầu hết những phương pháp hiện có được phát triển để đọc tiếng Anh. Có rất ít, thậm chí gần như không có phần mềm riêng cho tiếng Việt. Nhận diện chữ viết tay tiếng Việt về cơ bản thách thức hơn với tiếng Anh vì sự hiện diện của các lớp ký tự, âm điệu và dấu câu phức tạp.

Để giải quyết những thách thức này, Tuấn đã áp dụng quy trình giảm nhiễm, chia nhỏ chữ viết xuống cấp độ từ và áp dụng mô hình ngôn ngữ Bigram để tăng xác suất chỉnh sửa có thể cho những từ chung quanh. Đặc biệt, Tuấn đã thành công trong việc phối hợp và thực hiện một cấu trúc học máy (machine learning) bao hàm mạng lưới thần kinh nhân tạo ResNet để chiết xuất hình dạng chữ và BiLSTM để lên mẫu tần suất chữ, CTC cho nhiệm vụ sao chép cuối cùng. Tại điểm này, tín hiệu đầu ra cuối cùng dạng chuỗi song hành cùng bộ từ vựng sẽ giúp kết quả chính xác hơn.

Sáng chế của Phùng Minh Tuấn được đánh giá là công nghệ giúp giải quyết nan đề lớn nhất trong quá trình số hóa tại bệnh viện Việt Nam hiện nay 

Sau hơn ba tháng, Tuấn đã thành công tring việc tìm ra cách hiệu quả nhất có thể chuyển hình ảnh của một bệnh án giấy thành phiên bản điện tử với sự hỗ trợ từ Bệnh viện Bệnh nhiệt đới và Đơn vị Nghiên cứu lâm sàng Đại học Oxford (OUCRU) tại TP.HCM.  

Tiến sĩ Đinh Ngọc Minh, giảng viên khoa Khoa học và Công nghệ, Trường ĐH RMIT, thầy trực tiếp hướng dẫn Tuấn trong công trình nghiên cứu, cho biết tập hợp có thể đóng vai trò thiết yếu hỗ trợ công cuộc số hóa các cơ sở y tế và bệnh viện ở Việt Nam, giúp họ sẵn sàng hơn trong việc chuyển sang sử dụng hệ thống quản lý bệnh án điện tử hiện đại.

“Công trình mà Tuấn đề xuất có thể đẩy mạnh quy trình số hóa hệ thống bệnh án”, tiến sĩ Minh cho hay. “Với sự trợ giúp của máy móc trong xử lý toàn bộ bệnh án, các cơ sở y tế có thể dần chuyển sang hệ thống điện tử mà không phải thay đổi quy trình đột ngột. Hệ thống này còn cho phép các cơ sở y tế ở vùng hẻo lánh hay cán bộ y tế không có điều kiện tiếp cận máy tính tiếp tục với hệ thống giấy tờ hiện tại và có thể số hóa dễ dàng sau đó”, tiến sĩ Minh nói.

Tiến sĩ Minh tin rằng việc có thể chia sẻ bệnh án của bệnh nhân dễ dàng giữa các phòng ban sẽ giúp giảm bớt những xét nghiệm không cần thiết, tối ưu hóa điều trị và dần cải thiện chất lượng chăm sóc y tế.

“Và quan trọng nhất là công trình của Tuấn có thể tạo nên bộ dữ liệu ghi chép y khoa số hóa cho các giải pháp học máy y khoa tiềm năng khác nhau”, ông Minh nói.

“Thực tế, các bên hợp tác cùng chúng tôi là Bệnh viện Bệnh nhiệt đới và OUCRU dự kiến dùng dữ liệu tạo ra được để phát triển hệ thống chuyên gia chẩn đoán, cải tiến quy trình điều trị và giảm thiểu lỗi trong thực hành y khoa”, tiến sĩ Minh cho biết.

Với công trình này, Tuấn đã có được vị trí thực tập tại OUCRU và công trình của bạn còn được thuyết trình tại Hội thảo khoa học quốc tế hạng A - the ACIS2020, Hội thảo AHT, cũng như Triển lãm trực tuyến các công trình của sinh viên RMIT.

Thái An