SO HUU TRI TUE
Thứ hai, 09/12/2024
  • Click để copy

Việt Nam công bố nghiên cứu nhận diện thông minh tại Hội nghị IDCAR lần thứ 17

16:29, 26/09/2023
(SHTT) - Vừa qua, Trung tâm Không gian mạng Viettel (Viettel Cyberspace), đại diện duy nhất của Việt Nam, đã công bố kết quả nghiên cứu khoa học về nhận diện thông minh tại Hội nghị IDCAR lần thứ 17.

Theo nội dung công bố tại Hội nghị, nghiên cứu của Viettel Cyberspace tập trung cải thiện hiệu suất nhận diện cấu trúc bảng trong ảnh tài liệu, đặc biệt là với những bảng có cấu trúc phức tạp.

Theo Viettel Cyberspace, trích xuất thông tin trong bảng biểu thuộc ảnh tài liệu đang là bài toán rất thách thức do cấu trúc đọc khác biệt với dữ liệu đoạn văn thông thường, trong khi thông tin của bảng lại mang nhiều ý nghĩa quan trọng, nhất là trong các lĩnh vực tài chính, ngân hàng, bảo hiểm.

Công nghệ này đang được ứng dụng trong Viettel Intelligent Document Processing (Viettel IDP), thuộc hệ sinh thái sản phẩm Viettel AI, cho phép chuyển đổi không chỉ chữ mà cả bảng biểu từ dạng hình ảnh sang định dạng có thể chỉnh sửa được như Excel, Word với độ chính xác cao.

Điểm khác biệt của Viettel IDP là xem bảng biểu là một thực thể quan trọng trong ảnh tài liệu để trích xuất toàn bộ thông tin, thay vì chỉ coi là một đối tượng ảnh thông thường. Công nghệ này được coi là một trong những thành phần cốt lõi trong xây dựng công cụ chuyển đổi số và tìm kiếm thông tin thông minh. 

Thông thường, việc nhận diện các ô gộp trong bảng (spanning cells) dễ bị bỏ sót nội dung, sai định dạng khiến thông tin không còn chính xác. Do đó, thay vì chỉ lấy thông tin từ một số ô lân cận ô gộp để xử lý như các phương pháp cũ, Viettel Cyberspace đề xuất sử dụng mạng nơ-ron dựa trên cấu trúc Transformer, nhận diện đặc trưng từ tất cả các ô trong bảng, giúp nhận diện đúng và không bỏ sót nội dung.

Phương pháp này đặc biệt hiệu quả với các ô trong bảng, không chỉ áp dụng với ô tiêu đề. Thử nghiệm trên các bộ dữ liệu chuẩn, phương pháp này cho kết quả cao hơn hẳn về độ chính xác so với các phương pháp đã được công bố trước đó. Cụ thể, cao hơn 0,3% F1-score trên tập dữ liệu SciTSR-COMP và cao hơn 1,2% WAvgF1 trên tập ICDAR19-cTDaR so với kết quả đứng thứ hai.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel Cyberspace chia sẻ: "Viettel Cyberspace luôn đề cao nghiên cứu công nghệ gắn liền với ứng dụng thực tiễn. Với các công nghệ lõi trong lĩnh vực trí tuệ nhân tạo (AI), chúng tôi xác định mục tiêu không ngừng nghiên cứu, tìm tòi và phát triển các phương pháp, thuật toán mới. Từ đó, đơn vị liên tục ứng dụng nâng cấp chất lượng của các sản phẩm, dịch vụ trong hệ sinh thái Viettel AI, hỗ trợ hiệu quả cho quá trình chuyển đổi số của các tổ chức, doanh nghiệp và chính phủ".

screenshot-2023-09-25-at-19.13.30(1)

 Anh Trần Tuấn Anh, Kỹ sư chính Trí tuệ Nhân tạo, Trưởng nhóm nghiên cứu công nghệ OCR, Viettel Cyberspace đại diện nhóm tác giả tham gia hội nghị (thứ ba từ trái sang)

International Conference on Document Analysis and Recognition (ICDAR) thuộc top 14,55% hội nghị uy tín nhất thế giới về AI trong số các hội nghị được xếp hạng. Đây là sự kiện quốc tế hàng đầu dành cho các nhà khoa học, kỹ sư về phân tích và nhận dạng tài liệu, một lĩnh vực ngày càng quan trọng trong thời đại chuyển đổi số hiện nay. Các nghiên cứu khoa học sẽ phải vượt qua nhiều vòng thẩm định vô danh khắt khe từ hội đồng chuyên gia đến từ nhiều quốc gia trên thế giới. Hội nghị được tổ chức 2 năm một lần, trung bình có khoảng 30% nghiên cứu được chấp nhận mỗi năm.

Năm 2023, hội nghị ICDAR lần thứ 17 được tổ chức tại California, Mỹ với sự tham dự của nhiều chuyên gia cấp cao đến từ các tổ chức hàng đầu về nghiên cứu AI trong lĩnh vực xử lý ảnh tài liệu như Google Research, Microsoft Research, Adobe, Naver, CASIA, Wacom, Goodnote…

Viettel là đơn vị duy nhất của Việt Nam với đội ngũ nghiên cứu hoàn toàn trong nước có thành viên tham dự, trình bày nghiên cứu tại hội nghị này.

Quỳnh Trang

Tin khác

Khoa học Công nghệ 39 phút trước
(SHTT) - Sáng ngày 11/12/2024, tại Trường Đại học Công nghiệp Hà Nội sẽ chính thức Khai mạc Olympic Tin học Sinh viên Việt Nam lần thứ 33 (OLP’24), Procon Việt Nam và Kỳ thi Lập trình sinh viên quốc tế ICPC khu vực Châu Á - Asia Hanoi năm 2024.
Khoa học Công nghệ 6 giờ trước
(SHTT) - Theo Interesting Engineering, các nhà khoa học đến từ Đại học Bristol và Cơ quan năng lượng nguyên tử Anh (UKAEA) mới đây đã phát triển thành công pịn kim cương carbon-14 đầu tiên trên thế giới. Theo tính toán, viên pịn này có thể cung cấp điện an toàn với độ bền cao lên tới hàng nghìn năm.
Khoa học Công nghệ 6 giờ trước
(SHTT) - Tại Triển lãm quốc tế về khoa học công nghệ (SIIF 2024), đoàn Việt Nam đã mang về 1 giải Grand, 3 huy chương vàng, 2 huy chương bạc và các giải quốc tế đặc biệt của các tổ chức quốc tế từ Ả Rập Xê Út, Singapore, Malaysia.
Khoa học Công nghệ 1 ngày trước
(SHTT) - OpenAI đã ra mắt ChatGPT Pro, gói đăng ký trị giá 200 USD (khoảng 5 triệu đồng) mỗi tháng dành cho chatbot hàng đầu của mình.
Khoa học Công nghệ 1 ngày trước
(SHTT) - Theo trang Carscoops, Audi đang tiến hành triệu hồi hơn 4.600 xe Q5 PHEV và A7 PHEV tại Mỹ do nguy cơ quá nhiệt pin cao áp. Điều này làm gia tăng khả năng cháy nổ và gây mất an toàn cho người sử dụng phương tiện.
. ..