SO HUU TRI TUE
Thứ hai, 15/12/2025
  • Click để copy

Delphi-2M: Mô hình AI dự báo nguy cơ mắc bệnh trong hai thập kỷ tới

08:03, 28/09/2025
(SHTT) - ‏Delphi-2M là một mô hình ngôn ngữ lớn (LLM) có khả năng phân tích hồ sơ bệnh án và lối sống để ước tính nguy cơ mắc hơn 1.000 loại bệnh cho mỗi cá nhân.‏

‏Hầu hết các công cụ AI y tế hiện nay chỉ có thể ước tính nguy cơ cho một bệnh duy nhất. Theo nhà khoa học dữ liệu Moritz Gerstung, đây là một hạn chế lớn, bởi dù đã có các mô hình dự đoán ung thư hay bệnh tim mạch, một chuyên gia "sẽ phải sử dụng hàng chục mô hình khác nhau để có được câu trả lời toàn diện".‏

‏Để vượt qua hạn chế này, nhóm của Gerstung đã cải tiến một mô hình ngôn ngữ lớn (LLM) có tên là GPT. Các tác giả đã thiết kế mô hình Delphi-2M để dự báo nguy cơ mắc 1.258 loại bệnh. ‏

‏Mô hình này hoạt động bằng cách phân tích một loạt dữ liệu đầu vào, từ lịch sử bệnh án, tuổi, giới tính, BMI, cho đến các thói quen như hút thuốc và uống rượu. Toàn bộ hệ thống được huấn luyện trên nguồn dữ liệu từ 400.000 người tham gia nghiên cứu dài hạn UK Biobank tại Anh.

Capture

 

‏Đối với hầu hết các bệnh, dự đoán của Delphi-2M có độ chính xác bằng, thậm chí vượt trội hơn so với các mô hình dự đoán đơn bệnh hiện hành. Nó cũng chứng tỏ sự ưu việt khi so sánh với một thuật toán máy học khác dựa trên dấu ấn sinh học (biomarker) trong cơ thể. ‏

‏Năng lực dự báo của Delphi-2M hoạt động hiệu quả nhất khi dự báo diễn biến của các bệnh có quy luật tiến triển dễ đoán, chẳng hạn như một số loại ung thư. Tùy theo mức độ chi tiết của hồ sơ bệnh án, mô hình có thể dự đoán khả năng mắc mỗi loại bệnh với tầm nhìn xa lên tới hai thập kỷ.‏

Nhóm nghiên cứu đã kiểm chứng hiệu quả của Delphi-2M bằng cách thử nghiệm trên dữ liệu của gần 2 triệu người trong cơ sở dữ liệu y tế công cộng của Đan Mạch. Kết quả cho thấy dự đoán của mô hình đối với dữ liệu này chỉ kém chính xác hơn một chút so với khi chạy trên dữ liệu của UK Biobank.

Theo Gerstung, điều này chứng tỏ rằng mô hình vẫn có thể đưa ra những dự báo tương đối đáng tin cậy khi áp dụng trên các bộ dữ liệu từ những hệ thống y tế quốc gia khác.‏

‏Dù Delphi-2M mở ra một hướng đi đầy hứa hẹn, con đường từ phòng thí nghiệm đến ứng dụng lâm sàng vẫn còn nhiều thách thức. Giới chuyên môn đã có những phản hồi tích cực nhưng cũng rất thận trọng.‏

‏Ông Degui Zhi, một nhà nghiên cứu tin sinh học chuyên phát triển mô hình AI tại Trung tâm Khoa học Y tế Đại học Texas ở Houston, nhận định đây là một đóng góp "thú vị" cho lĩnh vực mô hình hóa đa bệnh vốn đang phát triển mạnh mẽ.

Tuy nhiên, ông cũng chỉ ra một điểm yếu cốt lõi nằm ở chính dữ liệu huấn luyện. Dữ liệu của UK Biobank hiện chỉ ghi nhận lần đầu tiên một người tham gia mắc bệnh, bỏ qua các lần tái phát sau đó.‏

‏Đây là một thiếu sót quan trọng, bởi lẽ diễn biến sức khỏe của một người không phải là đường thẳng. Ví dụ, một bệnh nhân tiểu đường đã kiểm soát tốt bệnh trong nhiều năm sẽ có một lộ trình sức khỏe rất khác so với một người liên tục phải nhập viện vì các biến chứng.

Theo ông Zhi, số lần một người tái mắc bệnh là yếu tố cực kỳ quan trọng để có thể lập mô hình lộ trình sức khỏe cá nhân một cách chính xác.

‏Nhận thức rõ những hạn chế này, Gerstung và nhóm của ông đã vạch ra những bước đi tiếp theo. Họ sẽ tiếp tục đánh giá và hiệu chỉnh độ chính xác của Delphi-2M trên các bộ dữ liệu từ nhiều quốc gia khác nhau. ‏

‏Mục tiêu không chỉ là mở rộng phạm vi ứng dụng, mà còn là để đảm bảo mô hình có thể hoạt động hiệu quả trên các nhóm dân cư đa dạng với nền tảng di truyền và lối sống khác nhau, giảm thiểu các thiên vị có thể xảy ra.‏

‏Đây không chỉ là việc thêm dữ liệu, mà là việc tạo ra một bức tranh sức khỏe toàn diện và đa sắc tộc hơn. "Hướng đi quan trọng sắp tới," Gerstung nói, "sẽ là việc tìm cách kết hợp tất cả các nguồn dữ liệu này lại với nhau để phát triển nên các thuật toán ngày càng chính xác và công bằng hơn nữa". ‏‏

‏Sự ra đời của Delphi-2M không chỉ là một bước đột phá về công nghệ mà là một lời báo trước về tương lai của y học - một tương lai nơi con người có thể "nhìn thấy" quỹ đạo sức khỏe của chính mình. Điều này mở ra một viễn cảnh đầy hứa hẹn: y học phòng ngừa được cá nhân hóa đến từng chi tiết, giúp chúng ta chủ động "đón đầu" bệnh tật thay vì bị động chữa trị.

TH

Tin khác

Khoa học Công nghệ 1 giờ trước
(SHTT) - Trong khuôn khổ Ngày hội khởi nghiệp đổi mới sáng tạo Việt Nam (TECHFEST 2025), Tập đoàn Công nghệ CMC đã chính thức giới thiệu Hệ sinh thái Chuyển đổi số toàn diện cấp phường, xã.
Khoa học Công nghệ 23 giờ trước
(SHTT) - Trên cơ sở phân tích xu hướng toàn cầu và lợi thế của Thủ đô, các chuyên gia tại Diễn đàn Phát triển công nghệ chiến lược Thủ đô, các chuyên gia đã thống nhất lựa chọn 7 nhóm công nghệ chiến lược để Hà Nội trở thành trung tâm đổi mới sáng tạo.
Khoa học Công nghệ 23 giờ trước
(SHTT) - Cục Đăng kiểm Việt Nam và Ford Việt Nam vừa chính thức phát đi thông báo về chương trình triệu hồi an toàn đối với 816 ô tô Ford Territory sản xuất cuối 2022 đầu 2023 bị lỗi mối hàn giá đỡ trụ lái.
Khoa học Công nghệ 23 giờ trước
(SHTT) - Phát biểu tại lễ khai mạc TECHFEST Việt Nam 2025, tối ngày 13/12, Thủ tướng Phạm Minh Chính định hướng TECHFEST các năm tới phải đổi mới mạnh mẽ, nâng tầm khu vực và quốc tế, kết nối sâu hệ sinh thái trong và ngoài nước.
Khoa học Công nghệ 23 giờ trước
(SHTT) - Google mới đây đã thông báo triển khai phiên bản beta tính năng dịch nói theo thời gian thực trên Google Translate. Công cụ mới này sẽ cho phép người dùng đeo tai nghe và giao tiếp tự nhiên với người sử dụng ngôn ngữ khác một cách tự nhiên mà không cần tới sự hỗ trợ của phiên dịch.
.