SO HUU TRI TUE
Thứ ba, 14/04/2026
  • Click để copy

Delphi-2M: Mô hình AI dự báo nguy cơ mắc bệnh trong hai thập kỷ tới

08:03, 28/09/2025
(SHTT) - ‏Delphi-2M là một mô hình ngôn ngữ lớn (LLM) có khả năng phân tích hồ sơ bệnh án và lối sống để ước tính nguy cơ mắc hơn 1.000 loại bệnh cho mỗi cá nhân.‏

‏Hầu hết các công cụ AI y tế hiện nay chỉ có thể ước tính nguy cơ cho một bệnh duy nhất. Theo nhà khoa học dữ liệu Moritz Gerstung, đây là một hạn chế lớn, bởi dù đã có các mô hình dự đoán ung thư hay bệnh tim mạch, một chuyên gia "sẽ phải sử dụng hàng chục mô hình khác nhau để có được câu trả lời toàn diện".‏

‏Để vượt qua hạn chế này, nhóm của Gerstung đã cải tiến một mô hình ngôn ngữ lớn (LLM) có tên là GPT. Các tác giả đã thiết kế mô hình Delphi-2M để dự báo nguy cơ mắc 1.258 loại bệnh. ‏

‏Mô hình này hoạt động bằng cách phân tích một loạt dữ liệu đầu vào, từ lịch sử bệnh án, tuổi, giới tính, BMI, cho đến các thói quen như hút thuốc và uống rượu. Toàn bộ hệ thống được huấn luyện trên nguồn dữ liệu từ 400.000 người tham gia nghiên cứu dài hạn UK Biobank tại Anh.

Capture

 

‏Đối với hầu hết các bệnh, dự đoán của Delphi-2M có độ chính xác bằng, thậm chí vượt trội hơn so với các mô hình dự đoán đơn bệnh hiện hành. Nó cũng chứng tỏ sự ưu việt khi so sánh với một thuật toán máy học khác dựa trên dấu ấn sinh học (biomarker) trong cơ thể. ‏

‏Năng lực dự báo của Delphi-2M hoạt động hiệu quả nhất khi dự báo diễn biến của các bệnh có quy luật tiến triển dễ đoán, chẳng hạn như một số loại ung thư. Tùy theo mức độ chi tiết của hồ sơ bệnh án, mô hình có thể dự đoán khả năng mắc mỗi loại bệnh với tầm nhìn xa lên tới hai thập kỷ.‏

Nhóm nghiên cứu đã kiểm chứng hiệu quả của Delphi-2M bằng cách thử nghiệm trên dữ liệu của gần 2 triệu người trong cơ sở dữ liệu y tế công cộng của Đan Mạch. Kết quả cho thấy dự đoán của mô hình đối với dữ liệu này chỉ kém chính xác hơn một chút so với khi chạy trên dữ liệu của UK Biobank.

Theo Gerstung, điều này chứng tỏ rằng mô hình vẫn có thể đưa ra những dự báo tương đối đáng tin cậy khi áp dụng trên các bộ dữ liệu từ những hệ thống y tế quốc gia khác.‏

‏Dù Delphi-2M mở ra một hướng đi đầy hứa hẹn, con đường từ phòng thí nghiệm đến ứng dụng lâm sàng vẫn còn nhiều thách thức. Giới chuyên môn đã có những phản hồi tích cực nhưng cũng rất thận trọng.‏

‏Ông Degui Zhi, một nhà nghiên cứu tin sinh học chuyên phát triển mô hình AI tại Trung tâm Khoa học Y tế Đại học Texas ở Houston, nhận định đây là một đóng góp "thú vị" cho lĩnh vực mô hình hóa đa bệnh vốn đang phát triển mạnh mẽ.

Tuy nhiên, ông cũng chỉ ra một điểm yếu cốt lõi nằm ở chính dữ liệu huấn luyện. Dữ liệu của UK Biobank hiện chỉ ghi nhận lần đầu tiên một người tham gia mắc bệnh, bỏ qua các lần tái phát sau đó.‏

‏Đây là một thiếu sót quan trọng, bởi lẽ diễn biến sức khỏe của một người không phải là đường thẳng. Ví dụ, một bệnh nhân tiểu đường đã kiểm soát tốt bệnh trong nhiều năm sẽ có một lộ trình sức khỏe rất khác so với một người liên tục phải nhập viện vì các biến chứng.

Theo ông Zhi, số lần một người tái mắc bệnh là yếu tố cực kỳ quan trọng để có thể lập mô hình lộ trình sức khỏe cá nhân một cách chính xác.

‏Nhận thức rõ những hạn chế này, Gerstung và nhóm của ông đã vạch ra những bước đi tiếp theo. Họ sẽ tiếp tục đánh giá và hiệu chỉnh độ chính xác của Delphi-2M trên các bộ dữ liệu từ nhiều quốc gia khác nhau. ‏

‏Mục tiêu không chỉ là mở rộng phạm vi ứng dụng, mà còn là để đảm bảo mô hình có thể hoạt động hiệu quả trên các nhóm dân cư đa dạng với nền tảng di truyền và lối sống khác nhau, giảm thiểu các thiên vị có thể xảy ra.‏

‏Đây không chỉ là việc thêm dữ liệu, mà là việc tạo ra một bức tranh sức khỏe toàn diện và đa sắc tộc hơn. "Hướng đi quan trọng sắp tới," Gerstung nói, "sẽ là việc tìm cách kết hợp tất cả các nguồn dữ liệu này lại với nhau để phát triển nên các thuật toán ngày càng chính xác và công bằng hơn nữa". ‏‏

‏Sự ra đời của Delphi-2M không chỉ là một bước đột phá về công nghệ mà là một lời báo trước về tương lai của y học - một tương lai nơi con người có thể "nhìn thấy" quỹ đạo sức khỏe của chính mình. Điều này mở ra một viễn cảnh đầy hứa hẹn: y học phòng ngừa được cá nhân hóa đến từng chi tiết, giúp chúng ta chủ động "đón đầu" bệnh tật thay vì bị động chữa trị.

TH

Tin khác

Khoa học Công nghệ 22 giờ trước
(SHTT) - Liên quan đến nghi vấn sao chép và đạo văn xảy ra tại Cuộc thi nghiên cứu khoa học, kỹ thuật cấp quốc gia dành cho học sinh THCS và THPT năm học 2025 - 2026, Bộ Giáo dục và Đào tạo (GD&ĐT) mới đây đã đưa ra phản hồi chính thức.
Khoa học Công nghệ 1 ngày trước
(SHTT) - Sự giao thoa giữa dữ liệu khổng lồ và nghệ thuật may mặc đang tạo ra một cuộc cách mạng trên sân cỏ World Cup 2026. Những chiếc áo đấu giờ đây không chỉ là biểu tượng tự hào mà còn là những cỗ máy sinh học phức tạp, được thiết kế để tối ưu hóa từng nhịp thở của cầu thủ.
Khoa học Công nghệ 1 ngày trước
Trợ lý kinh doanh (Business AI) tích hợp trực tiếp vào Messenger cho phép doanh nghiệp tự động trả lời tin nhắn khách hàng và duy trì tương tác liên tục trên nền tảng nhắn tin, hướng đến nhóm người bán hàng online tại Việt Nam.
Khoa học Công nghệ 2 ngày trước
(SHTT) - Năm 2026, Samsung Việt Nam chính thức phối hợp cùng Trung tâm Đổi mới sáng tạo Quốc gia (NIC), Bộ Tài chính tổ chức cuộc thi Samsung Solve for Tomorrow nhằm thúc đẩy giáo dục STEM tại Việt Nam.
Khoa học Công nghệ 2 ngày trước
(SHTT) - Ford vừa phát đi thông báo triệu hồi đối với 422.613 ô tô sau khi phát hiện một lỗi khiến cần gạt nước kính chắn gió bị gãy và làm gia tăng nguy cơ gây tai nạn cho người sử dụng phương tiện.
.