Tổng quan ứng dụng học máy trong dự đoán nguy cơ đa di truyền hướng tới y học cá thể hóa
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Tổng quan ứng dụng học máy trong dự đoán nguy cơ đa di truyền hướng tới y học cá thể hóa Tập 2022, Số 1, Tháng 6Tổng quan ứng dụng học máy trong dự đoánnguy cơ đa di truyền hướng tới y học cá thểhóaTrịnh Thị Xuân1 , Tạ Văn Nhân2 , Hoàng Đỗ Thanh Tùng3 , Trương Nam Hải4 , Trần Đăng Hưng51 Khoa Công nghệ thông tin, Đại học Mở Hà Nội2 Công ty TNHH LOBI Việt Nam, Hà Nội3 Phòng Nghiên cứu hệ thống và quản lý, Viện Công nghệ Thông Tin, VAST4 Phòng Kỹ thuật di truyền, Viện Công nghệ Sinh học, VAST5 Khoa Công nghệ thông tin, Đại học Sư phạm Hà NộiTác giả liên hệ: Trịnh Thị Xuân, Email: trinhxuan@gmail.comNgày nhận bài: 06/01/2022, ngày sửa chữa: 21/04/2022, ngày duyệt đăng: 10/05/2022Định danh DOI: 10.32913/mic-ict-research-vn.v2022.n1.1027Tóm tắt: Trong thời gian gần đây, Điểm nguy cơ đa di truyền (Polygenic Risk Score - PRS) được xem như một công cụtiềm năng cho y học chính xác dựa trên các biến dị di truyền phổ biến có đóng góp từ nhỏ tới vừa đối với nguy cơ mắcbệnh di truyền, nhưng tổng gộp các biến dị này lại có thể nâng cao giá trị dự đoán bệnh trong quần thể. Đã có nhiềuphương pháp học máy được đưa ra nhằm cải tiến khả năng dự đoán của PRS cũng như những nỗ lực để đưa PRS vàoứng dụng trong lâm sàng. Mặc dù vậy, việc lựa chọn phương pháp một cách hệ thống và những ứng dụng của PRS vẫnchưa thực sự rõ ràng. Vì vậy, trong bài báo tổng quan này, chúng tôi cung cấp một cái nhìn tổng quan về điểm nguy cơđa di truyền và các nghiên cứu cải tiến sử dụng học máy nhằm nâng cao khả năng áp dụng trong lâm sàng của PRS.Từ khóa: Bệnh phổ biến, điểm nguy cơ đa di truyền, GWAS, SNP, mảng SNP, học máy. Title: An Overview of Machine Learning Applications in Polygenic Risk Prediction Towards Personalized Medicine Abstract: In recent times, the Polygenic Risk Score (PRS) has been considered as a potential tool for precision medicine based on common genetic variants with small to moderate contributions to the genetic disease risk, but the aggregation of these variations can enhance the predictive value of disease in the population. Many machine learning methods have been proposed to improve the predictive ability of PRS as well as efforts to bring PRS into clinical application. However, the systematic selection of methods and applications of PRS are still not really clear. Therefore, in this review, we provide an overview of polygenic risk scores and innovative studies using machine learning to improve the clinical applicability of PRS. Keywords: Common diseases, polygenic risk scores, GWAS, SNP, SNP arrays, machine learning.I. GIỚI THIỆU hưởng đột biến gen BRCA2 sẽ phát triển ung thư trước tuổi 80 [1]. Việc phát hiện một bệnh nhân mang các biến dị có Với sự phát triển của công nghệ sinh học, các nhà khoa hại sẽ hỗ trợ bác sỹ đưa ra lời khuyên giúp thay đổi lốihọc có thể dựa vào dữ liệu DNA để dự đoán nguy cơ mắc sống theo hướng tích cực hoặc đưa ra các can thiệp phòngbệnh ở người. Ngoại trừ các đột biến xôma, dữ liệu DNA ngừa tùy theo mức độ nguy cơ.không thay đổi trong suốt thời gian sống của chúng ta. Vìvậy, nguy cơ mắc bệnh liên quan đến gen của một người Với các bệnh do một gen quy định, việc ước lượng nguycó thể xuất hiện ngay từ khi người đó sinh ra. Điều đó cho cơ mắc bệnh của một người có thể chỉ là tìm kiếm cácthấy việc xác định nguy cơ mắc bệnh về gen có ý nghĩa biến dị có hại trên một gen nào đó. Các nghiên cứu phânrất lớn trong y tế dự phòng. Chẳng hạn, một nghiên cứu tích liên kết di truyền (Genetic Linkage Analysis) đã đượcvào năm 2017 ước lượng rằng có khoảng 72% phụ nữ thừa phát triển từ lâu để xác định vị trí của gen bệnh dựa trênhưởng đột biến gen BRCA1 và khoảng 69% phụ nữ thừa mối liên kết của nó với các vị trí đánh dấu di truyền trên 1Các công trình nghiên cứu, phát triển và ứng dụng CNTT và Truyền thôngnhiễm sắc thể. Phương pháp này đã rất thành công khi tìm hơn các bệnh di truyền phức tạp, cùng với đó là các tập dữra các đột biến của một số bệnh đơn gen như múa giật liệu ngày càng lớn. Với hiệu suất mô hình dự đoán ngày[2, 3] hay ung thư vú [4]. Tuy nhiên, phân tích liên kết càng được cải thiện, điểm nguy cơ đa di truyền đang gópchưa cho thấy sự hiệu quả đối với các bệnh đa di truyền và phần vào nỗ lực phân tầng nguy cơ di truyền và có triểnphổ biến. Từ năm 2005, c ...
Tìm kiếm theo từ khóa liên quan:
Bệnh phổ biến Điểm nguy cơ đa di truyền Dự đoán nguy cơ đa di truyền Y học cá thể hóa Phương pháp học máyTài liệu liên quan:
-
Trích xuất danh mục khía cạnh sử dụng BERT với hàm mất mát cân bằng
9 trang 134 0 0 -
Áp dụng phương pháp học máy để phát hiện tấn công DDoS trong môi trường thực nghiệm mạng SDN
5 trang 101 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 0: Giới thiệu môn học
12 trang 30 0 0 -
Mô hình hệ thống khai thác dữ liệu phi cấu trúc hỗ trợ khách hàng ra quyết định mua hàng trực tuyến
6 trang 30 0 0 -
Bộ dữ liệu dạng Netflow dùng trong phát hiện xâm nhập trái phép và ứng dụng
12 trang 27 0 0 -
Luận án Tiến sĩ Răng hàm mặt: Hiệu quả của chẩn đoán sâu răng giai đoạn sớm bằng phương pháp học máy
201 trang 27 0 0 -
5 trang 26 0 0
-
26 trang 25 0 0
-
Giải đoán địa hình đáy ven biển bằng ảnh vệ tinh sử dụng học máy và điện toán đám mây
3 trang 25 0 0 -
Bài giảng Máy học và mạng neural: Bài 1 - TS. Vũ Đức Lung
55 trang 25 0 0 -
13 trang 23 0 0
-
Phát hiện sự cố trong hệ thống điện mặt trời dựa trên học máy
7 trang 22 0 0 -
27 trang 21 0 0
-
Tự động phát hiện tin giả bằng Naive Bayes
5 trang 20 0 0 -
Ứng dụng phương pháp học máy dự báo khả năng khách hàng rời bỏ dịch vụ thẻ tín dụng
13 trang 18 0 0 -
Đánh giá hồ sơ tuyển dụng bằng học máy
11 trang 18 0 0 -
Ứng dụng autoencoder phân nhóm sinh viên dựa trên dữ liệu điểm số
3 trang 18 0 0 -
Giải pháp nhận diện tin giả của sinh viên
12 trang 18 0 0 -
Luận án tiến sĩ Kỹ thuật: Một số phương pháp học máy xác định đặc điểm người dùng trên mạng internet
153 trang 18 0 0 -
Phương pháp biểu diễn cây cho dự đoán giới tính khách hàng dựa trên dữ liệu thương mại điện tử
7 trang 17 0 0