![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Một phương pháp phân tích mạng tương tác protein để dự đoán gen gây bệnh ung thư
Số trang: 9
Loại file: pdf
Dung lượng: 183.95 KB
Lượt xem: 22
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Trong bài báo này, tác giả đề xuất một phương pháp tính toán dựa trên việc phân tích một mạng tích hợp các thông tin: mạng tương tác protein, mạng tương tác microRNA-gen, và các gen gây bệnh ung thư đã biết. Từ mạng tích hợp này, chúng tôi đưa ra phương pháp biểu diễn mới cho các gen dựa vào các tương tác trực tiếp và gián tiếp với các gen khác trong mạng.
Nội dung trích xuất từ tài liệu:
Một phương pháp phân tích mạng tương tác protein để dự đoán gen gây bệnh ung thư JOURNAL OF SCIENCE OF HNUE FIT., 2013, Vol. 58, pp. 38-46 This paper is available online at http://stdb.hnue.edu.vn MỘT PHƯƠNG PHÁP PHÂN TÍCH MẠNG TƯƠNG TÁC PROTEIN ĐỂ DỰ ĐOÁN GEN GÂY BỆNH UNG THƯ Trần Thị Bích Phương1 , Nguyễn Văn Huấn2, Trần Đăng Hưng2 1 Trường Đại học Tây Nguyên; 2 Khoa Công nghệ Thông tin, Trường Đại học Sư Phạm Hà Nội 2 Email: hungtd@hnue.edu.vn Tóm tắt. Dự đoán gen gây bệnh là một trong những mục tiêu quan trọng trong nghiên cứu y sinh. Mặc dù hiện nay đã có khá nhiều phương pháp được xây dựng để dự đoán các gen liên quan đến một số bệnh cụ thể. Tuy nhiên, do mối quan hệ phức tạp giữa các gen và bệnh, nên rất nhiều các gen là nguyên nhân gây ra một số bệnh di truyền hiện vẫn chưa được phát hiện ra. Trong bài báo này, chúng tôi đề xuất một phương pháp tính toán dựa trên việc phân tích một mạng tích hợp các thông tin: mạng tương tác protein, mạng tương tác microRNA-gen, và các gen gây bệnh ung thư đã biết. Từ mạng tích hợp này, chúng tôi đưa ra phương pháp biểu diễn mới cho các gen dựa vào các tương tác trực tiếp và gián tiếp với các gen khác trong mạng. Các thông tin này sau đó được dùng để dự đoán một gen có phải là gen gây bệnh ung thư hay không. Chúng tôi đã áp dụng phương pháp đề xuất vào dữ liệu thực tế được download từ các trung tâm dữ liệu sinh học trên thế giới và sử dụng các phương pháp phân lớp phổ biến để đánh giá hiệu quả của phương pháp đề xuất. Kết quả cho thấy khi tích hợp thông tin về mạng tương tác microRNA thì độ chính xác của các phương pháp dự đoán được nâng lên. Điều này chứng tỏ thông tin về microRNA là hữu ích trong việc tiên lượng các gen gây bệnh. Từ khóa: Phân tích mạng, Protein, Ung thư, gen, microRNA, dữ liệu sinh học.1. Mở đầu Ung thư là một trong những bệnh phổ biến và nguy hiểm trên thế giới hiện nay, hàngnăm có hàng trăm nghìn người chết vì bệnh này [1, 2]. Việc tìm hiểu cơ chế và nguyênnhân gây bệnh ung thư là một trong những bài toán quan trọng trong y sinh. Các nguyênnhân có thể là do môi trường, do ngoại cảnh, nhưng một nguyên nhân không nhỏ là do ditruyền. Vậy câu hỏi đặt ra là, những vật chất di truyền nào là nguồn gốc gây ra bệnh ungthư. Bằng các nghiên cứu thực nghiệm, người ta đã chỉ ra rằng, với từng loại bệnh cụ thể,có thể do một số gen quy định gây ra [3]. Tuy nhiên, các nhà thực nghiệm chỉ tìm ra đượccác gen gây bệnh một cách đơn lẻ trên một số cá thể, hơn nữa các thực nghiệm này rất tốnthời gian và chi phí lớn. Với sự hỗ trợ của máy tính, các nhà sinh học tính toán có thể đưa38 Một phương pháp phân tích mạng tương tác protein để dự đoán gen gây bệnh ung thưra các phương pháp tính toán dựa trên những tri thức đã biết để tiên lượng khả năng gâybênh của các gen khác [2, 4]. Phương pháp tính toán được dùng hiện nay là các phương pháp học máy (machinelearning), học máy dựa trên các kĩ thuật thống kê và tối ưu hóa cho phép xây dựng cácmô hình học được các tri thức từ các nguồn thông tin đã biết trước đó. Sau đó sử dụngcác mô hình này để đự đoán các tri thức mới. Đối với bài toán dự đoán gen gây bệnh,trong khoảng 5 năm trở lại đây, cộng đồng nghiên cứu đã đưa ra khá nhiều phương pháp.Nhìn chung các phương pháp tính toán đều dựa trên hai khía cạnh. Một là, tích hợp nhiềuloại thông tin liên quan đến gen, như thông tin tương tác protein, thông tin biểu hiện gen,thông tin về những gen gây bệnh đã biết,... Vì các phân tử sinh học (gen, protein) trongcơ thể sống không tồn tại độc lập mà chúng thường tương tác với nhau tạo thành các phứchợp, các phức hợp này mới thể hiện chức năng. Vì vậy, tích hợp được càng nhiều loạithông tin về một đối tượng thì khả năng dự đoán ra chức năng của nó càng cao [1, 6]. Hailà, xây dựng các mô hình học máy phù hợp với dữ liệu sinh học, vì đặc điểm của dữ liệusinh học thường có số chiều rất lớn, nên cần đưa ra các mô hình học máy có thể làm việcđược với dữ liệu có số chiều lớn. Ngoài ra, các phương pháp học máy cũng phải làm việcđược trên nhiều loại dữ liệu khác nhau. Chẳng hạn một số phương pháp nghiên cứu gầnđây như ENDEAVOUR [6] và PhenoPred [7] đã sử dụng các phương pháp học đa-nhân(mutil-kernel learning) để tích hợp được nhiều loại thông tin. Nhìn chung, các phương pháp tính toán hiện nay chủ yếu dựa vào việc tích hợp cácnguồn thông tin khác nhau liên quan đến gen và bệnh để tăng cường khả năng đoán nhậngen bệnh. Tuy nhiên, các nguồn dữ liệu này thường có nhiễu và chưa đầy đủ, nên việc tìmkiếm các nguồn thông tin mới ảnh hưởng đến việc suy đoán ra chức năng mới của cácphần tử sinh học là một bài toán thách thức. Qua quá trình tìm hiểu, chúng tôi n ...
Nội dung trích xuất từ tài liệu:
Một phương pháp phân tích mạng tương tác protein để dự đoán gen gây bệnh ung thư JOURNAL OF SCIENCE OF HNUE FIT., 2013, Vol. 58, pp. 38-46 This paper is available online at http://stdb.hnue.edu.vn MỘT PHƯƠNG PHÁP PHÂN TÍCH MẠNG TƯƠNG TÁC PROTEIN ĐỂ DỰ ĐOÁN GEN GÂY BỆNH UNG THƯ Trần Thị Bích Phương1 , Nguyễn Văn Huấn2, Trần Đăng Hưng2 1 Trường Đại học Tây Nguyên; 2 Khoa Công nghệ Thông tin, Trường Đại học Sư Phạm Hà Nội 2 Email: hungtd@hnue.edu.vn Tóm tắt. Dự đoán gen gây bệnh là một trong những mục tiêu quan trọng trong nghiên cứu y sinh. Mặc dù hiện nay đã có khá nhiều phương pháp được xây dựng để dự đoán các gen liên quan đến một số bệnh cụ thể. Tuy nhiên, do mối quan hệ phức tạp giữa các gen và bệnh, nên rất nhiều các gen là nguyên nhân gây ra một số bệnh di truyền hiện vẫn chưa được phát hiện ra. Trong bài báo này, chúng tôi đề xuất một phương pháp tính toán dựa trên việc phân tích một mạng tích hợp các thông tin: mạng tương tác protein, mạng tương tác microRNA-gen, và các gen gây bệnh ung thư đã biết. Từ mạng tích hợp này, chúng tôi đưa ra phương pháp biểu diễn mới cho các gen dựa vào các tương tác trực tiếp và gián tiếp với các gen khác trong mạng. Các thông tin này sau đó được dùng để dự đoán một gen có phải là gen gây bệnh ung thư hay không. Chúng tôi đã áp dụng phương pháp đề xuất vào dữ liệu thực tế được download từ các trung tâm dữ liệu sinh học trên thế giới và sử dụng các phương pháp phân lớp phổ biến để đánh giá hiệu quả của phương pháp đề xuất. Kết quả cho thấy khi tích hợp thông tin về mạng tương tác microRNA thì độ chính xác của các phương pháp dự đoán được nâng lên. Điều này chứng tỏ thông tin về microRNA là hữu ích trong việc tiên lượng các gen gây bệnh. Từ khóa: Phân tích mạng, Protein, Ung thư, gen, microRNA, dữ liệu sinh học.1. Mở đầu Ung thư là một trong những bệnh phổ biến và nguy hiểm trên thế giới hiện nay, hàngnăm có hàng trăm nghìn người chết vì bệnh này [1, 2]. Việc tìm hiểu cơ chế và nguyênnhân gây bệnh ung thư là một trong những bài toán quan trọng trong y sinh. Các nguyênnhân có thể là do môi trường, do ngoại cảnh, nhưng một nguyên nhân không nhỏ là do ditruyền. Vậy câu hỏi đặt ra là, những vật chất di truyền nào là nguồn gốc gây ra bệnh ungthư. Bằng các nghiên cứu thực nghiệm, người ta đã chỉ ra rằng, với từng loại bệnh cụ thể,có thể do một số gen quy định gây ra [3]. Tuy nhiên, các nhà thực nghiệm chỉ tìm ra đượccác gen gây bệnh một cách đơn lẻ trên một số cá thể, hơn nữa các thực nghiệm này rất tốnthời gian và chi phí lớn. Với sự hỗ trợ của máy tính, các nhà sinh học tính toán có thể đưa38 Một phương pháp phân tích mạng tương tác protein để dự đoán gen gây bệnh ung thưra các phương pháp tính toán dựa trên những tri thức đã biết để tiên lượng khả năng gâybênh của các gen khác [2, 4]. Phương pháp tính toán được dùng hiện nay là các phương pháp học máy (machinelearning), học máy dựa trên các kĩ thuật thống kê và tối ưu hóa cho phép xây dựng cácmô hình học được các tri thức từ các nguồn thông tin đã biết trước đó. Sau đó sử dụngcác mô hình này để đự đoán các tri thức mới. Đối với bài toán dự đoán gen gây bệnh,trong khoảng 5 năm trở lại đây, cộng đồng nghiên cứu đã đưa ra khá nhiều phương pháp.Nhìn chung các phương pháp tính toán đều dựa trên hai khía cạnh. Một là, tích hợp nhiềuloại thông tin liên quan đến gen, như thông tin tương tác protein, thông tin biểu hiện gen,thông tin về những gen gây bệnh đã biết,... Vì các phân tử sinh học (gen, protein) trongcơ thể sống không tồn tại độc lập mà chúng thường tương tác với nhau tạo thành các phứchợp, các phức hợp này mới thể hiện chức năng. Vì vậy, tích hợp được càng nhiều loạithông tin về một đối tượng thì khả năng dự đoán ra chức năng của nó càng cao [1, 6]. Hailà, xây dựng các mô hình học máy phù hợp với dữ liệu sinh học, vì đặc điểm của dữ liệusinh học thường có số chiều rất lớn, nên cần đưa ra các mô hình học máy có thể làm việcđược với dữ liệu có số chiều lớn. Ngoài ra, các phương pháp học máy cũng phải làm việcđược trên nhiều loại dữ liệu khác nhau. Chẳng hạn một số phương pháp nghiên cứu gầnđây như ENDEAVOUR [6] và PhenoPred [7] đã sử dụng các phương pháp học đa-nhân(mutil-kernel learning) để tích hợp được nhiều loại thông tin. Nhìn chung, các phương pháp tính toán hiện nay chủ yếu dựa vào việc tích hợp cácnguồn thông tin khác nhau liên quan đến gen và bệnh để tăng cường khả năng đoán nhậngen bệnh. Tuy nhiên, các nguồn dữ liệu này thường có nhiễu và chưa đầy đủ, nên việc tìmkiếm các nguồn thông tin mới ảnh hưởng đến việc suy đoán ra chức năng mới của cácphần tử sinh học là một bài toán thách thức. Qua quá trình tìm hiểu, chúng tôi n ...
Tìm kiếm theo từ khóa liên quan:
Phân tích mạng Dữ liệu sinh học Dự đoán gen gây bệnh Nghiên cứu y sinh Mạng tương tác protein Mạng tương tác microRNA-genTài liệu liên quan:
-
7 trang 21 0 0
-
Nuôi cấy cơ quan thu nhỏ trong không gian 3 chiều: Xu hướng mới trong nghiên cứu y sinh
3 trang 19 0 0 -
Ngân hàng sinh học cho nghiên cứu y sinh ở Nhật Bản
8 trang 17 0 0 -
TIN SINH HỌC - CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
39 trang 16 0 0 -
Nghiên cứu thu nhận và đánh giá các loại tế bào đệm phục vụ cho nuôi phôi in Vitro
6 trang 14 0 0 -
Một phương pháp cải tiến cho bài toán xác định các gen liên quan đến bệnh
7 trang 13 0 0 -
Một thuật toán tối ưu đàn kiến dóng hàng toàn cục mạng tương tác protein
7 trang 12 0 0 -
Báo cáo học phần Mạng xã hội: Phân tích mạng các bài báo ChatGPT
17 trang 10 0 0 -
Bài giảng An toàn và bảo mật hệ thống công nghệ thông tin - Chương 3: Hạ tầng cơ sở và kết nối
13 trang 10 0 0 -
5 trang 10 0 0