Dự đoán cấu trúc bậc hai RNA bằng sự kết hợp thuật toán di truyền và logic mờ
Số trang: 10
Loại file: pdf
Dung lượng: 614.92 KB
Lượt xem: 7
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết giới thiệu sự kết hợp giữa thuật toán GA với logic mờ (Fuzzy Logic). Từ thuật toán kết hợp này chúng tôi áp dụng cho bài toán dự đoán cấu trúc bậc hai của các phân tử RNA (Ribonucleic Acid). Bài toán dự đoán cấu trúc bậc hai mà chúng tôi đề cập dựa trên phương pháp nhiệt động lực học, với việc tìm cấu trúc bậc hai có năng lượng cực tiểu.
Nội dung trích xuất từ tài liệu:
Dự đoán cấu trúc bậc hai RNA bằng sự kết hợp thuật toán di truyền và logic mờKỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018DOI: 10.15625/vap.2018.00015 DỰ ĐOÁN CẤU TRÚC BẬC HAI RNA BẰNG SỰ KẾT HỢP THUẬT TOÁN DI TRUYỀN VÀ LOGIC MỜ Đoàn Duy Bình1, Phạm Minh Tuấn2, Đặng Đức Long3, Nguyễn Hữu Danh2 1 Khoa Tin học, Trường Đại học Sư phạm, Đại học Đà Nẵng 2 Khoa Công nghệ thông tin, Trường Đại học Bách khoa, Đại học Đà Nẵng 3 Viện Nghiên cứu và Giáo dục Việt Anh, Đại học Đà Nẵng doanduybinh@gmail.com, pmtuan@dut.udn.vn, long.dang@vnuk.edu.vn, danh.nghuu@gmail.comTÓM TẮT: Trong bài báo này, chúng tôi giới thiệu sự kết hợp giữa thuật toán GA với logic mờ (Fuzzy Logic). Từ thuật toán kếthợp này chúng tôi áp dụng cho bài toán dự đoán cấu trúc bậc hai của các phân tử RNA (Ribonucleic Acid). Bài toán dự đoán cấutrúc bậc hai mà chúng tôi đề cập dựa trên phương pháp nhiệt động lực học, với việc tìm cấu trúc bậc hai có năng lượng cực tiếu.Với kết quả của các cấu trúc tìm được bằng thuật toán kết hợp mà chúng tôi giới thiệu, chúng tôi hy vọng sẽ đóng góp vào kho dữliệu của sinh học phân từ, phục vụ cho các nghiên cứu trong ngành sinh học phân tử. Đồng thời cũng giới thiệu được một cách tiếpcận mới về thuật toán di truyền.Từ khóa: RNA; Thuật toán di truyền; Logic mờ; Cấu trúc bậc hai; Dự đoán; I. GIỚI THIỆU RNA là một chuỗi nucleotide đơn bao gồm adenine (A), guanine (G), cytosine (C) và uracil (U) và nó có thể tựgấp lại để tạo thành cấu trúc bậc hai với các cặp base như A ≡ U, G = C, và G - U. Có nhiều dạng RNA khác nhauđược tìm thấy: RNA nhân không đồng nhất (hnRNA), RNA thông tin (mRNA), RNA vận chuyển (tRNA), RNAribosome (rRNA) và RNA nhân nhỏ. Về mặt cấu trúc, hnRNA và mRNA là cả hai đều là sợi đơn, trong khi rRNA vàtRNA hình thành cấu hình phân tử ba chiều. Mỗi loại RNA có một vai trò khác nhau trong các quá trình tế bào khácnhau như mang thông tin di truyền (mRNA), dịch mã (rRNA) và chuyển mã di truyền (tRNA). Mỗi chuỗi RNA, có thểgấp lại để hình thành một số cấu trúc bậc hai bậc hai có thể xảy ra. Xác định một cấu trúc bậc hai chính xác được gọi làbài toán dự đoán cấu trúc bậc hai [1]. Các phương pháp vật lý để xác định cấu trúc RNA, chẳng hạn như tia X, tinh thể và quang phổ cộng hưởng từhạt nhân (Nuclear Magnetic Resonance - NMR) là khó khăn, dễ bị lỗi, tốn thời gian, tốn kém chi phí và trong một sốtrường hợp là không khả thi [2]. Do đó, các phương pháp tính toán là các phương án thay thế thích hợp để dự đoán cấutrúc bậc hai của một phân tử RNA. Hiên nay, phương pháp dự đoán cấu trúc RNA tính toán chủ yếu tập trung vào dựđoán cấu trúc bậc hai RNA - tập hợp các cặp base hình thành khi các phân tử RNA gấp lại. Cấu trúc ba chiều của ARN,được xác định bởi các tọa độ của các nguyên tử, được gọi là cấu trúc bậc ba. Mặc dù rất khó khăn, nhưng vẫn có nhữngcách tiếp cận để dự đoán cấu trúc bậc ba RNA [3], [4]. Dự đoán cấu trúc bậc hai của RNA dễ hơn cấu trúc bậc ba vàcấu trúc bậc hai của RNA làm sáng tỏ cấu trúc bậc ba của RNA. Hai phương pháp tính toán khác nhau tồn tại cho dự đoán cấu trúc bậc RNA đó là: Phương pháp so sánh vàTối ưu hóa nhiệt động lực học. Kể từ khi RNA gấp lại là tùy thuộc vào luật nhiệt động lực học, có một giả định rằng cấu trúc chính xác là mộtcấu trúc năng lượng thấp. Sự ổn định của cấu trúc bậc hai phụ thuộc vào lượng năng lượng tự do được giải phóng đểtạo thành các cặp base. Do đó, năng lượng tự do của cấu trúc càng tiêu cực, thì một chuỗi đặc biệt ổn định hơn đượchình thành. Cấu trúc này được gọi là cấu trúc bậc hai năng lượng tự do tối thiểu (MFE) [5]. Trong trường hợp chỉ cóchuỗi của một phân tử RNA đã biết, phương pháp ab initio được sử dụng để thực hiện dự đoán cấu trúc bậc hai RNAnhư là một bài toán cực hiểu hóa năng lượng thông qua việc sử dụng các mô hình nhiệt động lực học. Những phươngpháp này là một trong hai quy hoạch động hoặc metaheuristics. Thuật toán áp dung cho Mfold và RNAfold là thuật toán quy hoạch động cho dự đoán cấu trúc bậc hai RNA dựatrên việc tìm năng lượng tự do tối thiểu. Thuật toán quy hoạch động như kỹ thuật toán học có thể đạt tối ưu toàn cụctrong các bài toán nhỏ. Nhưng trong các bài toán thực tế, có một số nhược điểm. Ví dụ, khi số lượng các biến tăng lên,số lượng các đánh giá của hàm đệ quy cũng sẽ tăng theo cấp số nhân. Đối với bài toán dự đoán cấu trúc bậc hai RNA,số lượng lớn các phương án cấu trúc làm cho khó xác định cái nào chính xác hơn. Ngoài ra, các thuật toán này chỉ dựđoán cấu trúc năng lượng tự do tối thiểu, trong khi cấu trúc tự nhiên thường có năng lượng tự do khoảng 5-10 % từnăng lượng tự do tối ...
Nội dung trích xuất từ tài liệu:
Dự đoán cấu trúc bậc hai RNA bằng sự kết hợp thuật toán di truyền và logic mờKỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018DOI: 10.15625/vap.2018.00015 DỰ ĐOÁN CẤU TRÚC BẬC HAI RNA BẰNG SỰ KẾT HỢP THUẬT TOÁN DI TRUYỀN VÀ LOGIC MỜ Đoàn Duy Bình1, Phạm Minh Tuấn2, Đặng Đức Long3, Nguyễn Hữu Danh2 1 Khoa Tin học, Trường Đại học Sư phạm, Đại học Đà Nẵng 2 Khoa Công nghệ thông tin, Trường Đại học Bách khoa, Đại học Đà Nẵng 3 Viện Nghiên cứu và Giáo dục Việt Anh, Đại học Đà Nẵng doanduybinh@gmail.com, pmtuan@dut.udn.vn, long.dang@vnuk.edu.vn, danh.nghuu@gmail.comTÓM TẮT: Trong bài báo này, chúng tôi giới thiệu sự kết hợp giữa thuật toán GA với logic mờ (Fuzzy Logic). Từ thuật toán kếthợp này chúng tôi áp dụng cho bài toán dự đoán cấu trúc bậc hai của các phân tử RNA (Ribonucleic Acid). Bài toán dự đoán cấutrúc bậc hai mà chúng tôi đề cập dựa trên phương pháp nhiệt động lực học, với việc tìm cấu trúc bậc hai có năng lượng cực tiếu.Với kết quả của các cấu trúc tìm được bằng thuật toán kết hợp mà chúng tôi giới thiệu, chúng tôi hy vọng sẽ đóng góp vào kho dữliệu của sinh học phân từ, phục vụ cho các nghiên cứu trong ngành sinh học phân tử. Đồng thời cũng giới thiệu được một cách tiếpcận mới về thuật toán di truyền.Từ khóa: RNA; Thuật toán di truyền; Logic mờ; Cấu trúc bậc hai; Dự đoán; I. GIỚI THIỆU RNA là một chuỗi nucleotide đơn bao gồm adenine (A), guanine (G), cytosine (C) và uracil (U) và nó có thể tựgấp lại để tạo thành cấu trúc bậc hai với các cặp base như A ≡ U, G = C, và G - U. Có nhiều dạng RNA khác nhauđược tìm thấy: RNA nhân không đồng nhất (hnRNA), RNA thông tin (mRNA), RNA vận chuyển (tRNA), RNAribosome (rRNA) và RNA nhân nhỏ. Về mặt cấu trúc, hnRNA và mRNA là cả hai đều là sợi đơn, trong khi rRNA vàtRNA hình thành cấu hình phân tử ba chiều. Mỗi loại RNA có một vai trò khác nhau trong các quá trình tế bào khácnhau như mang thông tin di truyền (mRNA), dịch mã (rRNA) và chuyển mã di truyền (tRNA). Mỗi chuỗi RNA, có thểgấp lại để hình thành một số cấu trúc bậc hai bậc hai có thể xảy ra. Xác định một cấu trúc bậc hai chính xác được gọi làbài toán dự đoán cấu trúc bậc hai [1]. Các phương pháp vật lý để xác định cấu trúc RNA, chẳng hạn như tia X, tinh thể và quang phổ cộng hưởng từhạt nhân (Nuclear Magnetic Resonance - NMR) là khó khăn, dễ bị lỗi, tốn thời gian, tốn kém chi phí và trong một sốtrường hợp là không khả thi [2]. Do đó, các phương pháp tính toán là các phương án thay thế thích hợp để dự đoán cấutrúc bậc hai của một phân tử RNA. Hiên nay, phương pháp dự đoán cấu trúc RNA tính toán chủ yếu tập trung vào dựđoán cấu trúc bậc hai RNA - tập hợp các cặp base hình thành khi các phân tử RNA gấp lại. Cấu trúc ba chiều của ARN,được xác định bởi các tọa độ của các nguyên tử, được gọi là cấu trúc bậc ba. Mặc dù rất khó khăn, nhưng vẫn có nhữngcách tiếp cận để dự đoán cấu trúc bậc ba RNA [3], [4]. Dự đoán cấu trúc bậc hai của RNA dễ hơn cấu trúc bậc ba vàcấu trúc bậc hai của RNA làm sáng tỏ cấu trúc bậc ba của RNA. Hai phương pháp tính toán khác nhau tồn tại cho dự đoán cấu trúc bậc RNA đó là: Phương pháp so sánh vàTối ưu hóa nhiệt động lực học. Kể từ khi RNA gấp lại là tùy thuộc vào luật nhiệt động lực học, có một giả định rằng cấu trúc chính xác là mộtcấu trúc năng lượng thấp. Sự ổn định của cấu trúc bậc hai phụ thuộc vào lượng năng lượng tự do được giải phóng đểtạo thành các cặp base. Do đó, năng lượng tự do của cấu trúc càng tiêu cực, thì một chuỗi đặc biệt ổn định hơn đượchình thành. Cấu trúc này được gọi là cấu trúc bậc hai năng lượng tự do tối thiểu (MFE) [5]. Trong trường hợp chỉ cóchuỗi của một phân tử RNA đã biết, phương pháp ab initio được sử dụng để thực hiện dự đoán cấu trúc bậc hai RNAnhư là một bài toán cực hiểu hóa năng lượng thông qua việc sử dụng các mô hình nhiệt động lực học. Những phươngpháp này là một trong hai quy hoạch động hoặc metaheuristics. Thuật toán áp dung cho Mfold và RNAfold là thuật toán quy hoạch động cho dự đoán cấu trúc bậc hai RNA dựatrên việc tìm năng lượng tự do tối thiểu. Thuật toán quy hoạch động như kỹ thuật toán học có thể đạt tối ưu toàn cụctrong các bài toán nhỏ. Nhưng trong các bài toán thực tế, có một số nhược điểm. Ví dụ, khi số lượng các biến tăng lên,số lượng các đánh giá của hàm đệ quy cũng sẽ tăng theo cấp số nhân. Đối với bài toán dự đoán cấu trúc bậc hai RNA,số lượng lớn các phương án cấu trúc làm cho khó xác định cái nào chính xác hơn. Ngoài ra, các thuật toán này chỉ dựđoán cấu trúc năng lượng tự do tối thiểu, trong khi cấu trúc tự nhiên thường có năng lượng tự do khoảng 5-10 % từnăng lượng tự do tối ...
Tìm kiếm theo từ khóa liên quan:
Thuật toán di truyền Cấu trúc bậc hai Thuật toán GA Phân tử RNA Phương pháp nhiệt động lực họcGợi ý tài liệu liên quan:
-
9 trang 118 0 0
-
Một thuật toán di truyền cho thiết kế Topology ảo trong mạng cáp quang
9 trang 67 0 0 -
Ứng dụng giải thuật Tabu search trong giải bài toán định tuyến xe
6 trang 61 0 0 -
Chương trình tính toán tối ưu lưới điện phân phối trung áp
9 trang 56 0 0 -
8 trang 52 0 0
-
Cải tiến thuật toán cây quyết định C4.5 cho vấn đề phân nhóm trẻ tự kỷ
6 trang 47 0 0 -
Tối ưu hoá thiết kế mạng nội bộ bằng quy hoạch tuyến tính
5 trang 39 0 0 -
Bù tối ưu công suất phản kháng sử dụng thuật toán dòng điện nút tương đương và thuật toán di truyền
8 trang 37 0 0 -
4 trang 26 0 0
-
Ứng dụng giải thuật di truyền trong xử lý bài toán định tuyến xe
6 trang 25 0 0