Tóm tắt luận văn Thạc sĩ: Xác định đoạn điều hòa gen trên trình tự ADN bằng phương pháp tính toán
Số trang: 25
Loại file: pdf
Dung lượng: 654.86 KB
Lượt xem: 6
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận văn tập trung nghiên cứu nhóm phương pháp sử dụng máy vector hỗ trợ quyết định SVM để xác định vùng tăng cường từ trình tự ADN của động vật bậc cao và nghiên cứu một số phương pháp mới để xây dựng hàm kernel dùng để biểu diễn trình tự ADN khi sử dụng với SVM và thử nghiệm trên một số bộ dữ liệu thực.
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Xác định đoạn điều hòa gen trên trình tự ADN bằng phương pháp tính toán HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- HOÀNG VĂN THÀNHXÁC ĐỊNH ĐOẠN ĐIỀU HÒA GEN TRÊN TRÌNH TỰ ADN BẰNG PHƯƠNG PHÁP TÍNH TOÁN Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2013 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNGNgười hướng dẫn khoa học: PGS.TS Từ Minh PhươngPhản biện 1: ………………………………………………………………………………………………………………………………………………………Phản biện 2: ………………………………………………………………………………………………………………………………………………………Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học việnCông nghệ Bưu chính Viễn thôngVào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............Có thể tìm hiểu luận văn tại: - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1 MỞ ĐẦU Trải qua nhiều thập kỉ, khoa học máy tính đã có những bước phát triển vượtbậc. Ngày nay, khoa học máy tính đã khám phá ra những khả năng mới trong mộtlĩnh vực đầy hứa hẹn như tin sinh học. Sinh học và những nguyên lý liên quan của nólà một vùng đất màu mỡ để các nhà nghiên cứu tiếp tục đào sâu tìm hiểu. Tin sinhhọc hay sinh học tính toán liên quan đến việc sử dụng các kỹ thuật từ toán học ứngdụng, tin học, thống kê… để giải quyết các vấn đề sinh học. Một số mảng nghiên cứuchính đang được phát triển như là phân tích chuỗi, phân tích biểu diễn gen, dự đoáncấu trúc ADN và protein, các thuật toán dùng cho tin sinh học… Công nghệ sinh học phân tử hiện đại cho phép thu thập rất nhiều loại dữ liệu,thông tin liên quan tới gen và protein. Có một vấn đề đặt ra là sau khi xác định đượcchức năng của gen, nếu phát hiện được gen đấy có nằm trong một chuỗi ADN, thìlàm thế nào để ta có thể xác định được nó hoạt động hay không? Đây không phải làmột vấn đề mới trong sinh học, nhưng có vai trò quan trọng trong việc tìm hiểu cơchế hoạt động của các quá trình sinh học. Một trong những tác nhân quan trọng tác động lớn đến sự hoạt động của genlà vùng tăng cường. Vì vậy, bài toán về xác định sự hoạt động của gen có thể đượcđưa về bài toán nhỏ hơn là xác định trong chuỗi ADN chứa gen ấy có chứa các vùngtăng cường tương ứng của nó hay không. Nhưng làm thế nào để có thể tìm ra đượccác vùng tăng cường tương ứng với một gen? Công việc này, trước đây, có thể được thực hiện thông qua quá trình thựcnghiệm. Phương pháp này rất chính xác, tuy nhiên, nó rất chậm và tốn rất nhiều công.Đặc biệt là với tình hình hiện nay, khi mà số lượng gen tìm được càng ngày càngnhiều, thì yêu cầu được đặt ra là cần tìm ra được những phương pháp mới nhanh vàrẻ hơn, và phương pháp tính toán (tin sinh học) là một trong những phương pháp cóthể đáp ứng được những yêu cầu đó. Đã có nhiều phương pháp tính toán được đưa rađể giải quyết bài toán, mỗi phương pháp có những ưu điểm, nhược điểm riêng. Luậnvăn tập trung nghiên cứu nhóm phương pháp sử dụng máy vector hỗ trợ quyết định 2SVM để xác định vùng tăng cường (enhancer) từ trình tự ADN của động vật bậc cao.Do đặc trưng của SVM, khi ta áp dụng các hàm kernel khác nhau thì kết quả được trảvề cũng sẽ khác nhau. Luận văn đã nghiên cứu một số phương pháp mới để xây dựnghàm kernel dùng để biểu diễn trình tự ADN khi sử dụng với SVM và thử nghiệm trênmột số bộ dữ liệu thực. Phương pháp đề xuất có kết quả tốt, cho phép cải thiện độchính xác so với những phương pháp đã có. Các kết quả được công bố trong bài báo “Enhancer prediction using distanceaware kernels”. Bài báo đã được chấp nhận đăng tại kỷ yếu hội nghị RIVF 2013 sẽdiễn ra vào tháng 11/2013. 3 CHƯƠNG 1: CÁC KHÁI NIỆM VÀ VẤN ĐỀ LIÊN QUAN ĐẾN BÀI TOÁN XÁC ĐỊNH VÙNG TĂNG CƯỜNG Nội dung chương giới thiệu về các khái niệm trong tin sinh học liên quan đếnbài toán xác định vùng tăng cường như sự hoạt động của gen, điều hòa hoạt động củagen, nhân tố phiên mã (transcription factor), vùng tăng cường (enhancer) và trình bàyvề các nhóm phương pháp tìm kiếm vùng tăng cường đã có. 1.1. Các khái niệm 1.1.1.Sự hoạt động của gen Các gen là đơn vị mang thông tin di truyền của sinh vật. Tùy vào loại tế bào vàđiều kiện môi trường cụ thế, một gen có thể hoạt động hay không hoạt động. Sự hoạtđộng của gen là quá trình tổng hợp thành các sản phẩm gen từ những thông tin đượcmã hóa trong gen. Các sản phẩm gen thường là các protein, nhưng cũng tồn tại cácgen không mã hóa thông tin cho protein như rARN, tARN hay snARN, sản phẩm củanhững gen này là các ARN chức năng. Quá trình hoạt động của gen bao ...
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Xác định đoạn điều hòa gen trên trình tự ADN bằng phương pháp tính toán HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- HOÀNG VĂN THÀNHXÁC ĐỊNH ĐOẠN ĐIỀU HÒA GEN TRÊN TRÌNH TỰ ADN BẰNG PHƯƠNG PHÁP TÍNH TOÁN Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2013 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNGNgười hướng dẫn khoa học: PGS.TS Từ Minh PhươngPhản biện 1: ………………………………………………………………………………………………………………………………………………………Phản biện 2: ………………………………………………………………………………………………………………………………………………………Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học việnCông nghệ Bưu chính Viễn thôngVào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............Có thể tìm hiểu luận văn tại: - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1 MỞ ĐẦU Trải qua nhiều thập kỉ, khoa học máy tính đã có những bước phát triển vượtbậc. Ngày nay, khoa học máy tính đã khám phá ra những khả năng mới trong mộtlĩnh vực đầy hứa hẹn như tin sinh học. Sinh học và những nguyên lý liên quan của nólà một vùng đất màu mỡ để các nhà nghiên cứu tiếp tục đào sâu tìm hiểu. Tin sinhhọc hay sinh học tính toán liên quan đến việc sử dụng các kỹ thuật từ toán học ứngdụng, tin học, thống kê… để giải quyết các vấn đề sinh học. Một số mảng nghiên cứuchính đang được phát triển như là phân tích chuỗi, phân tích biểu diễn gen, dự đoáncấu trúc ADN và protein, các thuật toán dùng cho tin sinh học… Công nghệ sinh học phân tử hiện đại cho phép thu thập rất nhiều loại dữ liệu,thông tin liên quan tới gen và protein. Có một vấn đề đặt ra là sau khi xác định đượcchức năng của gen, nếu phát hiện được gen đấy có nằm trong một chuỗi ADN, thìlàm thế nào để ta có thể xác định được nó hoạt động hay không? Đây không phải làmột vấn đề mới trong sinh học, nhưng có vai trò quan trọng trong việc tìm hiểu cơchế hoạt động của các quá trình sinh học. Một trong những tác nhân quan trọng tác động lớn đến sự hoạt động của genlà vùng tăng cường. Vì vậy, bài toán về xác định sự hoạt động của gen có thể đượcđưa về bài toán nhỏ hơn là xác định trong chuỗi ADN chứa gen ấy có chứa các vùngtăng cường tương ứng của nó hay không. Nhưng làm thế nào để có thể tìm ra đượccác vùng tăng cường tương ứng với một gen? Công việc này, trước đây, có thể được thực hiện thông qua quá trình thựcnghiệm. Phương pháp này rất chính xác, tuy nhiên, nó rất chậm và tốn rất nhiều công.Đặc biệt là với tình hình hiện nay, khi mà số lượng gen tìm được càng ngày càngnhiều, thì yêu cầu được đặt ra là cần tìm ra được những phương pháp mới nhanh vàrẻ hơn, và phương pháp tính toán (tin sinh học) là một trong những phương pháp cóthể đáp ứng được những yêu cầu đó. Đã có nhiều phương pháp tính toán được đưa rađể giải quyết bài toán, mỗi phương pháp có những ưu điểm, nhược điểm riêng. Luậnvăn tập trung nghiên cứu nhóm phương pháp sử dụng máy vector hỗ trợ quyết định 2SVM để xác định vùng tăng cường (enhancer) từ trình tự ADN của động vật bậc cao.Do đặc trưng của SVM, khi ta áp dụng các hàm kernel khác nhau thì kết quả được trảvề cũng sẽ khác nhau. Luận văn đã nghiên cứu một số phương pháp mới để xây dựnghàm kernel dùng để biểu diễn trình tự ADN khi sử dụng với SVM và thử nghiệm trênmột số bộ dữ liệu thực. Phương pháp đề xuất có kết quả tốt, cho phép cải thiện độchính xác so với những phương pháp đã có. Các kết quả được công bố trong bài báo “Enhancer prediction using distanceaware kernels”. Bài báo đã được chấp nhận đăng tại kỷ yếu hội nghị RIVF 2013 sẽdiễn ra vào tháng 11/2013. 3 CHƯƠNG 1: CÁC KHÁI NIỆM VÀ VẤN ĐỀ LIÊN QUAN ĐẾN BÀI TOÁN XÁC ĐỊNH VÙNG TĂNG CƯỜNG Nội dung chương giới thiệu về các khái niệm trong tin sinh học liên quan đếnbài toán xác định vùng tăng cường như sự hoạt động của gen, điều hòa hoạt động củagen, nhân tố phiên mã (transcription factor), vùng tăng cường (enhancer) và trình bàyvề các nhóm phương pháp tìm kiếm vùng tăng cường đã có. 1.1. Các khái niệm 1.1.1.Sự hoạt động của gen Các gen là đơn vị mang thông tin di truyền của sinh vật. Tùy vào loại tế bào vàđiều kiện môi trường cụ thế, một gen có thể hoạt động hay không hoạt động. Sự hoạtđộng của gen là quá trình tổng hợp thành các sản phẩm gen từ những thông tin đượcmã hóa trong gen. Các sản phẩm gen thường là các protein, nhưng cũng tồn tại cácgen không mã hóa thông tin cho protein như rARN, tARN hay snARN, sản phẩm củanhững gen này là các ARN chức năng. Quá trình hoạt động của gen bao ...
Tìm kiếm theo từ khóa liên quan:
Luận văn thạc sĩ Tóm tắt luận văn thạc sĩ Khoa học máy tính Luận văn khoa học máy tính Xác định đoạn điều hòa gen Luận văn xác định đoạn điều hòa genGợi ý tài liệu liên quan:
-
30 trang 556 0 0
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 476 1 0 -
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 378 6 0 -
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 365 5 0 -
97 trang 329 0 0
-
97 trang 311 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 302 0 0 -
26 trang 288 0 0
-
155 trang 280 0 0
-
26 trang 276 0 0