![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Tóm tắt luận văn Thạc sĩ: Dự đoán chức năng Gene sử dụng kỹ thuật phân loại phân cấp
Số trang: 25
Loại file: pdf
Dung lượng: 621.88 KB
Lượt xem: 7
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu và nội dung luận văn thạc sĩ sẽ tập trung vào việc nghiên cứu áp dụng phân loại phân cấp cho bài toán xác định chức năng gene và đánh giá kết quả bằng thực nghiệm. Đối tương nghiên cứu của đề tài là bộ dữ liệu mô tả chức năng của gene người đã có sẵn để xây dựng tập huấn luyện.
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Dự đoán chức năng Gene sử dụng kỹ thuật phân loại phân cấpHỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- Trần Xuân Thanh DỰ ĐOÁN CHỨC NĂNG GENE SỬ DỤNG KỸ THUẬT PHÂN LOẠI PHÂN CẤP Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Người hướng dẫn khoa học: PGS.TS Từ Minh Phương TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2012 1 MỞ ĐẦU Hiện nay, kỹ thuật phân loại dữ liệu được sử dụng rôngrãi trong hầu hết các lĩnh vực khác nhau của trí tuệ nhân tạonhư phân loại văn bản, phân loại chữ viết tay, phân loạihình ảnh, phân loại chức năng của gene,… Trong thực tế có rất nhiều phương pháp phân loại dữliệu, mỗi phương pháp lại có những đặc điểm riêng phù hợpvới từng đối tượng dữ liệu cần phân loại. Luận văn này sẽtrình bày về phương pháp phân loại phân cấp đa nhãn(hierarchical multi-label classification - HMC) để giải quyếtbài toán dự đoán chức năng của gene. Việc xác định chứcnăng của một gene mới có ý nghĩa rất quan trọng trong cácnghiên cứu sinh học và y học. Bài toán dự đoán chức năng của gene thực chất là bàitoán phân loại. Chức năng của gene được thể hiện dưới dạngcây phân cấp. Mỗi gene đảm nhận một chức năng nào đó vàcó mối liên hệ với các gene khác. Xác định được chức năngcủa gene chính là xác định vị trí tương đối của chúng vớicác gene khác. Do đó, việc giải quyết vấn đề xác định chứcchức năng của gene cũng chính là phân loại gene dựa vàochức năng của chúng. Bài toán xác định chức năng của genelúc này quy về bài toán phân loại gene dưới dạng cây phâncấp. 2 Do tổ chức phân cấp của các GO term, khi xác địnhchức năng của gene thuật toán phân loại cần tính tới phâncấp này. Đã có một số nghiên cứu tập trung vào việc pháttriển kỹ thuật phân loại có tính tới đặc thù phân cấp củaGene Ontology (GO). Mục tiêu và nội dung luận văn sẽ tậptrung vào việc nghiên cứu áp dụng phân loại phân cấp chobài toán xác định chức năng gene và đánh giá kết quả bằngthực nghiệm. Đối tương nghiên cứu của đề tài là bộ dữ liệu mô tảchức năng của gene người đã có sẵn để xây dựng tập huấnluyện. Phạm vi nghiên cứu của luận văn tập trung vào dựđoán, xác định chức năng của một gene mới sử dụngphương pháp phân loại phân cấp dựa trên bộ dữ liệu đã cho.Bố cục của luận văn gồm: Chương 1: Trình bày về các khái niệm cơ bản về gene,chức năng của gene. Tiếp đến là khái niệm về gene ontology(GO). Chương 2: Trình bày phần chính của luận văn. Trướctiên là giới thiệu sơ bộ và phân loại các phương pháp phânloại dữ liệu sử dụng trong bài toán dự đoán chức năng củagene. Tiếp theo trình bày về khái niệm cây quyết định và cácphương pháp phân loại dựa vào cây quyết định. Quan trọng 3nhất trong phần này, đi sâu trình bày phương pháp phân cấpphân loại dữ liệu. Chương 3: Mô tả quá trình kiểm thử và chạy hệ thốngCLUS. Đầu tiên giới thiệu sơ bộ về hệ thống CLUS, sau đótìm hiều về các định dạng dữ liệu đầu vào và đầu ra của hệthống CLUS. Cuối cùng là đánh giá kết quả khi tiến hànhchạy hệ thống với bộ dữ liệu gene nấm men. 4Chương 1: TỔNG QUAN VỀ GENE VÀ DỰ ĐOÁNCHỨC NĂNG GENE1.1.1. Chức năng của gene và phân loại chức năng gene1.1.2. Một số khái niệm cơ bản về gene Nhiễm sắc thể chứa DNA (deoxyribonucleic acid) manggene. Gen được truyền từ bố mẹ sang con cái và được xem làđơn vị cơ bản của sự di truyền, ảnh hưởng lên mọi cấu trúc vàchức năng của cơ thể. Ở người có khoảng từ 30.000-40.000gene cấu trúc (gene mã hóa cho RNA hoặc các protein).1.1.3. Chức năng của gene Thông thường, mỗi gene mã hóa một protein tương ứng.Các protein này đảm nhiệm những vai trò hay chức năng khácnhau trong cơ thể các sinh vật. Các chức năng củagene/protein rất đa dạng, từ đóng vai trò trong các phản ứngsinh hóa của tế bào, tới tương tác và điều hòa sự hoạt độngcủa các gen khác. Việc xác định chức năng của gene cũng nhưsản phẩm của gene là nhiệm vụ quan trọng của sinh học phântử và tin sinh học.1.1.4. Gene ontology (GO) Các nghiên cứu về gene cho thấy cấu trúc gene rất phứctạp đặc biệt là gene người. Để sử dụng dữ liệu về chức năng 5của gene cho hệ thống phân loại phân cấp thì dữ liệu về genephải được trừu tượng hóa, định dạng lại theo chuẩn đầu vàocủa hệ thống phân loại. Phương pháp phân loại được sử dụng trong đề tài này làphân loại phân cấp đa nhãn dựa trên cây quyết định được càiđặt cho hệ thống CLUS sử dụng bộ dữ liệu theo chuẩn chung.Bộ dữ liệu về gene của các sinh vật đã được hoàn thiện dầnqua các nghiên cứu gần đây, tạo nên một chuẩn biểu diễn. Cácphương ph ...
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Dự đoán chức năng Gene sử dụng kỹ thuật phân loại phân cấpHỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- Trần Xuân Thanh DỰ ĐOÁN CHỨC NĂNG GENE SỬ DỤNG KỸ THUẬT PHÂN LOẠI PHÂN CẤP Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Người hướng dẫn khoa học: PGS.TS Từ Minh Phương TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2012 1 MỞ ĐẦU Hiện nay, kỹ thuật phân loại dữ liệu được sử dụng rôngrãi trong hầu hết các lĩnh vực khác nhau của trí tuệ nhân tạonhư phân loại văn bản, phân loại chữ viết tay, phân loạihình ảnh, phân loại chức năng của gene,… Trong thực tế có rất nhiều phương pháp phân loại dữliệu, mỗi phương pháp lại có những đặc điểm riêng phù hợpvới từng đối tượng dữ liệu cần phân loại. Luận văn này sẽtrình bày về phương pháp phân loại phân cấp đa nhãn(hierarchical multi-label classification - HMC) để giải quyếtbài toán dự đoán chức năng của gene. Việc xác định chứcnăng của một gene mới có ý nghĩa rất quan trọng trong cácnghiên cứu sinh học và y học. Bài toán dự đoán chức năng của gene thực chất là bàitoán phân loại. Chức năng của gene được thể hiện dưới dạngcây phân cấp. Mỗi gene đảm nhận một chức năng nào đó vàcó mối liên hệ với các gene khác. Xác định được chức năngcủa gene chính là xác định vị trí tương đối của chúng vớicác gene khác. Do đó, việc giải quyết vấn đề xác định chứcchức năng của gene cũng chính là phân loại gene dựa vàochức năng của chúng. Bài toán xác định chức năng của genelúc này quy về bài toán phân loại gene dưới dạng cây phâncấp. 2 Do tổ chức phân cấp của các GO term, khi xác địnhchức năng của gene thuật toán phân loại cần tính tới phâncấp này. Đã có một số nghiên cứu tập trung vào việc pháttriển kỹ thuật phân loại có tính tới đặc thù phân cấp củaGene Ontology (GO). Mục tiêu và nội dung luận văn sẽ tậptrung vào việc nghiên cứu áp dụng phân loại phân cấp chobài toán xác định chức năng gene và đánh giá kết quả bằngthực nghiệm. Đối tương nghiên cứu của đề tài là bộ dữ liệu mô tảchức năng của gene người đã có sẵn để xây dựng tập huấnluyện. Phạm vi nghiên cứu của luận văn tập trung vào dựđoán, xác định chức năng của một gene mới sử dụngphương pháp phân loại phân cấp dựa trên bộ dữ liệu đã cho.Bố cục của luận văn gồm: Chương 1: Trình bày về các khái niệm cơ bản về gene,chức năng của gene. Tiếp đến là khái niệm về gene ontology(GO). Chương 2: Trình bày phần chính của luận văn. Trướctiên là giới thiệu sơ bộ và phân loại các phương pháp phânloại dữ liệu sử dụng trong bài toán dự đoán chức năng củagene. Tiếp theo trình bày về khái niệm cây quyết định và cácphương pháp phân loại dựa vào cây quyết định. Quan trọng 3nhất trong phần này, đi sâu trình bày phương pháp phân cấpphân loại dữ liệu. Chương 3: Mô tả quá trình kiểm thử và chạy hệ thốngCLUS. Đầu tiên giới thiệu sơ bộ về hệ thống CLUS, sau đótìm hiều về các định dạng dữ liệu đầu vào và đầu ra của hệthống CLUS. Cuối cùng là đánh giá kết quả khi tiến hànhchạy hệ thống với bộ dữ liệu gene nấm men. 4Chương 1: TỔNG QUAN VỀ GENE VÀ DỰ ĐOÁNCHỨC NĂNG GENE1.1.1. Chức năng của gene và phân loại chức năng gene1.1.2. Một số khái niệm cơ bản về gene Nhiễm sắc thể chứa DNA (deoxyribonucleic acid) manggene. Gen được truyền từ bố mẹ sang con cái và được xem làđơn vị cơ bản của sự di truyền, ảnh hưởng lên mọi cấu trúc vàchức năng của cơ thể. Ở người có khoảng từ 30.000-40.000gene cấu trúc (gene mã hóa cho RNA hoặc các protein).1.1.3. Chức năng của gene Thông thường, mỗi gene mã hóa một protein tương ứng.Các protein này đảm nhiệm những vai trò hay chức năng khácnhau trong cơ thể các sinh vật. Các chức năng củagene/protein rất đa dạng, từ đóng vai trò trong các phản ứngsinh hóa của tế bào, tới tương tác và điều hòa sự hoạt độngcủa các gen khác. Việc xác định chức năng của gene cũng nhưsản phẩm của gene là nhiệm vụ quan trọng của sinh học phântử và tin sinh học.1.1.4. Gene ontology (GO) Các nghiên cứu về gene cho thấy cấu trúc gene rất phứctạp đặc biệt là gene người. Để sử dụng dữ liệu về chức năng 5của gene cho hệ thống phân loại phân cấp thì dữ liệu về genephải được trừu tượng hóa, định dạng lại theo chuẩn đầu vàocủa hệ thống phân loại. Phương pháp phân loại được sử dụng trong đề tài này làphân loại phân cấp đa nhãn dựa trên cây quyết định được càiđặt cho hệ thống CLUS sử dụng bộ dữ liệu theo chuẩn chung.Bộ dữ liệu về gene của các sinh vật đã được hoàn thiện dầnqua các nghiên cứu gần đây, tạo nên một chuẩn biểu diễn. Cácphương ph ...
Tìm kiếm theo từ khóa liên quan:
Luận văn thạc sĩ Tóm tắt luận văn thạc sĩ Khoa học máy tính Luận văn khoa học máy tính Dự đoán chức năng gene Chức năng geneTài liệu liên quan:
-
30 trang 567 0 0
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 490 1 0 -
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 383 6 0 -
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 369 5 0 -
97 trang 337 0 0
-
97 trang 323 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 305 0 0 -
155 trang 299 0 0
-
26 trang 294 0 0
-
26 trang 278 0 0