Tóm tắt Luận án Tiến sĩ Công nghệ thông tin: Các phương pháp xây dựng ma trận biến đổi axít amin
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Tiến sĩ Công nghệ thông tin: Các phương pháp xây dựng ma trận biến đổi axít aminĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆ------------------------------------------ĐẶNG CAO CƯỜNGCÁC PHƯƠNG PHÁP XÂY DỰNG MA TRẬNBIẾN ĐỔI AXÍT AMINChuyên ngành: Khoa học Máy tínhMãsố: 62.48.01.01TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TINCông trình được hoàn thành tại: Trường Đại học Công nghệ - Đạihọc Quốc gia Hà Nội.Người hướng dẫn khoa học:1. TS. Lê Sỹ Vinh2. TS. Lê Sĩ QuangPhản biện 1: PGS.TSKH. Vũ Đình HòaTrường Đại học Sư phạm Hà NộiPhản biện 2: PGS.TS. Lương Chi MaiViện Công nghệ thông tin, Viện Hàn lâm KH&CN VNPhản biện 3: PGS.TS. Nguyễn Đức NghĩaTrường Đại học Bách khoa Hà NộiLuận án sẽ được bảo vệ trước hội đồng cấp Đại học Quốc giachấm luận án tiến sĩ họp tại Trường Đại học Công nghệ vào hồi 9giờ 00 ngày 10 tháng 01 năm 2014.Có thể tìm hiểu luận án tại:- Thư viện Quốc gia Việt Nam- Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà NộiMỞ ĐẦU1. Tính cấp thiết của luận ánỨng dụng công nghệ thông tin để nghiên cứu và giải quyết các bài toán trongsinh học phân tử đang rất được quan tâm. Tin sinh học là lĩnh vực nghiên cứu kếthợp cả hai ngành công nghệ thông tin và sinh học phân tử. Tin sinh học đang đượcđầu tư lớn do khả năng mang lại sự tiến bộ về khoa học và hiệu quả kinh tế thôngqua việc thúc đẩy sự phát triển công nghệ sinh học và ứng dụng trong y tế, nôngnghiệp và các lĩnh vực khác.Các bài toán liên quan đến chuỗi prôtêin như sắp hàng đa chuỗi, tìm kiếmchuỗi tương đồng, xây dựng cây phân loài đều là các bài toán cơ bản và quantrọng của tin sinh học. Tất cả các bài toán này đều cần đến một thành phần rấtquan trọng là mô hình (ma trận) biến đổi axít amin. Mô hình biến đổi axít amincó số lượng tham số lớn (khoảng 200 tham số) và thường khó có thể ước lượngtrực tiếp trong quá trình phân tích dữ liệu. Chúng ta thường ước lượng trướcmột mô hình chung (general model) và mô hình này được sử dụng cho mọi bộdữ liệu prôtêin. Mô hình tổng quát đầu tiên là PAM và gần đây nhất là LG.Quá trình ước lượng mô hình biến đổi axít amin là một quá trình phức tạp vàtrải qua nhiều bước tính toán khác nhau, mỗi bước là một bài toán khó. Ba bướcchính của quá trình ước lượng mô hình là:1. Xây dựng cây phân loài từ tập các sắp hàng đa chuỗi. Các thuật toán xâydựng cây dùng trong quá trình ước lượng mô hình còn tốn rất nhiều thờigian. Ví dụ phải mất vài ngày để ước lượng được mô hình LG.2. Xác định các ràng buộc liên quan đến mô hình. Độ chính xác của mô hìnhhiện tại vẫn còn hạn chế do việc mô hình hoá đã loại bỏ một số điều kiệnràng buộc trong sinh học phân tử.3. Xây dựng các mô hình riêng biệt cho các loài sinh vật khác nhau. Đây làmột bước rất quan trọng bởi vì trong nhiều trường hợp các mô hình chungkhông mô hình hoá được hết các đặc điểm biến đổi riêng biệt của các loài.2. Các đóng góp của luận án1. Đề xuất một số phương pháp mới để tăng tốc độ quá trình xây dựng cây,giảm bớt số bước tối ưu cấu trúc cây, từ đó giúp giảm thời gian ước lượngmô hình.2. Sử dụng thêm các ràng buộc trong sinh học phân tử vào quá trình mô hìnhhoá. Việc này sẽ giúp nâng cao tính chính xác của mô hình biến đổi axítamin khi phân tích dữ liệu.3. Xây dựng một hệ thống ước lượng tự động mô hình biến đổi axít amin từdữ liệu của người dùng, qua đó giúp người dùng có thể ước lượng các môhình riêng biệt cho các loài sinh vật khác nhau.4. Bên cạnh đó, luận án cũng xây dựng thử nghiệm mô hình biến đổi axítamin cho riêng vi rút cúm và kiểm nghiệm tính hiệu quả của mô hình mớinày.Các kết quả của luận án đã được công bố trong 03 bài báo ở tạp chí SCI quốc tếvà 02 báo cáo ở hội nghị quốc tế.3. Bố cục của luận ánNgoài phần kết luận, luận án được tổ chức như sau.zChương 1 giới thiệu khái quát về chuỗi ADN, chuỗi axít amin, các phép biếnđổi, mô hình biến đổi và bài toán ước lượng mô hình biến đổi axít amin. Tiếptheo là phần trình bày về hai cách tiếp cận chính để ước lượng mô hình biến đổiaxít amin là phương pháp đếm và phương pháp cực đại khả năng (maximumlikelihood). Phần cuối của chương này giới thiệu về phương pháp xây dựng câyphân loài bằng phương pháp cực đại khả năng và các phương pháp so sánh haimô hình biến đổi axít amin.Chương 2 đề xuất phương pháp ước lượng nhanh mô hình biến đổi axít amin.Để làm được điều đó, chúng tôi đề xuất hai phương pháp chia tách nhỏ dữ liệuđầu vào. Hai phương pháp này giúp giảm thời gian xây dựng cây phân loài, mộtbước chiếm rất nhiều thời gian trong quá trình ước lượng mô hình biến đổi axítamin. Các thực nghiệm ở phần sau của chương đã chứng tỏ được hiệu quả củahai phương pháp này.Chương 3 của luận án giới thiệu mô hình biến đổi axít amin sử dụng nhiềuma trận, một cải tiến mới so với các mô hình đơn ma trận hiện nay. Mô hìnhmới này sử dụng thêm các ràng buộc trong sinh học phân tử giúp tăng cườngkhả năng mô hình hoá các quá trình biến đổi của các chuỗi axít amin. Cácthực nghiệm với hai bộ dữ liệu HSSP và TreeBase đã chứng tỏ mô hình biếnđổi đa ma trận có độ chính xác cao hơn các mô hình hiện tại.Chương 4 đề xuất một thuật toán ước lượng mô hình biến đổi axít amin cảitiến giúp giảm 50% thời gian ước lượng mô hình. Có được điều này chính làdo thuật toán mới đã tìm cách giảm bớt số bước tối ưu cấu trúc cây phân loài– một bước chiếm nhiều thời gian trong quá trình ước lượng. Chương nàycũng giới thiệu hệ thống ước lượng mô hình tự động cài đặt thuật toán cảitiến trên.Chương 5 trình bày mô hình biến đổi axít amin cho vi rút cúm, gọi là môhình FLU. Phần sau của chương là các kết quả so sánh mô hình FLU với cácmô hình khác. Qua các thực nghiệm, mô hình FLU đã chứng tỏ được hiệuquả cao hơn hẳn các mô hình hiện tại khi phân tích dữ liệu vi rút cúm.Chương 1. BÀI TOÁN ƯỚC LƯỢNG SỰ BIẾN ĐỔI AXÍT AMIN1.1. Giới thiệu chung1.1.1. ADN và axít aminGiới thiệu về cấu tạo của ADN và axít amin. Chuỗi axít amin là một thànhphần vô cùng quan trọng cho sự sống. Prôtêin ...
Tìm kiếm theo từ khóa liên quan:
Luận án Tiến sĩ Công nghệ thông tin Xây dựng ma trận Biến đổi axít amin Mô hình biến đổi axít amin Mô hình đơn ma trận Mô hình FLUTài liệu cùng danh mục:
-
30 trang 504 0 0
-
205 trang 410 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 374 1 0 -
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 355 5 0 -
97 trang 308 0 0
-
206 trang 298 2 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 296 0 0 -
174 trang 294 0 0
-
102 trang 286 0 0
-
174 trang 275 0 0
Tài liệu mới:
-
Khảo sát tình trạng dinh dưỡng trước mổ ở người bệnh ung thư đại trực tràng
9 trang 21 0 0 -
94 trang 19 0 0
-
Tham vấn Thanh thiếu niên - ĐH Mở Bán công TP Hồ Chí Minh
276 trang 20 0 0 -
Kết hợp luân phiên sóng T và biến thiên nhịp tim trong tiên lượng bệnh nhân suy tim
10 trang 19 0 0 -
Đề thi giữa học kì 1 môn Ngữ văn lớp 9 năm 2024-2025 có đáp án - Trường THCS Nguyễn Trãi, Thanh Khê
14 trang 21 0 0 -
Đánh giá hiệu quả giải pháp phát triển thể chất cho sinh viên Trường Đại học Kiến trúc Hà Nội
8 trang 20 0 0 -
Tỉ lệ và các yếu tố liên quan đoạn chi dưới ở bệnh nhân đái tháo đường có loét chân
11 trang 20 0 0 -
39 trang 19 0 0
-
Đề thi học kì 1 môn Tiếng Anh lớp 6 năm 2024-2025 có đáp án - Trường TH&THCS Quang Trung, Hội An
6 trang 19 1 0 -
Tôm ram lá chanh vừa nhanh vừa dễRất dễ làm, nhanh gọn mà lại ngon. Nhà mình
7 trang 19 0 0