![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Luận văn: Trích chọn sự kiện y sinh phức hợp dựa vào mô hình phân tíc cây phụ thuộc trong văn bản về bệnh ung thư di truyền
Số trang: 53
Loại file: pdf
Dung lượng: 1.60 MB
Lượt xem: 9
Lượt tải: 0
Xem trước 6 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Khóa luận này đề xuất một mô hình học máy cho bài toán trích chọn sự kiện y sinh phức hợp và áp dụng vào Cancer Genetics (CG) task – một bài toán trích chọn thông tin trong BioNLP Shared Task (ST) 2013.
Nội dung trích xuất từ tài liệu:
Luận văn: Trích chọn sự kiện y sinh phức hợp dựa vào mô hình phân tíc cây phụ thuộc trong văn bản về bệnh ung thư di truyền ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phí Văn Thủy TRÍCH CHỌN SỰ KIỆN Y SINH PHỨC HỢPDỰA VÀO MÔ HÌNH PHÂN TÍCH CÂY PHỤ THUỘCTRONG VĂN BẢN VỀ BỆNH UNG THƯ DI TRUYỀN KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phí Văn Thủy TRÍCH CHỌN SỰ KIỆN Y SINH PHỨC HỢPDỰA VÀO MÔ HÌNH PHÂN TÍCH CÂY PHỤ THUỘCTRONG VĂN BẢN VỀ BỆNH UNG THƯ DI TRUYỀN KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tinCán bộ hướng dẫn: TS. Phan Xuân HiếuCán bộ đồng hướng dẫn: ThS. Trần Mai Vũ VIETNAM NATIONAL UNIVERSITY, HANOI UNIVERSITY OF ENGINEERING AND TECHNOLOGY Phi Van Thuy A COMPLEX EVENT EXTRACTION METHOD BASED ON DEPENDENCY PARSING FOR CANCER GENETICS DATASET Major: Information TechnologySupervisor: Dr. Xuan-Hieu PhanCo-Supervisor: MSc. Mai-Vu Tran HA NOI - 2013 Lời cảm ơn Trước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới Phó Giáo sưTiến sĩ Hà Quang Thụy, Tiến sĩ Phan Xuân Hiếu, và Thạc sĩ Trần Mai Vũ – nhữngngười đã tận tình chỉ bảo và hướng dẫn tôi trong quá trình thực hiện khoá luận tốtnghiệp. Tôi xin gửi lời cảm ơn chân thành tới Phó Giáo sư Tiến sĩ Nigel H. Collier,thuộc Viện Thông tin quốc gia Nhật Bản (NII), người đã tận tình hỗ trợ về kiến thứcchuyên môn, giúp đỡ tôi hoàn thành khóa luận. Tôi chân thành cảm ơn các thầy, cô và cán bộ của trường Đại Học Công Nghệđã tạo những điều kiện thuận lợi cho tôi học tập và nghiên cứu. Tôi cũng xin gửi lời cảm ơn tới các anh chị và các bạn sinh viên trong phòng thínghiệm KT-Lab đã giúp tôi rất nhiều trong việc thu thập và xử lý dữ liệu. Cuối cùng, tôi muốn gửi lời cảm ơn tới gia đình và bạn bè, những người thânyêu luôn bên cạnh, động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Tôi xin chân thành cảm ơn ! Hà Nội, ngày 15 tháng 5 năm 2013 Sinh viên Phí Văn Thủy TRÍCH CHỌN SỰ KIỆN Y SINH PHỨC HỢP DỰA VÀO MÔ HÌNH PHÂN TÍCH CÂY PHỤ THUỘC TRONG VĂN BẢN VỀ BỆNH UNG THƯ DI TRUYỀN Phí Văn Thủy Khóa QH-2009-I/CQ , ngành Công nghệ thông tinTóm tắt Khóa luận tốt nghiệp: Thuật ngữ trích chọn sự kiện y sinh học được sử dụng để đề cập đến bài toán tríchchọn sự mô tả về các hoạt động và quan hệ giữa một hoặc nhiều thực thể từ tài liệu y sinh học.Việc tự động nhận dạng bất kì đối tượng của một lớp sự kiện riêng, trích chọn các tham sốliên quan của chúng và biểu diễn thông tin được trích chọn vào một dạng có cấu trúc từ cáccông trình khoa học giúp cộng đồng nghiên cứu y sinh học nhanh chóng thu nhận được cáckết quả nghiên cứu mới nhất trong lĩnh vực liên quan mật thiết tới việc đảm bảo sức khỏe conngười. Các kết quả mới nhất cho thấy hiệu năng khi trích chọn các sự kiện phức hợp (sự kiệncó thể nhận tham số là thực thể hoặc sự kiện khác) chỉ đạt khoảng 40-50% F1 tại BioNLPShared Task 2011. Khóa luận này đề xuất một mô hình học máy cho bài toán trích chọn sựkiện y sinh phức hợp và áp dụng vào Cancer Genetics (CG) task – một bài toán trích chọnthông tin trong BioNLP Shared Task (ST) 2013. Mục đích của CG task là trích chọn thông tintự động từ các văn bản về quá trình sinh học, liên quan đến sự phát triển và tiến triển của bệnhung thư. Mô hình của chúng tôi gồm ba thành phần chính: (1) nhận diện trigger; (2) trích chọnứng viên sự kiện; (3) xếp hạng và đưa ra kết quả. Khi đánh giá trên tập dữ liệu phát triển đượccung cấp bởi BioNLP-ST 2013, với khoảng 1000 câu lấy từ PubMed, chúng tôi thu được kếtquả bước đầu khá khả quan: độ đo F1 khi trích chọn các sự kiện phức hợp đạt từ 50% đến70%. Mô hình mới phù hợp với miền dữ liệu về bệnh ung thư di truyền và cho hiệu năng tốthơn mô hình cơ sở chúng tôi đưa ra.Từ khóa: Event extraction, Dependency tree, Cancer Genetics Task. i A COMPLEX EVENT EXTRACTION METHOD BASED ON DEPENDENCY PARSING FOR CANCER GENETICS DATASET Phi Van Thuy Course: QH-2009-I/CQ , major: Information technologyAbstract: The term biomedical event extraction is used to refer to the task of extractingdescriptions of ...
Nội dung trích xuất từ tài liệu:
Luận văn: Trích chọn sự kiện y sinh phức hợp dựa vào mô hình phân tíc cây phụ thuộc trong văn bản về bệnh ung thư di truyền ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phí Văn Thủy TRÍCH CHỌN SỰ KIỆN Y SINH PHỨC HỢPDỰA VÀO MÔ HÌNH PHÂN TÍCH CÂY PHỤ THUỘCTRONG VĂN BẢN VỀ BỆNH UNG THƯ DI TRUYỀN KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phí Văn Thủy TRÍCH CHỌN SỰ KIỆN Y SINH PHỨC HỢPDỰA VÀO MÔ HÌNH PHÂN TÍCH CÂY PHỤ THUỘCTRONG VĂN BẢN VỀ BỆNH UNG THƯ DI TRUYỀN KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tinCán bộ hướng dẫn: TS. Phan Xuân HiếuCán bộ đồng hướng dẫn: ThS. Trần Mai Vũ VIETNAM NATIONAL UNIVERSITY, HANOI UNIVERSITY OF ENGINEERING AND TECHNOLOGY Phi Van Thuy A COMPLEX EVENT EXTRACTION METHOD BASED ON DEPENDENCY PARSING FOR CANCER GENETICS DATASET Major: Information TechnologySupervisor: Dr. Xuan-Hieu PhanCo-Supervisor: MSc. Mai-Vu Tran HA NOI - 2013 Lời cảm ơn Trước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới Phó Giáo sưTiến sĩ Hà Quang Thụy, Tiến sĩ Phan Xuân Hiếu, và Thạc sĩ Trần Mai Vũ – nhữngngười đã tận tình chỉ bảo và hướng dẫn tôi trong quá trình thực hiện khoá luận tốtnghiệp. Tôi xin gửi lời cảm ơn chân thành tới Phó Giáo sư Tiến sĩ Nigel H. Collier,thuộc Viện Thông tin quốc gia Nhật Bản (NII), người đã tận tình hỗ trợ về kiến thứcchuyên môn, giúp đỡ tôi hoàn thành khóa luận. Tôi chân thành cảm ơn các thầy, cô và cán bộ của trường Đại Học Công Nghệđã tạo những điều kiện thuận lợi cho tôi học tập và nghiên cứu. Tôi cũng xin gửi lời cảm ơn tới các anh chị và các bạn sinh viên trong phòng thínghiệm KT-Lab đã giúp tôi rất nhiều trong việc thu thập và xử lý dữ liệu. Cuối cùng, tôi muốn gửi lời cảm ơn tới gia đình và bạn bè, những người thânyêu luôn bên cạnh, động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Tôi xin chân thành cảm ơn ! Hà Nội, ngày 15 tháng 5 năm 2013 Sinh viên Phí Văn Thủy TRÍCH CHỌN SỰ KIỆN Y SINH PHỨC HỢP DỰA VÀO MÔ HÌNH PHÂN TÍCH CÂY PHỤ THUỘC TRONG VĂN BẢN VỀ BỆNH UNG THƯ DI TRUYỀN Phí Văn Thủy Khóa QH-2009-I/CQ , ngành Công nghệ thông tinTóm tắt Khóa luận tốt nghiệp: Thuật ngữ trích chọn sự kiện y sinh học được sử dụng để đề cập đến bài toán tríchchọn sự mô tả về các hoạt động và quan hệ giữa một hoặc nhiều thực thể từ tài liệu y sinh học.Việc tự động nhận dạng bất kì đối tượng của một lớp sự kiện riêng, trích chọn các tham sốliên quan của chúng và biểu diễn thông tin được trích chọn vào một dạng có cấu trúc từ cáccông trình khoa học giúp cộng đồng nghiên cứu y sinh học nhanh chóng thu nhận được cáckết quả nghiên cứu mới nhất trong lĩnh vực liên quan mật thiết tới việc đảm bảo sức khỏe conngười. Các kết quả mới nhất cho thấy hiệu năng khi trích chọn các sự kiện phức hợp (sự kiệncó thể nhận tham số là thực thể hoặc sự kiện khác) chỉ đạt khoảng 40-50% F1 tại BioNLPShared Task 2011. Khóa luận này đề xuất một mô hình học máy cho bài toán trích chọn sựkiện y sinh phức hợp và áp dụng vào Cancer Genetics (CG) task – một bài toán trích chọnthông tin trong BioNLP Shared Task (ST) 2013. Mục đích của CG task là trích chọn thông tintự động từ các văn bản về quá trình sinh học, liên quan đến sự phát triển và tiến triển của bệnhung thư. Mô hình của chúng tôi gồm ba thành phần chính: (1) nhận diện trigger; (2) trích chọnứng viên sự kiện; (3) xếp hạng và đưa ra kết quả. Khi đánh giá trên tập dữ liệu phát triển đượccung cấp bởi BioNLP-ST 2013, với khoảng 1000 câu lấy từ PubMed, chúng tôi thu được kếtquả bước đầu khá khả quan: độ đo F1 khi trích chọn các sự kiện phức hợp đạt từ 50% đến70%. Mô hình mới phù hợp với miền dữ liệu về bệnh ung thư di truyền và cho hiệu năng tốthơn mô hình cơ sở chúng tôi đưa ra.Từ khóa: Event extraction, Dependency tree, Cancer Genetics Task. i A COMPLEX EVENT EXTRACTION METHOD BASED ON DEPENDENCY PARSING FOR CANCER GENETICS DATASET Phi Van Thuy Course: QH-2009-I/CQ , major: Information technologyAbstract: The term biomedical event extraction is used to refer to the task of extractingdescriptions of ...
Tìm kiếm theo từ khóa liên quan:
Trích chọn thông tin Luận văn công nghệ thông tin Ung thư di truyền Y sinh phức hợp Cây phụ thuộc Trích chọn sự kiện y sinh phức hợp Tài liệu y sinh họcTài liệu liên quan:
-
Đồ án: Xây dựng wedsite quản lý điểm học sinh
21 trang 191 0 0 -
Đồ án tốt nghiệp - Phân tích thiết kế hệ thống - Phân tích thiết kế hệ thống siêu thị
140 trang 187 0 0 -
Bài tập lớn Phân tích thiết kế hệ thống thông tin: Xây dựng hệ thống bán sách online
48 trang 173 0 0 -
40 trang 157 0 0
-
Đồ án tốt nghiệp - Phân tích thiết kế hệ thống - Phần mềm Quản lý kết hôn
17 trang 155 0 0 -
Đồ án tốt nghiệp - Phân tích thiết kế hệ thống - Quản lý hồ sơ bệnh án của 1 khoa
20 trang 137 0 0 -
90 trang 100 0 0
-
138 trang 100 0 0
-
18 trang 95 0 0
-
Đồ án tốt nghiệp - Phân tích thiết kế hệ thống - QUẢN LÝ SỐ SÁCH CÔNG TY CỔ PHẦN VẬN TẢI HÀ TIÊN
106 trang 90 0 0