Tóm tắt Luận án Tiến sĩ Công nghệ thông tin: Học máy dựa trên đồ thị trích chọn quan hệ ngữ nghĩa
Số trang: 28
Loại file: pdf
Dung lượng: 730.92 KB
Lượt xem: 9
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận án "Học máy dựa trên đồ thị trích chọn quan hệ ngữ nghĩa" tập trung vào bài toán nhận dạng thực thể với hai loại dữ liệu thuộc hai ngôn ngữ khác nhau là các thực thể thuộc dữ liệu văn bản tiếng Việt và các thực thể thuộc dữ liệu văn bản y sinh học, nhằm đề xuất giải pháp và xây dựng thực nghiệm cho việc nhận dạng các loại thực thể thuộc hai miền dữ liệu trên. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Tiến sĩ Công nghệ thông tin: Học máy dựa trên đồ thị trích chọn quan hệ ngữ nghĩaĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆTRẦN MAI VŨHỌC MÁY DỰA TRÊN ĐỒ THỊTRÍCH CHỌN QUAN HỆ NGỮ NGHĨAChuyên ngành: Hệ thống thông tinMã số: 62.48.05.01TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TINHà Nội – 2016Công trình được hoàn thành tại: Trường Đại họ Công nghệĐại họ Quố gi H NộiNgười hướng dẫn khoa học: PGS.TS. Hà Quang ThụyPGS.TS. Nguyễn Lê MinhPhản biện:………………………………………………..Phản biện:………………………………………………..Phản biện:………………………………………………..Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốcgia chấm luận án tiến sĩ họp tạivào hồigiờng ythángnămCó thể tìm hiểu luận án tại:Thư viện Quốc gia Việt NamTrung tâm Thông tin - Thư viện Đại học Quốc gia Hà NộiDANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ CÓ LIÊNQUAN ĐẾN LUẬN ÁN[TMV1] Nigel Collier, Ferdinand Paster, Mai-Vu Tran (2014).The impact of near domain transfer on biomedical namedentity recognition. LOUHI 2014, EACL 2014, Sweden,2014.[TMV2] Nigel Collier, Mai-Vu Tran, Hoang-Quynh Le, QuangThuy Ha, Anika Oellrich, Dietrich Rebholz-Schuhmann(2013). Learning to Recognize Phenotype Candidates in theAuto-Immune Literature Using SVM Re-Ranking. PLoSONE 8(10): e72965, October 2013.[TMV3] Mai-Vu Tran, Nigel Collier, Hoang-Quynh Le, VanThuy Phi and Thanh-Binh Pham (2013). Exploing aProbabilistic Earley Parser for Event Composition inBiomedical Texts, BIONLP-ST:130-134.[TMV4] Mai-Vu Tran, Duc-Trong Le (2013). vTools: Chunkerand Part-of-Speech tools, RIVF- VLSP 2013 Workshop.[TMV5] Nigel Collier, Mai-Vu Tran, Hoang-Quynh Le, AnikaOellrich, Ai Kawazoe, Martin Hall-May, Dietrich RebholzSchuhmann (2012). A Hybrid Approach to FindingPhenotype Candidates in Genetic Texts, COLING 2012: 647662.[TMV6] Mai-Vu Tran, Duc-Trong Le, Xuan-Tu Tran and TienTung Nguyen (2012). A Model of Vietnamese PersonNamed Entity Question Answering System, PACLIC 2012,Bali, Indonesia, October 2012.i[TMV7] Mai-Vu Tran, Minh-Hoang Nguyen, Sy-Quan Nguyen,Minh-Tien Nguyen, Xuan-Hieu Phan (2012). VnLoc (2012).A Real–time News Event Extraction Framework forVietnamese, KSE2012:161-166, Da Nang, August 17-19,2012.[TMV8] Huyen-Trang Pham, Tien-Thanh Vu, Mai-Vu Tran,Quang-ThuyHa(2011).ASolutionforGroupingVietnamese Synonym Feature Words in Product Reviews.APSCC 2011: 503-508.[TMV9] Hoang-Quynh Le, Mai-Vu Tran, Nhat-Nam Bui,Nguyen-Cuong Phan, Quang-Thuy Ha (2011). An IntegratedApproach Using Conditional Random Fieldsfor NamedEntity Recognition and Person Property Extraction inVietnamese Text. IALP 2011:115-118.[TMV10] Mai-Vu Tran, Tien-Tung Nguyen, Thanh-Son Nguyen,Hoang-Quynh Le (2010). Automatic Named Entity SetExpansion Using Semantic Rules and Wrappers for UnaryRelations. IALP 2010: 170-173.[TMV11] Mai-Vu Tran, Xuan-Tu Tran, Huy-Long Uong (2010).User Interest Analysis with Hidden Topic in NewsRecommendation System. IALP 2010: 211-214.[TMV12] Hoang-Quynh Le, Mai-Vu Tran, Thanh Hai Dang,Nigel Collier (2015). The UET-CAM System in theBioCreAtIvE V CDR Task.In Proceedings of the fifthBioCreative challenge evaluation workshop, Sevilla, Spain.iiMỞ ĐẦULý do chọn đề tàiNhận dạng thực thể (Named entity recognition; NER) là mộtbài toán chính thuộ lĩnh vực xử lý ngôn ngữ tự nhiên (NLP). Đây lmột bài toán tiền đề cho các hệ thống về hiểu ngôn ngữ hay khai phávăn bản như hệ thống trích xuất sự kiện, hệ thống hỏi đáp tự động, hệthống tìm kiếm ngữ nghĩ . Chính vì vậy, cùng với sự phát triển củadữ liệu văn bản trên Internet b i toán n y ũng nhận được sự quantâm của cộng đồng nghiên cứu trong khoảng 20 năm trở lại đây.Mặ dù đã ó khá nhiều công trình nghiên cứu tuy nhiên hầuhết các nghiên cứu này đều tập trung cho một số loại thực thể thôngthường trong văn bản tiếng Anh chuẩn. Những nghiên cứu liên quanđến các thực thể trong ngôn ngữ khá như tiếng Việt hay các miền dữliệu đặc biệt như miền dữ liệu y sinh vẫn còn rất nhiều hạn chế vàthách thức. Có thể kể đến là sự khuyết thiếu các tập dữ liệu gán nhãnchuẩn, tài nguyên ngôn ngữ về tri thức miền h y á định nghĩ hìnhthức về kiểu thực thể cần nhận dạng… Luận án này sẽ tiếp nối nhữngnghiên cứu trướ đó nhằm giải quyết một phần những hạn chế đượcnêu ra ở trên.Mục tiêu cụ thể và phạm vi nghiên cứu của luận ánLuận án sẽ tập trung vào bài toán nhận dạng thực thể với hailoại dữ liệu thuộc hai ngôn ngữ khác nhau là các thực thể thuộc dữliệu văn bản tiếng Việt và các thực thể thuộc dữ liệu văn bản y sinhhọc.1 ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Tiến sĩ Công nghệ thông tin: Học máy dựa trên đồ thị trích chọn quan hệ ngữ nghĩaĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆTRẦN MAI VŨHỌC MÁY DỰA TRÊN ĐỒ THỊTRÍCH CHỌN QUAN HỆ NGỮ NGHĨAChuyên ngành: Hệ thống thông tinMã số: 62.48.05.01TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TINHà Nội – 2016Công trình được hoàn thành tại: Trường Đại họ Công nghệĐại họ Quố gi H NộiNgười hướng dẫn khoa học: PGS.TS. Hà Quang ThụyPGS.TS. Nguyễn Lê MinhPhản biện:………………………………………………..Phản biện:………………………………………………..Phản biện:………………………………………………..Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốcgia chấm luận án tiến sĩ họp tạivào hồigiờng ythángnămCó thể tìm hiểu luận án tại:Thư viện Quốc gia Việt NamTrung tâm Thông tin - Thư viện Đại học Quốc gia Hà NộiDANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ CÓ LIÊNQUAN ĐẾN LUẬN ÁN[TMV1] Nigel Collier, Ferdinand Paster, Mai-Vu Tran (2014).The impact of near domain transfer on biomedical namedentity recognition. LOUHI 2014, EACL 2014, Sweden,2014.[TMV2] Nigel Collier, Mai-Vu Tran, Hoang-Quynh Le, QuangThuy Ha, Anika Oellrich, Dietrich Rebholz-Schuhmann(2013). Learning to Recognize Phenotype Candidates in theAuto-Immune Literature Using SVM Re-Ranking. PLoSONE 8(10): e72965, October 2013.[TMV3] Mai-Vu Tran, Nigel Collier, Hoang-Quynh Le, VanThuy Phi and Thanh-Binh Pham (2013). Exploing aProbabilistic Earley Parser for Event Composition inBiomedical Texts, BIONLP-ST:130-134.[TMV4] Mai-Vu Tran, Duc-Trong Le (2013). vTools: Chunkerand Part-of-Speech tools, RIVF- VLSP 2013 Workshop.[TMV5] Nigel Collier, Mai-Vu Tran, Hoang-Quynh Le, AnikaOellrich, Ai Kawazoe, Martin Hall-May, Dietrich RebholzSchuhmann (2012). A Hybrid Approach to FindingPhenotype Candidates in Genetic Texts, COLING 2012: 647662.[TMV6] Mai-Vu Tran, Duc-Trong Le, Xuan-Tu Tran and TienTung Nguyen (2012). A Model of Vietnamese PersonNamed Entity Question Answering System, PACLIC 2012,Bali, Indonesia, October 2012.i[TMV7] Mai-Vu Tran, Minh-Hoang Nguyen, Sy-Quan Nguyen,Minh-Tien Nguyen, Xuan-Hieu Phan (2012). VnLoc (2012).A Real–time News Event Extraction Framework forVietnamese, KSE2012:161-166, Da Nang, August 17-19,2012.[TMV8] Huyen-Trang Pham, Tien-Thanh Vu, Mai-Vu Tran,Quang-ThuyHa(2011).ASolutionforGroupingVietnamese Synonym Feature Words in Product Reviews.APSCC 2011: 503-508.[TMV9] Hoang-Quynh Le, Mai-Vu Tran, Nhat-Nam Bui,Nguyen-Cuong Phan, Quang-Thuy Ha (2011). An IntegratedApproach Using Conditional Random Fieldsfor NamedEntity Recognition and Person Property Extraction inVietnamese Text. IALP 2011:115-118.[TMV10] Mai-Vu Tran, Tien-Tung Nguyen, Thanh-Son Nguyen,Hoang-Quynh Le (2010). Automatic Named Entity SetExpansion Using Semantic Rules and Wrappers for UnaryRelations. IALP 2010: 170-173.[TMV11] Mai-Vu Tran, Xuan-Tu Tran, Huy-Long Uong (2010).User Interest Analysis with Hidden Topic in NewsRecommendation System. IALP 2010: 211-214.[TMV12] Hoang-Quynh Le, Mai-Vu Tran, Thanh Hai Dang,Nigel Collier (2015). The UET-CAM System in theBioCreAtIvE V CDR Task.In Proceedings of the fifthBioCreative challenge evaluation workshop, Sevilla, Spain.iiMỞ ĐẦULý do chọn đề tàiNhận dạng thực thể (Named entity recognition; NER) là mộtbài toán chính thuộ lĩnh vực xử lý ngôn ngữ tự nhiên (NLP). Đây lmột bài toán tiền đề cho các hệ thống về hiểu ngôn ngữ hay khai phávăn bản như hệ thống trích xuất sự kiện, hệ thống hỏi đáp tự động, hệthống tìm kiếm ngữ nghĩ . Chính vì vậy, cùng với sự phát triển củadữ liệu văn bản trên Internet b i toán n y ũng nhận được sự quantâm của cộng đồng nghiên cứu trong khoảng 20 năm trở lại đây.Mặ dù đã ó khá nhiều công trình nghiên cứu tuy nhiên hầuhết các nghiên cứu này đều tập trung cho một số loại thực thể thôngthường trong văn bản tiếng Anh chuẩn. Những nghiên cứu liên quanđến các thực thể trong ngôn ngữ khá như tiếng Việt hay các miền dữliệu đặc biệt như miền dữ liệu y sinh vẫn còn rất nhiều hạn chế vàthách thức. Có thể kể đến là sự khuyết thiếu các tập dữ liệu gán nhãnchuẩn, tài nguyên ngôn ngữ về tri thức miền h y á định nghĩ hìnhthức về kiểu thực thể cần nhận dạng… Luận án này sẽ tiếp nối nhữngnghiên cứu trướ đó nhằm giải quyết một phần những hạn chế đượcnêu ra ở trên.Mục tiêu cụ thể và phạm vi nghiên cứu của luận ánLuận án sẽ tập trung vào bài toán nhận dạng thực thể với hailoại dữ liệu thuộc hai ngôn ngữ khác nhau là các thực thể thuộc dữliệu văn bản tiếng Việt và các thực thể thuộc dữ liệu văn bản y sinhhọc.1 ...
Tìm kiếm theo từ khóa liên quan:
Tóm tắt Luận án Tiến sĩ Luận án Tiến sĩ Công nghệ thông tin Luận án Tiến sĩ Luận án Tiến sĩ ngành Hệ thống thông tin Bài toán nhận dạng thực thể Dữ liệu văn bản tiếng Việt Dữ liệu văn bản y sinh họcGợi ý tài liệu liên quan:
-
205 trang 411 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 375 1 0 -
206 trang 298 2 0
-
174 trang 296 0 0
-
228 trang 258 0 0
-
Tóm tắt Luận án Tiến sĩ Quản lý công: Quản lý nhà nước về thú y trên địa bàn thành phố Hà Nội
25 trang 225 0 0 -
70 trang 217 0 0
-
32 trang 210 0 0
-
Luận án tiến sĩ Ngữ văn: Dấu ấn tư duy đồng dao trong thơ thiếu nhi Việt Nam từ 1945 đến nay
193 trang 207 0 0 -
208 trang 195 0 0