Danh mục

Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng

Số trang: 49      Loại file: pdf      Dung lượng: 1.14 MB      Lượt xem: 7      Lượt tải: 0    
Hoai.2512

Xem trước 5 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu của đề tài là nghiên cứu giải quyết bài toán sinh từ khoá theo phương pháp chính là: Đồ thị web. Qua thực nghiệm cho thấy các hướng tiếp cận này là khả quan và có triển vọng với độ chính xác khá tốt, nếu kết hợp với các từ khoá của chính các chuyên gia thì tập từ khoá sinh ra là khá đầy đủ và chính xác.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụngĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VŨ CHI LOANNGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT TỪ KHOÁTỪ TRANG WEB VÀ ỨNG DỤNGLUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TINHÀ NỘI - 2017ĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VŨ CHI LOANNGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT TỪ KHOÁTỪ TRANG WEB VÀ ỨNG DỤNGChuyên ngành: Kỹ thuật phần mềmMã số: 60480103LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TINNgười hướng dẫn khoa học: T.S. NGUYỄN VĂN VINHHÀ NỘI - 2017LỜI CAM ÐOANTôi xin cam đoan đây là công trình nghiên cứu của bản thân. Các sốliệu, kết qủa trình bày trong luận văn này là trung thực. Những tư liệu được sửdụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ.Học ViênNguyễn Vũ Chi LoaniLỜI CẢM ƠNTrước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc đến T.S. NguyễnVăn Vinh, người đã tận tình chỉ bảo hướng dẫn tôi trong suốt quá trình thựchiện luận văn này.Tôi xin bày tỏ lời cảm ơn sâu sắc đến các thầy cô giáo đã giảng dạy tôitrong suốt hai năm học qua, đã cho tôi nhiều kiến thức quý báu để tôi vữngbước trên con đường học tập của mình.Tôi xin gửi lời cảm ơn tới các bạn trong khoá K21- ngành Công nghệthông tin đã ủng hộ khuyến khích tôi trong suốt quá trình học tập tại trường.Và cuối cùng, tôi xin bày tỏ niềm biết ơn vô hạn tới gia đình và nhữngngười bạn thân luôn bên cạnh, động viên tôi trong suốt quá trình thực hiệnluận văn tốt nghiệp.Hà Nội, ngày 12 tháng 04 năm 2017Học ViênNguyễn Vũ Chi LoaniiTÓM TẮT NỘI DUNGTrích rút từ khoá từ trang web là một bài toán hay của h ệ t h ố n gbài toán trích rút từ khoá cho một văn bản. Ở mức cao hơn, nó là một bài toáncon trong hệ thống trích xuất thông tin (Information Retrieval). Trong nhiềunăm qua, bài toán này đã được đề cập, quan tâm nhiều ở các hội nghị quốc tếvà các công ty lớn. Bài toán trích rút từ khoá từ trang web là việc trích rút từkhóa trong văn bản nội dung trang web. Đây cũng là vấn đề khá mới mẻ vàđược áp dụng trong rất nhiều lĩnh vực khác nhau như: Hỗ trợ tìm kiếm, hỗ trợgợi ý người dùng....Trong luận văn này, tác giả đã nghiên cứu các phương pháp trích rút từkhoá từ trang web và tập trung chủ yếu vào phương pháp TextRank. Ngoài ra,cũng tìm hiểu về các phương pháp trích rút từ khoá khác nhằm nâng cao chấtlượng từ khoá. Luận văn đã áp dụng trên một số miền dữ liệu cụ thể của cáctrang web tiếng Anh và cho kết quả khả quan.iii

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: