Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng
Số trang: 49
Loại file: pdf
Dung lượng: 1.14 MB
Lượt xem: 7
Lượt tải: 0
Xem trước 5 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu của đề tài là nghiên cứu giải quyết bài toán sinh từ khoá theo phương pháp chính là: Đồ thị web. Qua thực nghiệm cho thấy các hướng tiếp cận này là khả quan và có triển vọng với độ chính xác khá tốt, nếu kết hợp với các từ khoá của chính các chuyên gia thì tập từ khoá sinh ra là khá đầy đủ và chính xác.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụngĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VŨ CHI LOANNGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT TỪ KHOÁTỪ TRANG WEB VÀ ỨNG DỤNGLUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TINHÀ NỘI - 2017ĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VŨ CHI LOANNGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT TỪ KHOÁTỪ TRANG WEB VÀ ỨNG DỤNGChuyên ngành: Kỹ thuật phần mềmMã số: 60480103LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TINNgười hướng dẫn khoa học: T.S. NGUYỄN VĂN VINHHÀ NỘI - 2017LỜI CAM ÐOANTôi xin cam đoan đây là công trình nghiên cứu của bản thân. Các sốliệu, kết qủa trình bày trong luận văn này là trung thực. Những tư liệu được sửdụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ.Học ViênNguyễn Vũ Chi LoaniLỜI CẢM ƠNTrước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc đến T.S. NguyễnVăn Vinh, người đã tận tình chỉ bảo hướng dẫn tôi trong suốt quá trình thựchiện luận văn này.Tôi xin bày tỏ lời cảm ơn sâu sắc đến các thầy cô giáo đã giảng dạy tôitrong suốt hai năm học qua, đã cho tôi nhiều kiến thức quý báu để tôi vữngbước trên con đường học tập của mình.Tôi xin gửi lời cảm ơn tới các bạn trong khoá K21- ngành Công nghệthông tin đã ủng hộ khuyến khích tôi trong suốt quá trình học tập tại trường.Và cuối cùng, tôi xin bày tỏ niềm biết ơn vô hạn tới gia đình và nhữngngười bạn thân luôn bên cạnh, động viên tôi trong suốt quá trình thực hiệnluận văn tốt nghiệp.Hà Nội, ngày 12 tháng 04 năm 2017Học ViênNguyễn Vũ Chi LoaniiTÓM TẮT NỘI DUNGTrích rút từ khoá từ trang web là một bài toán hay của h ệ t h ố n gbài toán trích rút từ khoá cho một văn bản. Ở mức cao hơn, nó là một bài toáncon trong hệ thống trích xuất thông tin (Information Retrieval). Trong nhiềunăm qua, bài toán này đã được đề cập, quan tâm nhiều ở các hội nghị quốc tếvà các công ty lớn. Bài toán trích rút từ khoá từ trang web là việc trích rút từkhóa trong văn bản nội dung trang web. Đây cũng là vấn đề khá mới mẻ vàđược áp dụng trong rất nhiều lĩnh vực khác nhau như: Hỗ trợ tìm kiếm, hỗ trợgợi ý người dùng....Trong luận văn này, tác giả đã nghiên cứu các phương pháp trích rút từkhoá từ trang web và tập trung chủ yếu vào phương pháp TextRank. Ngoài ra,cũng tìm hiểu về các phương pháp trích rút từ khoá khác nhằm nâng cao chấtlượng từ khoá. Luận văn đã áp dụng trên một số miền dữ liệu cụ thể của cáctrang web tiếng Anh và cho kết quả khả quan.iii
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụngĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VŨ CHI LOANNGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT TỪ KHOÁTỪ TRANG WEB VÀ ỨNG DỤNGLUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TINHÀ NỘI - 2017ĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VŨ CHI LOANNGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT TỪ KHOÁTỪ TRANG WEB VÀ ỨNG DỤNGChuyên ngành: Kỹ thuật phần mềmMã số: 60480103LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TINNgười hướng dẫn khoa học: T.S. NGUYỄN VĂN VINHHÀ NỘI - 2017LỜI CAM ÐOANTôi xin cam đoan đây là công trình nghiên cứu của bản thân. Các sốliệu, kết qủa trình bày trong luận văn này là trung thực. Những tư liệu được sửdụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ.Học ViênNguyễn Vũ Chi LoaniLỜI CẢM ƠNTrước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc đến T.S. NguyễnVăn Vinh, người đã tận tình chỉ bảo hướng dẫn tôi trong suốt quá trình thựchiện luận văn này.Tôi xin bày tỏ lời cảm ơn sâu sắc đến các thầy cô giáo đã giảng dạy tôitrong suốt hai năm học qua, đã cho tôi nhiều kiến thức quý báu để tôi vữngbước trên con đường học tập của mình.Tôi xin gửi lời cảm ơn tới các bạn trong khoá K21- ngành Công nghệthông tin đã ủng hộ khuyến khích tôi trong suốt quá trình học tập tại trường.Và cuối cùng, tôi xin bày tỏ niềm biết ơn vô hạn tới gia đình và nhữngngười bạn thân luôn bên cạnh, động viên tôi trong suốt quá trình thực hiệnluận văn tốt nghiệp.Hà Nội, ngày 12 tháng 04 năm 2017Học ViênNguyễn Vũ Chi LoaniiTÓM TẮT NỘI DUNGTrích rút từ khoá từ trang web là một bài toán hay của h ệ t h ố n gbài toán trích rút từ khoá cho một văn bản. Ở mức cao hơn, nó là một bài toáncon trong hệ thống trích xuất thông tin (Information Retrieval). Trong nhiềunăm qua, bài toán này đã được đề cập, quan tâm nhiều ở các hội nghị quốc tếvà các công ty lớn. Bài toán trích rút từ khoá từ trang web là việc trích rút từkhóa trong văn bản nội dung trang web. Đây cũng là vấn đề khá mới mẻ vàđược áp dụng trong rất nhiều lĩnh vực khác nhau như: Hỗ trợ tìm kiếm, hỗ trợgợi ý người dùng....Trong luận văn này, tác giả đã nghiên cứu các phương pháp trích rút từkhoá từ trang web và tập trung chủ yếu vào phương pháp TextRank. Ngoài ra,cũng tìm hiểu về các phương pháp trích rút từ khoá khác nhằm nâng cao chấtlượng từ khoá. Luận văn đã áp dụng trên một số miền dữ liệu cụ thể của cáctrang web tiếng Anh và cho kết quả khả quan.iii
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Công nghệ thông tin Phương pháp trích rút từ khoá Tìm từ khía từ web và ứng dụng Đồ thị webGợi ý tài liệu liên quan:
-
52 trang 426 1 0
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 363 5 0 -
97 trang 324 0 0
-
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 309 0 0 -
97 trang 300 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 299 0 0 -
74 trang 293 0 0
-
96 trang 289 0 0
-
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 288 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 276 0 0