Danh mục

Luận án Tiến sĩ: Nghiên cứu, phát triển một số phương pháp tóm tắt văn bản sử dụng kĩ thuật học sâu

Số trang: 181      Loại file: pdf      Dung lượng: 6.12 MB      Lượt xem: 11      Lượt tải: 0    
10.10.2023

Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án Tiến sĩ "Nghiên cứu, phát triển một số phương pháp tóm tắt văn bản sử dụng kĩ thuật học sâu" trình bày các nội dung chính sau: Tổng quan về tóm tắt văn bản; Các kiến thức nền tảng; Phát triển các phương pháp tóm tắt đơn văn bản hướng trích rút; Phát triển phương pháp tóm tắt đơn văn bản hướng tóm lược; Phát triển các phương pháp tóm tắt đa văn bản.


Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ: Nghiên cứu, phát triển một số phương pháp tóm tắt văn bản sử dụng kĩ thuật học sâu LỜI CAM ĐOAN Tôi tên là Lưu Minh Tuấn, xin cam đoan đây là công trình nghiên cứu của bảnthân nghiên cứu sinh trong thời gian học tập và nghiên cứu dưới sự hướng dẫn củangười hướng dẫn khoa học. Các kết quả nghiên cứu trình bày trong luận án là trungthực, chính xác và chưa từng được công bố trong bất kỳ công trình nào khác. Cáckết quả nghiên cứu viết chung với các tác giả khác đều được sự đồng ý của đồng tácgiả trước khi đưa vào luận án. Các kết quả sử dụng để tham khảo đều được trích dẫnđầy đủ và theo đúng quy định. Hà Nội, ngày tháng năm 2022 Nghiên cứu sinh Lưu Minh Tuấn NGƯỜI HƯỚNG DẪN KHOA HỌC LỜI CẢM ƠN Trong quá trình học tập và nghiên cứu, nghiên cứu sinh đã nhận được nhiều sựgiúp đỡ và ý kiến đóng góp quý báu của các thầy cô. Lời đầu tiên, nghiên cứu sinhxin được bày tỏ lòng kính trọng và biết ơn sâu sắc tới PGS. TS. Lê Thanh Hương -người hướng dẫn khoa học đã tận tình chỉ bảo, hướng dẫn để nghiên cứu sinh có thểhoàn thành được luận án này. Nghiên cứu sinh xin gửi lời cảm ơn chân thành tớiPGS. TS. Nguyễn Bình Minh về những ý kiến đóng góp quý báu trong những buổixê mi na khoa học nhiều gian nan trong suốt thời gian nghiên cứu và hoàn thànhluận án. Nghiên cứu sinh xin gửi lời cảm ơn đến các thầy cô của Bộ môn Hệ thốngthông tin, Viện Công nghệ thông tin và truyền thông, Phòng đào tạo, Trường Đạihọc Bách khoa Hà Nội, nơi nghiên cứu sinh học tập và nghiên cứu đã tạo điều kiệntốt nhất có thể cho nghiên cứu sinh trong suốt thời gian học tập và nghiên cứu đểnghiên cứu sinh có thể hoàn thành luận án tiến sĩ một cách tốt nhất. Xin cảm ơn Bangiám hiệu Trường Đại học Kinh tế Quốc dân, Ban Lãnh đạo Viện Công nghệ thôngtin và Kinh tế số, các thầy cô Bộ môn Công nghệ thông tin - nơi nghiên cứu sinhcông tác và các đồng nghiệp đã luôn quan tâm giúp đỡ, tạo điều kiện tốt nhất đểnghiên cứu sinh có thể hoàn thành tốt kế hoạch học tập và nghiên cứu của mình. Lờicuối, nghiên cứu sinh xin chân thành cảm ơn các thành viên trong gia đình, ngườithân, bạn bè đã dành cho nghiên cứu sinh những tình cảm tốt đẹp, luôn động viên,giúp đỡ nghiên cứu sinh vượt qua những khó khăn trong quá trình học tập và nghiêncứu để đạt được kết quả như ngày hôm nay. Đây cũng là món quà tinh thần mànghiên cứu sinh trân trọng gửi tặng đến các thành viên trong gia đình và người thân. Một lần nữa nghiên cứu sinh xin chân thành cảm ơn! MỤC LỤCDANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ............................................ ivDANH MỤC CÁC BẢNG....................................................................................... viDANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ................................................................ ixDANH MỤC KÝ HIỆU TOÁN HỌC .................................................................... xiMỞ ĐẦU .................................................................................................................... 1Chương 1. TỔNG QUAN VỀ TÓM TẮT VĂN BẢN ......................................... 11 1.1. Giới thiệu về tóm tắt văn bản .............................................................. 11 1.1.1. Giới thiệu bài toán tóm tắt văn bản .................................................. 11 1.1.2. Phân loại bài toán tóm tắt văn bản ................................................... 12 1.1.3. Các bước thực hiện trong tóm tắt văn bản ....................................... 13 1.1.4. Một số đặc trưng của văn bản .......................................................... 13 1.2. Một số phương pháp đánh giá văn bản tóm tắt tự động ................... 14 1.2.1. Phương pháp dựa trên độ tương tự về nội dung .............................. 14 1.2.2. Phương pháp dựa trên độ tương quan phù hợp ................................ 14 1.2.3. Phương pháp ROUGE ..................................................................... 15 1.3. Các phương pháp kết hợp văn bản trong tóm tắt đa văn bản ......... 18 1.4. Các phương pháp tóm tắt văn bản hướng trích rút cơ sở ................ 20 1.4.1. PageRank ......................................................................................... 20 1.4.2. TextRank .......................................................................................... 20 1.4.3. LexRank ........................................................................................... 20 1.4.4. Lead-Based ....................................................... ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: