Danh mục

Luận án Tiến sĩ Kỹ thuật: Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản

Số trang: 158      Loại file: pdf      Dung lượng: 2.74 MB      Lượt xem: 14      Lượt tải: 0    
Thu Hiền

Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án Tiến sĩ Kỹ thuật "Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản" trình bày các nội dung chính sau: Tổng quan về trích xuất thông tin tự động từ văn bản; Trích xuất khía cạnh và phân loại quan điểm cho tiếng Việt tận dụng nguồn dữ liệu đã được gán nhãn từ ngôn ngữ khác; Trích xuất thực thể và quan hệ trong văn bản pháp quy tiếng Việt sử dụng học máy truyền thống và học sâu.
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Kỹ thuật: Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ THANH THỦYNGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC MÁY CHOTRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI – 2023 BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ THANH THỦYNGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC MÁY CHOTRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 9.48.01.04 LUẬN ÁN TIẾN SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. GS.TS. TỪ MINH PHƯƠNG 2. PGS.TS. NGÔ XUÂN BÁCH HÀ NỘI – 2023 i LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, dưới sự hướngdẫn của GS.TS. Từ Minh Phương và PGS.TS. Ngô Xuân Bách. Các kết quả được viếtchung với các tác giả khác đều được sự đồng ý của đồng tác giả trước khi đưa vàoluận án. Các kết quả nêu trong luận án là trung thực và chưa từng được công bố trongcác công trình nào khác. Hà Nội, ngày …. tháng …. năm 2023 Nghiên cứu sinh Nguyễn Thị Thanh Thủy ii LỜI CẢM ƠN Trong quá trình học tập, nghiên cứu để hoàn thành đề tài luận án “Nghiên cứucác phương pháp học máy cho trích xuất thông tin tự động từ văn bản”, ngoài sự nỗlực của cá nhân, tôi đã nhận được rất nhiều sự giúp đỡ, tạo điều kiện của các Thầyhướng dẫn, nhà trường, các nhà khoa học, đơn vị công tác và gia đình. Tôi xin bày tỏlòng biết ơn chân thành về sự giúp đỡ đó. Đầu tiên, tôi xin bày tỏ lòng biết ơn sâu sắc tới Thầy GS.TS. Từ Minh Phươngvà Thầy PGS.TS. Ngô Xuân Bách đã tận tình hướng dẫn, chỉ bảo, giúp đỡ và đồnghành cùng tôi trong suốt quá trình thực hiện nghiên cứu và hoàn thành luận án. Tôi xin trân trọng cảm ơn Lab Học máy và Ứng dụng, Khoa Quốc tế và Đàotạo Sau Đại học và Lãnh đạo Học viện Công nghệ Bưu chính Viễn thông đã tạo điềukiện thuận lợi cho tôi trong suốt quá trình thực hiện luận án. Tôi xin cảm ơn các ThầyLãnh đạo và tập thể cán bộ, giảng viên Khoa Công nghệ thông tin 1, Học viện Côngnghệ Bưu chính Viễn thông đã luôn cổ vũ, động viên tôi trong quá trình nghiên cứu. Tôi xin trân trọng cảm ơn Quỹ Đổi mới sáng tạo Vingroup (VINIF), Việnnghiên cứu VINBIGDATA, Tập đoàn Vingroup đã trao học bổng học tập cho tôitrong thời gian tôi làm nghiên cứu luận án. Tôi xin gửi lời cảm ơn chân thành tới tất cả những người bạn luôn chia sẻ vàđộng viên tôi trong những lúc khó khăn. Cuối cùng, tôi xin bày tỏ lòng biết ơn đốivới gia đình đã luôn bên cạnh ủng hộ, động viên, tạo mọi điều kiện hỗ trợ tôi. Hà Nội, ngày …. tháng …. năm 2023 Nghiên cứu sinh iii MỤC LỤCLỜI CAM ĐOAN ................................................................................................................. iLỜI CẢM ƠN ......................................................................................................................iiMỤC LỤC ...........................................................................................................................iiiDANH MỤC CÁC BẢNG................................................................................................ viDANH MỤC CÁC HÌNH VẼ ........................................................................................viiiDANH MỤC CÁC TỪ VIẾT TẮT ................................................................................. ixPHẦN MỞ ĐẦU ................................................................................................................. 1 1. TÍNH CẤP THIẾT CỦA LUẬN ÁN ..................................................................1 2. MỤC TIÊU VÀ PHẠM VI NGHIÊN CỨU LUẬN ÁN ....................................3 3. CÁC ĐÓNG GÓP CỦA LUẬN ÁN ...................................................................6 4. BỐ CỤC CỦA LUẬN ÁN ..................................................................................8CHƯƠNG 1. TỔNG QUAN VỀ TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂNBẢN .................................................................................................................................... 10 1.1. GIỚI THIỆU VỀ TRÍCH XUẤT THÔNG TIN ...........................................10 1.2. ỨNG DỤNG CỦA TRÍCH XUẤT THÔNG TIN ........................................13 1.3. CÁC PHƯƠNG PHÁP TIẾP CẬN ...............................................................15 1.3.1. Phương pháp tiếp cận dựa trên phân loại ...............................................16 1.3.2. Phương pháp tiếp cận dựa trên gán nhãn chuỗi ......................................19 1.3.3. Phương pháp tiếp cận dựa trên học sâu ..................................................22 1.3.4. Phương pháp thực hiện thực nghiệm và đánh giá kết quả ......................31 1.4. KHẢO SÁT CÁC NGHIÊN CỨU LIÊN QUAN .........................................33 1.5. KẾT LUẬN CHƯƠNG 1 ...............................................................................42CHƯƠNG 2. TRÍCH XUẤT KHÍA CẠNH VÀ PHÂN LOẠI QUAN ĐIỂM CHOTIẾNG VIỆT TẬN DỤNG NGUỒN DỮ LIỆU ĐÃ ĐƯỢC GÁN NHÃN TỪ NGÔNNGỮ KHÁC ...................................................................................................................... 44 ...

Tài liệu được xem nhiều:

Tài liệu cùng danh mục:

Tài liệu mới: