Luận án Tiến sĩ Kỹ thuật: Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Kỹ thuật: Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ THANH THỦYNGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC MÁY CHOTRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI – 2023 BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ THANH THỦYNGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC MÁY CHOTRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 9.48.01.04 LUẬN ÁN TIẾN SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. GS.TS. TỪ MINH PHƯƠNG 2. PGS.TS. NGÔ XUÂN BÁCH HÀ NỘI – 2023 i LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, dưới sự hướngdẫn của GS.TS. Từ Minh Phương và PGS.TS. Ngô Xuân Bách. Các kết quả được viếtchung với các tác giả khác đều được sự đồng ý của đồng tác giả trước khi đưa vàoluận án. Các kết quả nêu trong luận án là trung thực và chưa từng được công bố trongcác công trình nào khác. Hà Nội, ngày …. tháng …. năm 2023 Nghiên cứu sinh Nguyễn Thị Thanh Thủy ii LỜI CẢM ƠN Trong quá trình học tập, nghiên cứu để hoàn thành đề tài luận án “Nghiên cứucác phương pháp học máy cho trích xuất thông tin tự động từ văn bản”, ngoài sự nỗlực của cá nhân, tôi đã nhận được rất nhiều sự giúp đỡ, tạo điều kiện của các Thầyhướng dẫn, nhà trường, các nhà khoa học, đơn vị công tác và gia đình. Tôi xin bày tỏlòng biết ơn chân thành về sự giúp đỡ đó. Đầu tiên, tôi xin bày tỏ lòng biết ơn sâu sắc tới Thầy GS.TS. Từ Minh Phươngvà Thầy PGS.TS. Ngô Xuân Bách đã tận tình hướng dẫn, chỉ bảo, giúp đỡ và đồnghành cùng tôi trong suốt quá trình thực hiện nghiên cứu và hoàn thành luận án. Tôi xin trân trọng cảm ơn Lab Học máy và Ứng dụng, Khoa Quốc tế và Đàotạo Sau Đại học và Lãnh đạo Học viện Công nghệ Bưu chính Viễn thông đã tạo điềukiện thuận lợi cho tôi trong suốt quá trình thực hiện luận án. Tôi xin cảm ơn các ThầyLãnh đạo và tập thể cán bộ, giảng viên Khoa Công nghệ thông tin 1, Học viện Côngnghệ Bưu chính Viễn thông đã luôn cổ vũ, động viên tôi trong quá trình nghiên cứu. Tôi xin trân trọng cảm ơn Quỹ Đổi mới sáng tạo Vingroup (VINIF), Việnnghiên cứu VINBIGDATA, Tập đoàn Vingroup đã trao học bổng học tập cho tôitrong thời gian tôi làm nghiên cứu luận án. Tôi xin gửi lời cảm ơn chân thành tới tất cả những người bạn luôn chia sẻ vàđộng viên tôi trong những lúc khó khăn. Cuối cùng, tôi xin bày tỏ lòng biết ơn đốivới gia đình đã luôn bên cạnh ủng hộ, động viên, tạo mọi điều kiện hỗ trợ tôi. Hà Nội, ngày …. tháng …. năm 2023 Nghiên cứu sinh iii MỤC LỤCLỜI CAM ĐOAN ................................................................................................................. iLỜI CẢM ƠN ......................................................................................................................iiMỤC LỤC ...........................................................................................................................iiiDANH MỤC CÁC BẢNG................................................................................................ viDANH MỤC CÁC HÌNH VẼ ........................................................................................viiiDANH MỤC CÁC TỪ VIẾT TẮT ................................................................................. ixPHẦN MỞ ĐẦU ................................................................................................................. 1 1. TÍNH CẤP THIẾT CỦA LUẬN ÁN ..................................................................1 2. MỤC TIÊU VÀ PHẠM VI NGHIÊN CỨU LUẬN ÁN ....................................3 3. CÁC ĐÓNG GÓP CỦA LUẬN ÁN ...................................................................6 4. BỐ CỤC CỦA LUẬN ÁN ..................................................................................8CHƯƠNG 1. TỔNG QUAN VỀ TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂNBẢN .................................................................................................................................... 10 1.1. GIỚI THIỆU VỀ TRÍCH XUẤT THÔNG TIN ...........................................10 1.2. ỨNG DỤNG CỦA TRÍCH XUẤT THÔNG TIN ........................................13 1.3. CÁC PHƯƠNG PHÁP TIẾP CẬN ...............................................................15 1.3.1. Phương pháp tiếp cận dựa trên phân loại ...............................................16 1.3.2. Phương pháp tiếp cận dựa trên gán nhãn chuỗi ......................................19 1.3.3. Phương pháp tiếp cận dựa trên học sâu ..................................................22 1.3.4. Phương pháp thực hiện thực nghiệm và đánh giá kết quả ......................31 1.4. KHẢO SÁT CÁC NGHIÊN CỨU LIÊN QUAN .........................................33 1.5. KẾT LUẬN CHƯƠNG 1 ...............................................................................42CHƯƠNG 2. TRÍCH XUẤT KHÍA CẠNH VÀ PHÂN LOẠI QUAN ĐIỂM CHOTIẾNG VIỆT TẬN DỤNG NGUỒN DỮ LIỆU ĐÃ ĐƯỢC GÁN NHÃN TỪ NGÔNNGỮ KHÁC ...................................................................................................................... 44 ...
Tìm kiếm theo từ khóa liên quan:
Luận án Tiến sĩ Luận án Tiến sĩ Kỹ thuật Phương pháp học máy Trích xuất thông tin tự động Mạng nơ-ron tích chập Xử lý ngôn ngữ tự nhiênTài liệu cùng danh mục:
-
30 trang 504 0 0
-
205 trang 410 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 374 1 0 -
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 355 5 0 -
97 trang 308 0 0
-
206 trang 298 2 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 296 0 0 -
174 trang 294 0 0
-
102 trang 286 0 0
-
174 trang 275 0 0
Tài liệu mới:
-
Khảo sát tình trạng dinh dưỡng trước mổ ở người bệnh ung thư đại trực tràng
9 trang 21 0 0 -
94 trang 19 0 0
-
Tham vấn Thanh thiếu niên - ĐH Mở Bán công TP Hồ Chí Minh
276 trang 20 0 0 -
Kết hợp luân phiên sóng T và biến thiên nhịp tim trong tiên lượng bệnh nhân suy tim
10 trang 19 0 0 -
Đề thi giữa học kì 1 môn Ngữ văn lớp 9 năm 2024-2025 có đáp án - Trường THCS Nguyễn Trãi, Thanh Khê
14 trang 21 0 0 -
Đánh giá hiệu quả giải pháp phát triển thể chất cho sinh viên Trường Đại học Kiến trúc Hà Nội
8 trang 20 0 0 -
Tỉ lệ và các yếu tố liên quan đoạn chi dưới ở bệnh nhân đái tháo đường có loét chân
11 trang 20 0 0 -
39 trang 19 0 0
-
Đề thi học kì 1 môn Tiếng Anh lớp 6 năm 2024-2025 có đáp án - Trường TH&THCS Quang Trung, Hội An
6 trang 19 1 0 -
Tôm ram lá chanh vừa nhanh vừa dễRất dễ làm, nhanh gọn mà lại ngon. Nhà mình
7 trang 19 0 0