![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Luận án tiến sĩ Kỹ thuật: Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt
Số trang: 142
Loại file: pdf
Dung lượng: 2.67 MB
Lượt xem: 10
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu của đề tài là hệ thống hoá và phân tích đầy đủ các vấn đề liên quan đến phân loại văn bản gồm: các mô hình phân loại, các phương pháp, kỹ thuật học có giám sát, học không có giám sát, học bán giám sát và học tăng cường; Đề xuất được các giải pháp nhằm cải tiến phương pháp phân loại văn bản tiếng Việt để cải thiện chất lượng phân loại cả về kết quả lẫn tốc độ xử lý;
Nội dung trích xuất từ tài liệu:
Luận án tiến sĩ Kỹ thuật: Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG VÕ DUY THANHNGHIÊN CỨU ỨNG DỤNG KỸ THUẬTHỌC BÁN GIÁM SÁT VÀO LĨNH VỰC PHÂN LOẠI VĂN BẢN TIẾNG VIỆT LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng - 2017 i BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG VÕ DUY THANHNGHIÊN CỨU ỨNG DỤNG KỸ THUẬTHỌC BÁN GIÁM SÁT VÀO LĨNH VỰC PHÂN LOẠI VĂN BẢN TIẾNG VIỆT Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62 48 01 01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Người hướng dẫn khoa học: 1. PGS.TS. Võ Trung Hùng 2. PGS.TS. Đoàn Văn Ban Đà Nẵng - 2017 ii LỜI CAM ĐOAN Tôi tên là Võ Duy Thanh. Tôi xin cam đoan đây là công trình nghiên cứu dotôi thực hiện. Các nội dung và kết quả nghiên cứu được trình bày trong Luận án làtrung thực và chưa được công bố bởi bất kỳ tác giả nào hay trong bất kỳ công trìnhkhoa học nào khác. Tác giả Luận án Võ Duy Thanh i MỤC LỤCLỜI CAM ĐOAN ................................................................................................... iMỤC LỤC .............................................................................................................. iiDANH MỤC CÁC TỪ VIẾT TẮT ..................................................................... viDANH MỤC HÌNH VẼ....................................................................................... viiDANH MỤC BẢNG ............................................................................................. ixMỞ ĐẦU ................................................................................................................. 1Chương 1. NGHIÊN CỨU TỔNG QUAN .......................................................... 91.1. Học máy ............................................................................................................ 9 1.1.1. Khái niệm ............................................................................................. 9 1.1.2. Ứng dụng của học máy ........................................................................ 9 1.1.3. Các dạng dữ liệu trong học máy ........................................................ 111.2. Các phương pháp học máy .............................................................................. 13 1.2.1. Học có giám sát .................................................................................. 13 1.2.2. Học không giám sát ........................................................................... 15 1.2.3. Học bán giám sát ................................................................................ 16 1.2.4. Học tăng cường .................................................................................. 16 1.2.5. Học sâu............................................................................................... 171.3. Tổng quan về học bán giám sát ....................................................................... 21 1.3.1. Một số phương pháp học bán giám sát .............................................. 23 1.3.2. Thuật toán học có giám sát SVM và bán giám sát SVM ................... 34 1.3.3. Huấn luyện SVM ............................................................................... 38 1.3.4. SVM trong phân lớp văn bản ............................................................. 39 1.3.5. Bán giám sát SVM và phân lớp trang Web ....................................... 40 ii 1.3.6. Thuật toán phân lớp văn bản điển hình .............................................. 411.4. Phân loại văn bản ............................................................................................ 43 1.4.1. Văn bản .............................................................................................. 43 1.4.2. Biểu diễn văn bản bằng véc tơ ........................................................... 44 1.4.3. Phân loại văn bản ............................................................................... 461.5. Đề xuất nghiên cứu ......................................................................................... 491.6. Tiểu kết chương .............................................................................................. 51Chương 2. XÂY DỰNG KHO DỮ LIỆU.......................................................... 532.1. Giới thiệu kho dữ liệu phân ...
Nội dung trích xuất từ tài liệu:
Luận án tiến sĩ Kỹ thuật: Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG VÕ DUY THANHNGHIÊN CỨU ỨNG DỤNG KỸ THUẬTHỌC BÁN GIÁM SÁT VÀO LĨNH VỰC PHÂN LOẠI VĂN BẢN TIẾNG VIỆT LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng - 2017 i BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG VÕ DUY THANHNGHIÊN CỨU ỨNG DỤNG KỸ THUẬTHỌC BÁN GIÁM SÁT VÀO LĨNH VỰC PHÂN LOẠI VĂN BẢN TIẾNG VIỆT Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62 48 01 01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Người hướng dẫn khoa học: 1. PGS.TS. Võ Trung Hùng 2. PGS.TS. Đoàn Văn Ban Đà Nẵng - 2017 ii LỜI CAM ĐOAN Tôi tên là Võ Duy Thanh. Tôi xin cam đoan đây là công trình nghiên cứu dotôi thực hiện. Các nội dung và kết quả nghiên cứu được trình bày trong Luận án làtrung thực và chưa được công bố bởi bất kỳ tác giả nào hay trong bất kỳ công trìnhkhoa học nào khác. Tác giả Luận án Võ Duy Thanh i MỤC LỤCLỜI CAM ĐOAN ................................................................................................... iMỤC LỤC .............................................................................................................. iiDANH MỤC CÁC TỪ VIẾT TẮT ..................................................................... viDANH MỤC HÌNH VẼ....................................................................................... viiDANH MỤC BẢNG ............................................................................................. ixMỞ ĐẦU ................................................................................................................. 1Chương 1. NGHIÊN CỨU TỔNG QUAN .......................................................... 91.1. Học máy ............................................................................................................ 9 1.1.1. Khái niệm ............................................................................................. 9 1.1.2. Ứng dụng của học máy ........................................................................ 9 1.1.3. Các dạng dữ liệu trong học máy ........................................................ 111.2. Các phương pháp học máy .............................................................................. 13 1.2.1. Học có giám sát .................................................................................. 13 1.2.2. Học không giám sát ........................................................................... 15 1.2.3. Học bán giám sát ................................................................................ 16 1.2.4. Học tăng cường .................................................................................. 16 1.2.5. Học sâu............................................................................................... 171.3. Tổng quan về học bán giám sát ....................................................................... 21 1.3.1. Một số phương pháp học bán giám sát .............................................. 23 1.3.2. Thuật toán học có giám sát SVM và bán giám sát SVM ................... 34 1.3.3. Huấn luyện SVM ............................................................................... 38 1.3.4. SVM trong phân lớp văn bản ............................................................. 39 1.3.5. Bán giám sát SVM và phân lớp trang Web ....................................... 40 ii 1.3.6. Thuật toán phân lớp văn bản điển hình .............................................. 411.4. Phân loại văn bản ............................................................................................ 43 1.4.1. Văn bản .............................................................................................. 43 1.4.2. Biểu diễn văn bản bằng véc tơ ........................................................... 44 1.4.3. Phân loại văn bản ............................................................................... 461.5. Đề xuất nghiên cứu ......................................................................................... 491.6. Tiểu kết chương .............................................................................................. 51Chương 2. XÂY DỰNG KHO DỮ LIỆU.......................................................... 532.1. Giới thiệu kho dữ liệu phân ...
Tìm kiếm theo từ khóa liên quan:
Luận án tiến sĩ Khoa học máy tính Luận án tiến sĩ Kỹ thuật Phương pháp học bán giám sát Phân loại văn bản tiếng Việt Quá trình xây dựng kho dữ liệuTài liệu liên quan:
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 484 1 0 -
205 trang 438 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 392 1 0 -
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 380 6 0 -
174 trang 354 0 0
-
206 trang 310 2 0
-
228 trang 275 0 0
-
32 trang 243 0 0
-
Luận án tiến sĩ Ngữ văn: Dấu ấn tư duy đồng dao trong thơ thiếu nhi Việt Nam từ 1945 đến nay
193 trang 240 0 0 -
208 trang 226 0 0