Danh mục

Luận án tiến sĩ Kỹ thuật: Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt

Số trang: 142      Loại file: pdf      Dung lượng: 2.67 MB      Lượt xem: 10      Lượt tải: 0    
Hoai.2512

Hỗ trợ phí lưu trữ khi tải xuống: 142,000 VND Tải xuống file đầy đủ (142 trang) 0

Báo xấu

Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu của đề tài là hệ thống hoá và phân tích đầy đủ các vấn đề liên quan đến phân loại văn bản gồm: các mô hình phân loại, các phương pháp, kỹ thuật học có giám sát, học không có giám sát, học bán giám sát và học tăng cường; Đề xuất được các giải pháp nhằm cải tiến phương pháp phân loại văn bản tiếng Việt để cải thiện chất lượng phân loại cả về kết quả lẫn tốc độ xử lý;
Nội dung trích xuất từ tài liệu:
Luận án tiến sĩ Kỹ thuật: Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG VÕ DUY THANHNGHIÊN CỨU ỨNG DỤNG KỸ THUẬTHỌC BÁN GIÁM SÁT VÀO LĨNH VỰC PHÂN LOẠI VĂN BẢN TIẾNG VIỆT LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng - 2017 i BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG VÕ DUY THANHNGHIÊN CỨU ỨNG DỤNG KỸ THUẬTHỌC BÁN GIÁM SÁT VÀO LĨNH VỰC PHÂN LOẠI VĂN BẢN TIẾNG VIỆT Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62 48 01 01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Người hướng dẫn khoa học: 1. PGS.TS. Võ Trung Hùng 2. PGS.TS. Đoàn Văn Ban Đà Nẵng - 2017 ii LỜI CAM ĐOAN Tôi tên là Võ Duy Thanh. Tôi xin cam đoan đây là công trình nghiên cứu dotôi thực hiện. Các nội dung và kết quả nghiên cứu được trình bày trong Luận án làtrung thực và chưa được công bố bởi bất kỳ tác giả nào hay trong bất kỳ công trìnhkhoa học nào khác. Tác giả Luận án Võ Duy Thanh i MỤC LỤCLỜI CAM ĐOAN ................................................................................................... iMỤC LỤC .............................................................................................................. iiDANH MỤC CÁC TỪ VIẾT TẮT ..................................................................... viDANH MỤC HÌNH VẼ....................................................................................... viiDANH MỤC BẢNG ............................................................................................. ixMỞ ĐẦU ................................................................................................................. 1Chương 1. NGHIÊN CỨU TỔNG QUAN .......................................................... 91.1. Học máy ............................................................................................................ 9 1.1.1. Khái niệm ............................................................................................. 9 1.1.2. Ứng dụng của học máy ........................................................................ 9 1.1.3. Các dạng dữ liệu trong học máy ........................................................ 111.2. Các phương pháp học máy .............................................................................. 13 1.2.1. Học có giám sát .................................................................................. 13 1.2.2. Học không giám sát ........................................................................... 15 1.2.3. Học bán giám sát ................................................................................ 16 1.2.4. Học tăng cường .................................................................................. 16 1.2.5. Học sâu............................................................................................... 171.3. Tổng quan về học bán giám sát ....................................................................... 21 1.3.1. Một số phương pháp học bán giám sát .............................................. 23 1.3.2. Thuật toán học có giám sát SVM và bán giám sát SVM ................... 34 1.3.3. Huấn luyện SVM ............................................................................... 38 1.3.4. SVM trong phân lớp văn bản ............................................................. 39 1.3.5. Bán giám sát SVM và phân lớp trang Web ....................................... 40 ii 1.3.6. Thuật toán phân lớp văn bản điển hình .............................................. 411.4. Phân loại văn bản ............................................................................................ 43 1.4.1. Văn bản .............................................................................................. 43 1.4.2. Biểu diễn văn bản bằng véc tơ ........................................................... 44 1.4.3. Phân loại văn bản ............................................................................... 461.5. Đề xuất nghiên cứu ......................................................................................... 491.6. Tiểu kết chương .............................................................................................. 51Chương 2. XÂY DỰNG KHO DỮ LIỆU.......................................................... 532.1. Giới thiệu kho dữ liệu phân ...

Tài liệu được xem nhiều:

Tài liệu liên quan: