Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Một số mô hình học máy trong phân loại câu hỏi
Số trang: 23
Loại file: pdf
Dung lượng: 703.17 KB
Lượt xem: 8
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Lý do này mà tác giả chọn và nghiên cứu đề tài “Một số mô hình học máy trong phân loại câu hỏi” đó là một phân loại tốt sẽ giúp đưa ra câu trả lời chính xác hơn. Đã có nhiều phương pháp tiếp cận được đưa ra cho bài toán phân loại này, tuy nhiên phương pháp học máy là được áp dụng nhiều hơn cả.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Một số mô hình học máy trong phân loại câu hỏiĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆVŨ THỊ TUYẾNMỘT SỐ MÔ HÌNH HỌC MÁY TRONG PHÂN LOẠICÂU HỎINgành: Công nghệ thông tinChuyên ngành: Hệ thống thông tinMã số: 60480104TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TINHà Nội -20161MỤC LỤCMỤC LỤC ....................................................................................................................... 1LỜI MỞ ĐẦU ................................................................................................................. 3Chương 1: TỔNG QUAN VỀ PHÂN LOẠI CÂU HỎI ................................................. 41.1. Tổng quan về hệ thống hỏi đáp ............................................................................ 41.1.1.Đặt vấn đề ....................................................................................................... 41.1.2. Hệ thống hỏi đáp (Question Answering System) .......................................... 41.1.2.1. Giới thiệu ................................................................................................ 41.1.2.2. Cấu trúc của một hệ thống hỏi đáp ......................................................... 41.1.2.3. Tại sao phải phân loại câu hỏi? .............................................................. 51.2. Bài toán phân loại câu hỏi .................................................................................... 61.2.1. Định nghĩa phân loại câu hỏi ......................................................................... 61.2.2. Phát biểu bài toán phân loại câu hỏi .............................................................. 61.3. Các cáchtiếp cận bài toán phân loại câu hỏi ......................................................... 61.3.1. Tiếp cận dựa trên luật .................................................................................... 61.3.2. Tiếp cận dựa trên học máy ............................................................................ 71.4. Biểu diễn câu hỏi .................................................................................................. 71.5. Taxonomy câu hỏi ................................................................................................ 71.5.1. Khái niệm về Taxonomy ............................................................................... 71.5.2. Các taxonomytheo kiểu câu trả lời ................................................................ 71.6. Các đặc trưng phân loại ........................................................................................ 81.6.1. Các đặc trưng về từ vựng .............................................................................. 81.6.2. Các đặc trưng về cú pháp .............................................................................. 91.6.2.1. POS Tags và Tagged Unigrams ............................................................. 91.6.2.2. Từ đầu (head word) ................................................................................ 91.6.2.3. Biểu thức chính quy.............................................................................. 101.6.3. Các đặc trưng ngữ nghĩa .............................................................................. 11Chương 2: MỘT SỐ MÔ HÌNH HỌC MÁY TRONG PHÂN LOẠI CÂU HỎI ......... 122.1. Thuật toán Naïve Bayes...................................................................................... 122.1.1. Định lý ......................................................................................................... 122.1.2. Thuật toán .................................................................................................... 132.2. Thuật toán k-láng giềng gần (k- Nearst Neighbours) ......................................... 1422.3. Máy Vector hỗ trợ - SVM .................................................................................. 152.4. Hiệu suất trong phân loại câu hỏi ....................................................................... 18Chương 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ ............................................................. 193.1. Lựa chọn bộ phân loại ........................................................................................ 193.2. Môi trường và công cụ sử dụng trong thực nghiệm ........................................... 193.3. Tập dữ liệu thử nghiệm ...................................................................................... 193.4. Xử lý dữ liệu ....................................................................................................... 203.5. Huấn luyện và kiểm thử với LibSVM ................................................................ 203.6. Kết quả thực nghiệm........................................................................................... 213.7. Kết luận............................................................................................................... 21TỔNG KẾT ................................................................................................................... 223LỜI MỞ ĐẦUNgày nay, với sự phát triển mạnh mẽ của Internet toàn cầu cùng với nhu cầutìm kiếm thông tin ngày càng cao của con người đòi hỏi hệ thống hỏi đáp ngày mộtthông minh hơn.Những thắc mắc của người dùng dướidạng truy vấn cần được tìmkiếm và trả về một cách ngắn gọn, súc tích và chính xác nhất những gì mà họ mongmuốn.Một trong những thành phần quan trọng ảnh hưởng trực tiếp đến kết quả tìmkiếm trong hệ thống hỏi đáp là giai đoạn phân loại câu hỏi.Một phân loại tốt sẽ giúpđưa ra câu trả lời chính xác hơn.Đã có nhiều phương pháp tiếp cận được đưa ra cho bàitoán phân loại này, tuy nhiên phương pháp học máy là được áp dụng nhiều hơn cả.Chính vì lý do này mà tác giả chọn và nghiên cứu đề tài “Một số mô hình học máytrong phân loại câu hỏi”. Luận văn bao gồm 3 phần như sau:Chương 1: Tổng quan về phân loại câu hỏiChương này trình bày t ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Một số mô hình học máy trong phân loại câu hỏiĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆVŨ THỊ TUYẾNMỘT SỐ MÔ HÌNH HỌC MÁY TRONG PHÂN LOẠICÂU HỎINgành: Công nghệ thông tinChuyên ngành: Hệ thống thông tinMã số: 60480104TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TINHà Nội -20161MỤC LỤCMỤC LỤC ....................................................................................................................... 1LỜI MỞ ĐẦU ................................................................................................................. 3Chương 1: TỔNG QUAN VỀ PHÂN LOẠI CÂU HỎI ................................................. 41.1. Tổng quan về hệ thống hỏi đáp ............................................................................ 41.1.1.Đặt vấn đề ....................................................................................................... 41.1.2. Hệ thống hỏi đáp (Question Answering System) .......................................... 41.1.2.1. Giới thiệu ................................................................................................ 41.1.2.2. Cấu trúc của một hệ thống hỏi đáp ......................................................... 41.1.2.3. Tại sao phải phân loại câu hỏi? .............................................................. 51.2. Bài toán phân loại câu hỏi .................................................................................... 61.2.1. Định nghĩa phân loại câu hỏi ......................................................................... 61.2.2. Phát biểu bài toán phân loại câu hỏi .............................................................. 61.3. Các cáchtiếp cận bài toán phân loại câu hỏi ......................................................... 61.3.1. Tiếp cận dựa trên luật .................................................................................... 61.3.2. Tiếp cận dựa trên học máy ............................................................................ 71.4. Biểu diễn câu hỏi .................................................................................................. 71.5. Taxonomy câu hỏi ................................................................................................ 71.5.1. Khái niệm về Taxonomy ............................................................................... 71.5.2. Các taxonomytheo kiểu câu trả lời ................................................................ 71.6. Các đặc trưng phân loại ........................................................................................ 81.6.1. Các đặc trưng về từ vựng .............................................................................. 81.6.2. Các đặc trưng về cú pháp .............................................................................. 91.6.2.1. POS Tags và Tagged Unigrams ............................................................. 91.6.2.2. Từ đầu (head word) ................................................................................ 91.6.2.3. Biểu thức chính quy.............................................................................. 101.6.3. Các đặc trưng ngữ nghĩa .............................................................................. 11Chương 2: MỘT SỐ MÔ HÌNH HỌC MÁY TRONG PHÂN LOẠI CÂU HỎI ......... 122.1. Thuật toán Naïve Bayes...................................................................................... 122.1.1. Định lý ......................................................................................................... 122.1.2. Thuật toán .................................................................................................... 132.2. Thuật toán k-láng giềng gần (k- Nearst Neighbours) ......................................... 1422.3. Máy Vector hỗ trợ - SVM .................................................................................. 152.4. Hiệu suất trong phân loại câu hỏi ....................................................................... 18Chương 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ ............................................................. 193.1. Lựa chọn bộ phân loại ........................................................................................ 193.2. Môi trường và công cụ sử dụng trong thực nghiệm ........................................... 193.3. Tập dữ liệu thử nghiệm ...................................................................................... 193.4. Xử lý dữ liệu ....................................................................................................... 203.5. Huấn luyện và kiểm thử với LibSVM ................................................................ 203.6. Kết quả thực nghiệm........................................................................................... 213.7. Kết luận............................................................................................................... 21TỔNG KẾT ................................................................................................................... 223LỜI MỞ ĐẦUNgày nay, với sự phát triển mạnh mẽ của Internet toàn cầu cùng với nhu cầutìm kiếm thông tin ngày càng cao của con người đòi hỏi hệ thống hỏi đáp ngày mộtthông minh hơn.Những thắc mắc của người dùng dướidạng truy vấn cần được tìmkiếm và trả về một cách ngắn gọn, súc tích và chính xác nhất những gì mà họ mongmuốn.Một trong những thành phần quan trọng ảnh hưởng trực tiếp đến kết quả tìmkiếm trong hệ thống hỏi đáp là giai đoạn phân loại câu hỏi.Một phân loại tốt sẽ giúpđưa ra câu trả lời chính xác hơn.Đã có nhiều phương pháp tiếp cận được đưa ra cho bàitoán phân loại này, tuy nhiên phương pháp học máy là được áp dụng nhiều hơn cả.Chính vì lý do này mà tác giả chọn và nghiên cứu đề tài “Một số mô hình học máytrong phân loại câu hỏi”. Luận văn bao gồm 3 phần như sau:Chương 1: Tổng quan về phân loại câu hỏiChương này trình bày t ...
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Công nghệ thông tin Bài toán phân loại câu hỏi Biểu diễn câu hỏi Phân lớp câu hỏi Đặc trưng câu hỏiTài liệu liên quan:
-
52 trang 434 1 0
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 367 5 0 -
97 trang 331 0 0
-
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 321 0 0 -
97 trang 316 0 0
-
74 trang 304 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 303 0 0 -
96 trang 299 0 0
-
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 293 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 286 0 0