Danh mục

Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Một số mô hình học máy trong phân loại câu hỏi

Số trang: 23      Loại file: pdf      Dung lượng: 703.17 KB      Lượt xem: 8      Lượt tải: 0    
Jamona

Hỗ trợ phí lưu trữ khi tải xuống: 4,000 VND Tải xuống file đầy đủ (23 trang) 0
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Lý do này mà tác giả chọn và nghiên cứu đề tài “Một số mô hình học máy trong phân loại câu hỏi” đó là một phân loại tốt sẽ giúp đưa ra câu trả lời chính xác hơn. Đã có nhiều phương pháp tiếp cận được đưa ra cho bài toán phân loại này, tuy nhiên phương pháp học máy là được áp dụng nhiều hơn cả.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Một số mô hình học máy trong phân loại câu hỏiĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆVŨ THỊ TUYẾNMỘT SỐ MÔ HÌNH HỌC MÁY TRONG PHÂN LOẠICÂU HỎINgành: Công nghệ thông tinChuyên ngành: Hệ thống thông tinMã số: 60480104TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TINHà Nội -20161MỤC LỤCMỤC LỤC ....................................................................................................................... 1LỜI MỞ ĐẦU ................................................................................................................. 3Chương 1: TỔNG QUAN VỀ PHÂN LOẠI CÂU HỎI ................................................. 41.1. Tổng quan về hệ thống hỏi đáp ............................................................................ 41.1.1.Đặt vấn đề ....................................................................................................... 41.1.2. Hệ thống hỏi đáp (Question Answering System) .......................................... 41.1.2.1. Giới thiệu ................................................................................................ 41.1.2.2. Cấu trúc của một hệ thống hỏi đáp ......................................................... 41.1.2.3. Tại sao phải phân loại câu hỏi? .............................................................. 51.2. Bài toán phân loại câu hỏi .................................................................................... 61.2.1. Định nghĩa phân loại câu hỏi ......................................................................... 61.2.2. Phát biểu bài toán phân loại câu hỏi .............................................................. 61.3. Các cáchtiếp cận bài toán phân loại câu hỏi ......................................................... 61.3.1. Tiếp cận dựa trên luật .................................................................................... 61.3.2. Tiếp cận dựa trên học máy ............................................................................ 71.4. Biểu diễn câu hỏi .................................................................................................. 71.5. Taxonomy câu hỏi ................................................................................................ 71.5.1. Khái niệm về Taxonomy ............................................................................... 71.5.2. Các taxonomytheo kiểu câu trả lời ................................................................ 71.6. Các đặc trưng phân loại ........................................................................................ 81.6.1. Các đặc trưng về từ vựng .............................................................................. 81.6.2. Các đặc trưng về cú pháp .............................................................................. 91.6.2.1. POS Tags và Tagged Unigrams ............................................................. 91.6.2.2. Từ đầu (head word) ................................................................................ 91.6.2.3. Biểu thức chính quy.............................................................................. 101.6.3. Các đặc trưng ngữ nghĩa .............................................................................. 11Chương 2: MỘT SỐ MÔ HÌNH HỌC MÁY TRONG PHÂN LOẠI CÂU HỎI ......... 122.1. Thuật toán Naïve Bayes...................................................................................... 122.1.1. Định lý ......................................................................................................... 122.1.2. Thuật toán .................................................................................................... 132.2. Thuật toán k-láng giềng gần (k- Nearst Neighbours) ......................................... 1422.3. Máy Vector hỗ trợ - SVM .................................................................................. 152.4. Hiệu suất trong phân loại câu hỏi ....................................................................... 18Chương 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ ............................................................. 193.1. Lựa chọn bộ phân loại ........................................................................................ 193.2. Môi trường và công cụ sử dụng trong thực nghiệm ........................................... 193.3. Tập dữ liệu thử nghiệm ...................................................................................... 193.4. Xử lý dữ liệu ....................................................................................................... 203.5. Huấn luyện và kiểm thử với LibSVM ................................................................ 203.6. Kết quả thực nghiệm........................................................................................... 213.7. Kết luận............................................................................................................... 21TỔNG KẾT ................................................................................................................... 223LỜI MỞ ĐẦUNgày nay, với sự phát triển mạnh mẽ của Internet toàn cầu cùng với nhu cầutìm kiếm thông tin ngày càng cao của con người đòi hỏi hệ thống hỏi đáp ngày mộtthông minh hơn.Những thắc mắc của người dùng dướidạng truy vấn cần được tìmkiếm và trả về một cách ngắn gọn, súc tích và chính xác nhất những gì mà họ mongmuốn.Một trong những thành phần quan trọng ảnh hưởng trực tiếp đến kết quả tìmkiếm trong hệ thống hỏi đáp là giai đoạn phân loại câu hỏi.Một phân loại tốt sẽ giúpđưa ra câu trả lời chính xác hơn.Đã có nhiều phương pháp tiếp cận được đưa ra cho bàitoán phân loại này, tuy nhiên phương pháp học máy là được áp dụng nhiều hơn cả.Chính vì lý do này mà tác giả chọn và nghiên cứu đề tài “Một số mô hình học máytrong phân loại câu hỏi”. Luận văn bao gồm 3 phần như sau:Chương 1: Tổng quan về phân loại câu hỏiChương này trình bày t ...

Tài liệu được xem nhiều:

Tài liệu liên quan: