Mục tiêu của đề tài nghiên cứu nhằm xây dựng mô hình học phân lớp dữ liệu bằng cây quyết định mờ và phương pháp trích chọn đặc trưng để chọn tập mẫu huấn luyện cho quá trình học phân lớp; đề xuất phương pháp xử lý giá trị ngôn ngữ của các thuộc tính chưa thuần nhất dựa vào ĐSGT; đề xuất các thuật toán học bằng cây quyết định mờ cho bài toán phân lớp nhằm đạt hiệu quả trong dự đoán và đơn giản đối với người dùng.
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Khoa học máy tính: Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử ĐẠI HỌC HUẾ TRƢỜNG ĐẠI HỌC KHOA HỌC LÊ VĂN TƢỜNG LÂNPHÂN LỚP DỮ LIỆU BẰNG CÂY QUYẾT ĐỊNH MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 62.48.01.01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: 1. PGS.TS. Nguyễn Mậu Hân 2. TS. Nguyễn Công Hào HUẾ - NĂM 2018 Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu do tôi thực hiện, dưới sựhướng dẫn khoa học của PGS.TS. Nguyễn Mậu Hân và TS. Nguyễn Công Hào.Các số liệu và kết quả trình bày trong luận án là trung thực, chưa được công bốbởi bất kỳ tác giả nào hay ở bất kỳ công trình nào khác. ii Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử LỜI CẢM ƠN Trong quá trình thực hiện đề tài “Phân lớp dữ liệu bằng cây quyết địnhmờ dựa trên đại số gia tử”, tôi đã nhận được rất nhiều sự giúp đỡ, tạo điều kiệncủa tập thể Ban giám hiệu, Phòng Đào tạo Sau đại học, Khoa Công nghệ thôngtin và các phòng chức năng của Trường Đại học Khoa học, Đại học Huế. Tôi xinbày tỏ lòng cảm ơn chân thành về sự giúp đỡ quý báu đó. Tôi xin được bày tỏ lòng biết ơn sâu sắc tới PGS.TS. Nguyễn Mậu Hânvà TS. Nguyễn Công Hào là những thầy trực tiếp hướng dẫn và chỉ bảo cho tôihoàn thành luận án. Tôi xin chân thành cảm ơn gia đình, bạn bè và đồng nghiệp đã động viên,khích lệ, tạo điều kiện và giúp đỡ tôi trong suốt quá trình thực hiện và hoànthành luận án này. TÁC GIẢ LUẬN ÁN Nghiên cứu sinh Lê Văn Tường Lân iii Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử MỤC LỤCLời cam đoan ...............................................................................................................iiLời cảm ơn ............................................................................................................... iiiDanh mục các từ viết tắt ............................................................................................viiDanh mục các ký hiệu ............................................................................................. viiiDanh mục các bảng biểu ............................................................................................ ixDanh mục các hình vẽ ................................................................................................. xMở đầu ....................................................................................................................... 1Chương 1. Cơ sở lý thuyết về đại số gia tử và tổng quan phân lớp dữ liệu bằng cây quyết định ................................................................................................. 10 1.1. Lý thuyết tập mờ ...................................................................................... 10 1.1.1.Tập mờ và thông tin không chắc chắn ............................................ 10 1.1.2. Biến ngôn ngữ................................................................................ 12 1.2. Đại số gia tử............................................................................................... 14 1.2.1. Khái niệm đại số gia tử .................................................................. 14 1.2.2. Các hàm đo của đại số gia tử ......................................................... 16 1.2.3. Một số tính chất của các hàm đo ................................................... 17 1.2.4. Khoảng mờ và các mối tương quan của khoảng mờ ..................... 20 1.3. Phân lớp dữ liệu bằng cây quyết định ...................................................... 21 1.3.1. Bài toán phân lớp trong khai phá dữ liệu ...................................... 21 1.3.2. Cây quyết định ............................................................................... 23 1.3.3. Lợi ích thông tin và tỷ lệ lợi ích thông tin ..................................... 24 1.3.4. Vấn đề quá khớp trong mô hình cây quyết định .......................... 26 1.4. Phân lớp dữ liệu bằng cây quyết định mờ ................................................. 28 1.4.1. Các hạn chế của phân lớp dữ liệu bằng cây quyết định rõ ............ 28 1.4.2. Bài toán phân lớp dữ liệu bằng cây quyết định mờ ....................... 29 iv Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử 1.4.3. Một số vấn đề của bài toán phân lớp dữ liệu bằng cây quyết định mờ .......................................................................................................... 31 1.5. Kết luận chương 1 ..................................................................................... 35Chương 2. Phân lớp dữ liệu bằng cây quyết định mờ theo phương pháp đối sánh điểm mờ dựa trên đại số gia tử ............................................................ 36 2.1. Giới thiệu ................................................................................................... 36 2.2. Phương pháp chọn tập mẫu huấn luyện đặc trưng cho bài toán học phân lớp dữ liệu bằng cây ...