Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu dựa trên bảng quyết định nhờ lý thuyết tập thô
Số trang: 53
Loại file: pdf
Dung lượng: 1.23 MB
Lượt xem: 9
Lượt tải: 0
Xem trước 6 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu nghiên cứu của đề tài là tìm hiểu về lý thuyết tập thô: hệ thông tin, bảng quyết định, các tập xấp xỉ, tập lõi và tập rút gọn. Tìm hiểu các phương pháp rút gọn thuộc tính, từ đó lựa chọn phương pháp rút gọn thuộc tính sử dụng Entropy Shannon trong bảng quyết định và phương pháp sinh luật quyết định trên tập rút gọn thu được.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu dựa trên bảng quyết định nhờ lý thuyết tập thô ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ KIM OANHKHAI PHÁ DỮ LIỆU DỰA TRÊN BẢNG QUYẾT ĐỊNH NHỜ LÝ THUYẾT TẬP THÔ LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ KIM OANHKHAI PHÁ DỮ LIỆU DỰA TRÊN BẢNG QUYẾT ĐỊNH NHỜ LÝ THUYẾT TẬP THÔ Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: GS.TS. VŨ ĐỨC THI Hà Nội - 2014 1 LỜI CẢM ƠN Trước tiên, tôi xin gửi lời cảm ơn chân thành nhất tới GS.TS Vũ Đức Thi,Viện Công nghệ thông tin – Đại học Quốc gia Hà Nội đã tận tình hướng dẫn, địnhhướng, đóng góp những ý kiến quý báu cho tôi trong quá trình thực hiện luận văn. Tôi xin chân thành cảm ơn các Thầy, Cô giáo trong Trường Đại học Côngnghệ - Đại học Quốc gia Hà Nội đã tận tình giảng dạy và truyền thụ cho tôi nhữngkiến thức quý báu trong suốt quá trình học tập tại trường. Đồng thời, tôi cũng xincảm ơn gia đình, bạn bè, những người luôn khuyến khích và giúp đỡ tôi trong mọihoàn cảnh khó khăn. Tôi xin cảm ơn cơ quan và các đồng nghiệp đã hết sức tạo điềukiện cho tôi trong suốt quá trình học tập và làm luận văn này. Hà Nội, ngày tháng 6 năm 2014 Học viên Hoàng Thị Kim Oanh 2 LỜI CAM ĐOAN Tôi xin cam đoan những kiến thức trình bày trong luận văn này là do tôitìm hiểu, nghiên cứu và trình bày lại theo cách hiểu của tôi. Trong quá trình làmluận văn tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệutham khảo đó. Phần lớn những kiến thức tôi trình bày trong luận văn này chưađược trình bày hoàn chỉnh trong bất cứ tài liệu nào. Hà Nội, ngày tháng 6 năm 2014 Học viên Hoàng Thị Kim Oanh 3 MỤC LỤCLỜI CẢM ƠN............................................................................................................................................................1LỜI CAM ĐOAN.....................................................................................................................................................2MỤC LỤC...................................................................................................................................................................3DANH MỤC CÁC THUẬT NGỮ....................................................................................................................5DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ...........................................................................6DANH MỤC CÁC BẢNG ...................................................................................................................................7DANH MỤC CÁC HÌNH VẼ.............................................................................................................................8MỞ ĐẦU......................................................................................................................................................................9Chương 1. KHAI PHÁ DỮ LIỆU THEO TIẾP CẬN TẬP THÔ .................................................... 121.1. Hệ thông tin ........................................................................................................................... 121.2. Bảng quyết định .................................................................................................................... 131.3. Quan hệ không phân biệt được ............................................................................................ 141.4. Các tập xấp xỉ ........................................................................................................................ 161.5. Tập rút gọn và tập lõi ............................................................................................................ 181.6. Ma trận phân biệt và hàm phân biệt .................................................................................... 20Chương 2. PHƢƠNG PHÁP RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT TRÊN BẢNGQUYẾT ĐỊNH........................................................................................................................................................ 212.1. Phương pháp rút gọn thuộc tính trên bảng quyết định ...................................................... 212.2. Phương pháp rút gọn thuộc tính dựa trên entropy Shannon ............................................. 25 2.2.1. Entropy Shannon trên bảng quyết định .................................................................. 25 2.2.2. Tập lõi của bảng quyết định dựa trên Entropy Shannon ........................................ 26 2.2.3. Tập rút gọn của bảng quyết định dựa trên Entropy Shannon .................................. 27 2.2.4. Độ quan trọng của thuộc tính dựa trên entropy Shannon ....................................... 27 2.2.5. Thuật toán tìm tập rút gọn của bảng quyết định sử dụng Entropy Shannon .......... 282.3. Sinh luật quyết định trên tập rút gọn của bảng quyết định................................................ 34 2.3.1. Luật quyết định .............. ...
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu dựa trên bảng quyết định nhờ lý thuyết tập thô ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ KIM OANHKHAI PHÁ DỮ LIỆU DỰA TRÊN BẢNG QUYẾT ĐỊNH NHỜ LÝ THUYẾT TẬP THÔ LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ KIM OANHKHAI PHÁ DỮ LIỆU DỰA TRÊN BẢNG QUYẾT ĐỊNH NHỜ LÝ THUYẾT TẬP THÔ Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: GS.TS. VŨ ĐỨC THI Hà Nội - 2014 1 LỜI CẢM ƠN Trước tiên, tôi xin gửi lời cảm ơn chân thành nhất tới GS.TS Vũ Đức Thi,Viện Công nghệ thông tin – Đại học Quốc gia Hà Nội đã tận tình hướng dẫn, địnhhướng, đóng góp những ý kiến quý báu cho tôi trong quá trình thực hiện luận văn. Tôi xin chân thành cảm ơn các Thầy, Cô giáo trong Trường Đại học Côngnghệ - Đại học Quốc gia Hà Nội đã tận tình giảng dạy và truyền thụ cho tôi nhữngkiến thức quý báu trong suốt quá trình học tập tại trường. Đồng thời, tôi cũng xincảm ơn gia đình, bạn bè, những người luôn khuyến khích và giúp đỡ tôi trong mọihoàn cảnh khó khăn. Tôi xin cảm ơn cơ quan và các đồng nghiệp đã hết sức tạo điềukiện cho tôi trong suốt quá trình học tập và làm luận văn này. Hà Nội, ngày tháng 6 năm 2014 Học viên Hoàng Thị Kim Oanh 2 LỜI CAM ĐOAN Tôi xin cam đoan những kiến thức trình bày trong luận văn này là do tôitìm hiểu, nghiên cứu và trình bày lại theo cách hiểu của tôi. Trong quá trình làmluận văn tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệutham khảo đó. Phần lớn những kiến thức tôi trình bày trong luận văn này chưađược trình bày hoàn chỉnh trong bất cứ tài liệu nào. Hà Nội, ngày tháng 6 năm 2014 Học viên Hoàng Thị Kim Oanh 3 MỤC LỤCLỜI CẢM ƠN............................................................................................................................................................1LỜI CAM ĐOAN.....................................................................................................................................................2MỤC LỤC...................................................................................................................................................................3DANH MỤC CÁC THUẬT NGỮ....................................................................................................................5DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ...........................................................................6DANH MỤC CÁC BẢNG ...................................................................................................................................7DANH MỤC CÁC HÌNH VẼ.............................................................................................................................8MỞ ĐẦU......................................................................................................................................................................9Chương 1. KHAI PHÁ DỮ LIỆU THEO TIẾP CẬN TẬP THÔ .................................................... 121.1. Hệ thông tin ........................................................................................................................... 121.2. Bảng quyết định .................................................................................................................... 131.3. Quan hệ không phân biệt được ............................................................................................ 141.4. Các tập xấp xỉ ........................................................................................................................ 161.5. Tập rút gọn và tập lõi ............................................................................................................ 181.6. Ma trận phân biệt và hàm phân biệt .................................................................................... 20Chương 2. PHƢƠNG PHÁP RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT TRÊN BẢNGQUYẾT ĐỊNH........................................................................................................................................................ 212.1. Phương pháp rút gọn thuộc tính trên bảng quyết định ...................................................... 212.2. Phương pháp rút gọn thuộc tính dựa trên entropy Shannon ............................................. 25 2.2.1. Entropy Shannon trên bảng quyết định .................................................................. 25 2.2.2. Tập lõi của bảng quyết định dựa trên Entropy Shannon ........................................ 26 2.2.3. Tập rút gọn của bảng quyết định dựa trên Entropy Shannon .................................. 27 2.2.4. Độ quan trọng của thuộc tính dựa trên entropy Shannon ....................................... 27 2.2.5. Thuật toán tìm tập rút gọn của bảng quyết định sử dụng Entropy Shannon .......... 282.3. Sinh luật quyết định trên tập rút gọn của bảng quyết định................................................ 34 2.3.1. Luật quyết định .............. ...
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Công nghệ thông tin Hệ thống thông tin Lý thuyết tập thô Phương pháp rút gọn thuộc tính Entropy ShannonGợi ý tài liệu liên quan:
-
52 trang 431 1 0
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 365 5 0 -
97 trang 329 0 0
-
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 323 0 0 -
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 318 0 0 -
97 trang 312 0 0
-
74 trang 302 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 302 0 0 -
96 trang 296 0 0
-
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 289 0 0