Danh mục

Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu dựa trên bảng quyết định nhờ lý thuyết tập thô

Số trang: 53      Loại file: pdf      Dung lượng: 1.23 MB      Lượt xem: 9      Lượt tải: 0    
tailieu_vip

Phí tải xuống: 53,000 VND Tải xuống file đầy đủ (53 trang) 0
Xem trước 6 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu nghiên cứu của đề tài là tìm hiểu về lý thuyết tập thô: hệ thông tin, bảng quyết định, các tập xấp xỉ, tập lõi và tập rút gọn. Tìm hiểu các phương pháp rút gọn thuộc tính, từ đó lựa chọn phương pháp rút gọn thuộc tính sử dụng Entropy Shannon trong bảng quyết định và phương pháp sinh luật quyết định trên tập rút gọn thu được.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu dựa trên bảng quyết định nhờ lý thuyết tập thô ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ KIM OANHKHAI PHÁ DỮ LIỆU DỰA TRÊN BẢNG QUYẾT ĐỊNH NHỜ LÝ THUYẾT TẬP THÔ LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ KIM OANHKHAI PHÁ DỮ LIỆU DỰA TRÊN BẢNG QUYẾT ĐỊNH NHỜ LÝ THUYẾT TẬP THÔ Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: GS.TS. VŨ ĐỨC THI Hà Nội - 2014 1 LỜI CẢM ƠN Trước tiên, tôi xin gửi lời cảm ơn chân thành nhất tới GS.TS Vũ Đức Thi,Viện Công nghệ thông tin – Đại học Quốc gia Hà Nội đã tận tình hướng dẫn, địnhhướng, đóng góp những ý kiến quý báu cho tôi trong quá trình thực hiện luận văn. Tôi xin chân thành cảm ơn các Thầy, Cô giáo trong Trường Đại học Côngnghệ - Đại học Quốc gia Hà Nội đã tận tình giảng dạy và truyền thụ cho tôi nhữngkiến thức quý báu trong suốt quá trình học tập tại trường. Đồng thời, tôi cũng xincảm ơn gia đình, bạn bè, những người luôn khuyến khích và giúp đỡ tôi trong mọihoàn cảnh khó khăn. Tôi xin cảm ơn cơ quan và các đồng nghiệp đã hết sức tạo điềukiện cho tôi trong suốt quá trình học tập và làm luận văn này. Hà Nội, ngày tháng 6 năm 2014 Học viên Hoàng Thị Kim Oanh 2 LỜI CAM ĐOAN Tôi xin cam đoan những kiến thức trình bày trong luận văn này là do tôitìm hiểu, nghiên cứu và trình bày lại theo cách hiểu của tôi. Trong quá trình làmluận văn tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệutham khảo đó. Phần lớn những kiến thức tôi trình bày trong luận văn này chưađược trình bày hoàn chỉnh trong bất cứ tài liệu nào. Hà Nội, ngày tháng 6 năm 2014 Học viên Hoàng Thị Kim Oanh 3 MỤC LỤCLỜI CẢM ƠN............................................................................................................................................................1LỜI CAM ĐOAN.....................................................................................................................................................2MỤC LỤC...................................................................................................................................................................3DANH MỤC CÁC THUẬT NGỮ....................................................................................................................5DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ...........................................................................6DANH MỤC CÁC BẢNG ...................................................................................................................................7DANH MỤC CÁC HÌNH VẼ.............................................................................................................................8MỞ ĐẦU......................................................................................................................................................................9Chương 1. KHAI PHÁ DỮ LIỆU THEO TIẾP CẬN TẬP THÔ .................................................... 121.1. Hệ thông tin ........................................................................................................................... 121.2. Bảng quyết định .................................................................................................................... 131.3. Quan hệ không phân biệt được ............................................................................................ 141.4. Các tập xấp xỉ ........................................................................................................................ 161.5. Tập rút gọn và tập lõi ............................................................................................................ 181.6. Ma trận phân biệt và hàm phân biệt .................................................................................... 20Chương 2. PHƢƠNG PHÁP RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT TRÊN BẢNGQUYẾT ĐỊNH........................................................................................................................................................ 212.1. Phương pháp rút gọn thuộc tính trên bảng quyết định ...................................................... 212.2. Phương pháp rút gọn thuộc tính dựa trên entropy Shannon ............................................. 25 2.2.1. Entropy Shannon trên bảng quyết định .................................................................. 25 2.2.2. Tập lõi của bảng quyết định dựa trên Entropy Shannon ........................................ 26 2.2.3. Tập rút gọn của bảng quyết định dựa trên Entropy Shannon .................................. 27 2.2.4. Độ quan trọng của thuộc tính dựa trên entropy Shannon ....................................... 27 2.2.5. Thuật toán tìm tập rút gọn của bảng quyết định sử dụng Entropy Shannon .......... 282.3. Sinh luật quyết định trên tập rút gọn của bảng quyết định................................................ 34 2.3.1. Luật quyết định .............. ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: