Bài giảng Khai phá dữ liệu - Trường ĐH Hàng Hải
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu - Trường ĐH Hàng Hải TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN *** BÀI GIẢNG KHAI PHÁ DỮ LIỆU TÊN HỌC PHẦN: KHAI PHÁ DỮ LIỆU MÃ HỌC PHẦN: 17409 TRÌNH ĐỘ ĐÀO TẠO : ĐẠI HỌC CHÍNH QUY DÙNG CHO SV NGÀNH: CÔNG NGHỆ THÔNG TIN HẢI PHÒNG 2011 2 MỤC LỤC Nội dung Trang Chương 1. Tổng quan kho dữ liệu (Data warehouse) 5 1.1. Các chiến lược xử lý và khai thác thông tin 5 1.2. Định nghĩa kho dữ liệu 6 1.3. Mục đích của kho dữ liệu 7 1.4. Đặc tính của dữ liệu trong kho dữ liệu 9 1.5. Phân biệt kho dữ liệu với các cơ sở dữ liệu tác nghiệp 11 Chương 2. Tổng quan về khai phá dữ liệu 14 2.1. Khai phá dữ liệu là gì? 14 2.2. Phân loại các hệ thống khai phá dữ liệu 14 2.3. Những nhiệm vụ chính 15 2.4. Tích hợp hệ thống khai phá dữ liệu với cơ sở dữ liệu hoặc kho 17 2.5. Các phương pháp khai phá dữ liệu 18 2.6. Lợi thế của khai phá dữ liệu so với phương pháp cơ bản 23 2.7. Lựa chọn phương pháp 25 2.8. Những thách thức trong ứng dụng và nghiên cứu trong kỹ thuật khai phá dữ liệu 26 Chương 3. Tiền xử lý dữ liệu 30 3.1. Mục đích 30 3.2. Làm sạch dữ liệu 31 3.3. Tích hợp và biến đổi dữ liệu 34 Chương 4. Khai phá dựa trên các mẫu phổ biến và luật kết hợp 43 4.1. Khái niệm về luật kết hợp Error: Referen ce source not found 4.2. Giải thuật Apriori 40 4.3. Giải thuật FPGrowth 45 4.4. So sánh và đánh giá 51 Chương 5. Phân lớp và dự đoán 54 5.1. Khái niệm cơ bản 54 5.2. Phân lớp dựa trên cây quyết định 56 3 Tên học phần: Khai phá dữ liệu Loại học phần: 2 Bộ môn phụ trách giảng dạy: Hệ thống Thông tin Khoa phụ trách: CNTT. Mã học phần: 17409 Tổng số TC: 2 Tổng số Lý thuyết Thực hành/ Xemina Tự học Bài tập lớn Đồ án môn học tiết 45 30 15 0 không không Học phần học trước: Cơ sở dữ liệu; Cơ sở dữ liệu nâng cao; Hệ quản trị CSDL Học phần tiên quyết: Không yêu cầu. Học phần song song: Không yêu cầu. Mục tiêu của học phần: Cung cấp các kiến thức cơ bản về kho dữ liệu lớn và các kỹ thuật khai phá dữ liệu. Nội dung chủ yếu: Tổng quan về kho dữ liệu và khai phá dữ liệu; Phương pháp tổ chức lưu trữ dữ liệu lớn, và các kỹ thuật khai phá dữ liệu; Phân tích dữ liệu sử dụng phương pháp phân cụm; Ứng dụng kỹ thuật khai phá dữ liệu. Nội dung chi tiết: PHÂN PHỐI SỐ TIẾT TÊN CHƯƠNG MỤC TS LT TH BT KT Chương 1. Tổng quan kho dữ liệu (Data warehouse) 6 4 2 1.1. Các chiến lược xử lý và khai thác thông tin 1.2. Định nghĩa kho dữ liệu 1.3. Mục đích của kho dữ liệu 1.4. Đặc tính của dữ liệu trong kho dữ liệu 1.5. Phân biệt kho dữ liệu với các cơ sở dữ liệu tác nghiệp Chương 2. Tổng quan về khai phá dữ liệu 9 6 3 2.1. Khai phá dữ liệu là gì? 2.2. Phân loại các hệ thống khai phá dữ liệu 2.3. Những nhiệm vụ chính 2.4. Tích hợp hệ thống khai phá dữ liệu với cơ sở dữ liệu hoặc kho 2.5. Các phương pháp khai phá dữ liệu 2.6. Lợi thế của khai phá dữ liệu so với phương pháp cơ bản 2.7. Lựa chọn phương pháp 2.8. Những thách thức trong ứng dụng và nghiên cứu trong kỹ thuật khai phá dữ liệu Chương 3. Tiền xử lý dữ liệu 9 6 3 3.1. Mục đích 3.2. Làm sạch dữ liệu 3.3. Tích hợp và biến đổi dữ liệu Chương 4. Khai phá dựa trên các mẫu phổ biến và 12 8 4 luật kết hợp 4.1. ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Khai phá dữ liệu Khai phá dữ liệu Tổng quan về kho dữ liệu Tổng quan khai phá dữ liệu Tiền xử lý dữ liệu Luật kết hợp dữ liệuGợi ý tài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 351 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 232 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 223 0 0 -
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 172 0 0 -
8 trang 131 0 0
-
4 trang 115 0 0
-
Bài giảng Khai phá dữ liệu: Chương 5 - TS. Võ Thị Ngọc Châu
116 trang 51 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Chương 8 - ĐH Bách khoa TP.HCM
8 trang 45 0 0 -
68 trang 44 0 0
-
Bài giảng Khai phá web - Bài 1: Tổng quan về khai phá web
44 trang 42 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 2 - Nguyễn Nhật Quang
31 trang 42 0 0 -
8 trang 41 0 0
-
Bài giảng Khai phá dữ liệu (Data mining): Clustering - Trịnh Tấn Đạt
70 trang 41 0 0 -
Trình bày dữ liệu đồ thị trong trực quan hóa dữ liệu
13 trang 40 0 0 -
Một số vấn đề về tính toán mềm
6 trang 37 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Data preprocessing - Trịnh Tấn Đạt
71 trang 36 0 0 -
Bài giảng Nhập môn Tin học 2 - Chương 10: Xử lý dữ liệu
56 trang 36 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Linear regression - Trịnh Tấn Đạt
64 trang 34 0 0 -
Đề thi kết thúc học phần học kì 1 môn Khai phá dữ liệu năm 2020-2021 có đáp án - Trường ĐH Đồng Tháp
3 trang 32 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Naïve Bayes Classification - Trịnh Tấn Đạt
36 trang 32 0 0