Bài giảng Khai phá dữ liệu (Data mining): Chương 6 - ĐH Bách khoa TP.HCM
Số trang: 67
Loại file: ppt
Dung lượng: 1.75 MB
Lượt xem: 22
Lượt tải: 0
Xem trước 7 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Khai phá dữ liệu (Data mining): Chương 6 - Khai phá luật kết hợp cung cấp cho các bạn những kiến thức tổng quan về khai phá luật kết hợp; biểu diễn luật kết hợp; khám phá các mẫu thường xuyên; khám phá các luật kết hợp từ các mẫu thường xuyên; khám phá các luật kết hợp dựa trên ràng buộc; phân tích tương quan.
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu (Data mining): Chương 6 - ĐH Bách khoa TP.HCM Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh Chương 6: Khai phá luật kết hợp Khai phá dữ liệu (Data mining) 1 Học kỳ 1 – 20092010 Nội dung 6.1. Tổng quan về khai phá luật kết hợp 6.2. Biểu diễn luật kết hợp 6.3. Khám phá các mẫu thường xuyên 6.4. Khám phá các luật kết hợp từ các mẫu thường xuyên 6.5. Khám phá các luật kết hợp dựa trên ràng buộc 6.6. Phân tích tương quan 6.7. Tóm tắt 2 Tài liệu tham khảo [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006. [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001. [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, SpringerVerlag, 2008. [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, SpringerVerlag, 2006. [5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with SQL Server 2005”, Wiley Publishing, 2005. [6] Oracle, “Data Mining Concepts”, B2812901, 2008. [7] Oracle, “Data Mining Application Developer’s Guide”, B2813101, 2008. 3 6.0. Tình huống 1 – Market basket analysis 4 6.0. Tình huống 2 Tiếp thị chéo 5 6.0. Tình huống 2 Tiếp thị chéo 6 6.0. Tình huống … Phân tích dữ liệu giỏ hàng (basket data analysis) Tiếp thị chéo (crossmarketing) Thiết kế catalog (catalog design) Phân loại dữ liệu (classification) và gom cụm dữ liệu (clustering) với các mẫu phổ biến … 7 6.1. Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Các khái niệm cơ bản Phân loại luật kết hợp 8 6.1. Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre Post processing Mining Relationships processing Raw Data Items of Interest among Items User (Rules) 9 6.1. Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre Post processing Mining Relationships processing Raw Data Items of Interest among Items User (Rules) Transactional/ Association Items Relational Data Rules Transaction Items_bought A, B, C, D, F, A C (50%, 66.6%) … … 2000 A, B, C 1000 A, C 4000 A, D 5000 B, E, F … Bài toán phân tích giỏ thị trường 10 6.1. Tổng quan về khai phá luật kết hợp Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) 11 6.1. Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Item (phần tử) Itemset (tập phần tử) Transaction (giao dịch) Association (sự kết hợp) và association rule (luật kết hợp) Support (độ hỗ trợ) Confidence (độ tin cậy) Frequent itemset (tập phần tử phổ biến/thường xuyên) Strong association rule (luật kết hợp mạnh) 12 6.1. Tổng quan về khai phá luật kết hợp Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) Itemsets: Item: I4 {I1, I2, I5}, {I2}, … Transaction: T800 13 6.1. Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Item (phần tử) Các phần tử, mẫu, đối tượng đang được quan tâm. J = {I1, I2, …, Im}: tập tất cả m phần tử có thể có trong tập dữ liệu Itemset (tập phần tử) Tập hợp các items Một itemset có k items gọi là kitemset. Transaction (giao dịch) Lần thực hiện tương tác với hệ thống (ví dụ: giao dịch “khách hàng mua hàng”) Liên hệ với một tập T gồm các phần tử được giao dịch 14 6.1. Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Association (sự kết hợp) và association rule (luật kết hợp) Sự kết hợp: các phần tử cùng xuất hiện với nhau trong một hay nhiều giao dịch. Thể hiện mối liên hệ giữa các phần tử/các tập phần tử Luật kết hợp: qui tắc kết hợp có điều kiện giữa các tập phần t ử. Thể hiện mối liên hệ (có điều kiện) giữa các tập phần tử Cho A và B là các tập phần tử, luật kết hợp giữa A và B là A ...
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu (Data mining): Chương 6 - ĐH Bách khoa TP.HCM Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh Chương 6: Khai phá luật kết hợp Khai phá dữ liệu (Data mining) 1 Học kỳ 1 – 20092010 Nội dung 6.1. Tổng quan về khai phá luật kết hợp 6.2. Biểu diễn luật kết hợp 6.3. Khám phá các mẫu thường xuyên 6.4. Khám phá các luật kết hợp từ các mẫu thường xuyên 6.5. Khám phá các luật kết hợp dựa trên ràng buộc 6.6. Phân tích tương quan 6.7. Tóm tắt 2 Tài liệu tham khảo [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006. [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001. [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, SpringerVerlag, 2008. [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, SpringerVerlag, 2006. [5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with SQL Server 2005”, Wiley Publishing, 2005. [6] Oracle, “Data Mining Concepts”, B2812901, 2008. [7] Oracle, “Data Mining Application Developer’s Guide”, B2813101, 2008. 3 6.0. Tình huống 1 – Market basket analysis 4 6.0. Tình huống 2 Tiếp thị chéo 5 6.0. Tình huống 2 Tiếp thị chéo 6 6.0. Tình huống … Phân tích dữ liệu giỏ hàng (basket data analysis) Tiếp thị chéo (crossmarketing) Thiết kế catalog (catalog design) Phân loại dữ liệu (classification) và gom cụm dữ liệu (clustering) với các mẫu phổ biến … 7 6.1. Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Các khái niệm cơ bản Phân loại luật kết hợp 8 6.1. Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre Post processing Mining Relationships processing Raw Data Items of Interest among Items User (Rules) 9 6.1. Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre Post processing Mining Relationships processing Raw Data Items of Interest among Items User (Rules) Transactional/ Association Items Relational Data Rules Transaction Items_bought A, B, C, D, F, A C (50%, 66.6%) … … 2000 A, B, C 1000 A, C 4000 A, D 5000 B, E, F … Bài toán phân tích giỏ thị trường 10 6.1. Tổng quan về khai phá luật kết hợp Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) 11 6.1. Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Item (phần tử) Itemset (tập phần tử) Transaction (giao dịch) Association (sự kết hợp) và association rule (luật kết hợp) Support (độ hỗ trợ) Confidence (độ tin cậy) Frequent itemset (tập phần tử phổ biến/thường xuyên) Strong association rule (luật kết hợp mạnh) 12 6.1. Tổng quan về khai phá luật kết hợp Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) Itemsets: Item: I4 {I1, I2, I5}, {I2}, … Transaction: T800 13 6.1. Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Item (phần tử) Các phần tử, mẫu, đối tượng đang được quan tâm. J = {I1, I2, …, Im}: tập tất cả m phần tử có thể có trong tập dữ liệu Itemset (tập phần tử) Tập hợp các items Một itemset có k items gọi là kitemset. Transaction (giao dịch) Lần thực hiện tương tác với hệ thống (ví dụ: giao dịch “khách hàng mua hàng”) Liên hệ với một tập T gồm các phần tử được giao dịch 14 6.1. Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Association (sự kết hợp) và association rule (luật kết hợp) Sự kết hợp: các phần tử cùng xuất hiện với nhau trong một hay nhiều giao dịch. Thể hiện mối liên hệ giữa các phần tử/các tập phần tử Luật kết hợp: qui tắc kết hợp có điều kiện giữa các tập phần t ử. Thể hiện mối liên hệ (có điều kiện) giữa các tập phần tử Cho A và B là các tập phần tử, luật kết hợp giữa A và B là A ...
Tìm kiếm theo từ khóa liên quan:
Khai phá dữ liệu Bài giảng Khai phá dữ liệu Data mining Khai phá luật kết hợp Biểu diễn luật kết hợp Phân tích tương quanGợi ý tài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 350 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 230 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 221 0 0 -
17 trang 185 0 0
-
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 169 0 0 -
8 trang 131 0 0
-
4 trang 114 0 0
-
Bài giảng Khai phá dữ liệu: Chương 5 - TS. Võ Thị Ngọc Châu
116 trang 46 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Chương 8 - ĐH Bách khoa TP.HCM
8 trang 44 0 0 -
Phân tích thông tin trong lâm học bằng Statgraphics plus version 3.0 và 5.1: Phần 1
102 trang 44 0 0