Bài giảng Khai phá dữ liệu (Data mining) - Chương 3: Khai phá luật kết hợp
Số trang: 81
Loại file: pdf
Dung lượng: 1.65 MB
Lượt xem: 15
Lượt tải: 0
Xem trước 9 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Khai phá luật kết hợp được xem như là một trong những đóng góp quan trọng nhất từ cộng đồng cơ sở dữ liệu trong việc khám phá tri thức. Trong chương 3 chúng ta sẽ tìm hiểu một số nội dung chính liên quan đến quá trình khai phá luật kết hợp. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu (Data mining) - Chương 3: Khai phá luật kết hợpChương 3: Khai phá luật kết hợp 1 Nội dung Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Bài toán khai phá luật kết hợp Phân tích tương quan Tóm tắt 2 Nội dung Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Bài toán khai phá luật kết hợp Phân tích tương quan Tóm tắt 3Tình huống 1 – Market basketanalysis 4Tình huống 2 - Tiếp thị chéo 5Tình huống 2 - Tiếp thị chéo 6Tình huống … Phân tích dữ liệu giỏ hàng (basket data analysis) Tiếp thị chéo (cross-marketing) Thiết kế catalog (catalog design) Phân loại dữ liệu (classification) và gom cụm dữ liệu (clustering) với các mẫu phổ biến … 7Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre- Relationship Post- processing Mining processing s amongRaw Data Items of Interest Items User (Rules) 8 Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre- Relationship Post- processing Mining s among processing Raw Data Items of Interest Items User (Rules) Transactional/ Association Items Relational Data RulesTransaction Items_bought A, B, C, D, F, A C (50%, 66.6%) …--------------------------------- … 2000 A, B, C 1000 A, C Khai phá tập phổ biến(FIs Sinh luật từ các tập phổ 4000 A, D – Frequent Itemsets). biến(ARs – Association 5000 B, E, F Rules). … Bài toán phân tích giỏ thị trường 9 Nội dung Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Bài toán khai phá luật kết hợp Phân tích tương quan Tóm tắt 10Các khái niệm cơ bản Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) 11Các khái niệm cơ bản Các khái niệm cơ bản - Item (phần tử) - Itemset (tập phần tử) - Transaction (giao dịch) - Association (sự kết hợp) và association rule (luật kết hợp) - Support (độ hỗ trợ) - Confidence (độ tin cậy) - Frequent itemset (tập phần tử phổ biến/thường xuyên) - Strong association rule (luật kết hợp mạnh) 12Các khái niệm cơ bản Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) Itemsets: Item: I4 {I1, I2, I5}, {I2}, … Transaction: T800 13Các khái niệm cơ bản Các khái niệm cơ bản - Item (phần tử) Các phần tử, mẫu, đối tượng đang được quan tâm. J = {I1, I2, …, Im}: tập tất cả m phần tử có thể có trong tập dữ liệu - Itemset (tập phần tử) Tập hợp các items Một itemset có k items gọi là k-itemset. - Transaction (giao dịch) Lần thực hiện tương tác với hệ thống (ví dụ: giao dịch “khách hàng mua hàng”) Liên hệ với một tập T gồm các phần tử được giao dịch 14Các khái niệm cơ bản Các khái niệm cơ bản - Association (sự kết hợp) và association rule (luật kết hợp) Sự kết hợp: các phần tử cùng xuất hiện với nhau trong một hay nhiều giao dịch. Thể hiện mối liên hệ giữa các phần tử/các tập phần tử Luật kết hợp: qui tắc kết hợp có điều kiện giữa các tập phần tử. Thể hiện mối liên hệ (có điều kiện) giữa các tập phần tử Cho A và B là các tập phần tử, luật kết hợp giữa A và B l ...
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu (Data mining) - Chương 3: Khai phá luật kết hợpChương 3: Khai phá luật kết hợp 1 Nội dung Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Bài toán khai phá luật kết hợp Phân tích tương quan Tóm tắt 2 Nội dung Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Bài toán khai phá luật kết hợp Phân tích tương quan Tóm tắt 3Tình huống 1 – Market basketanalysis 4Tình huống 2 - Tiếp thị chéo 5Tình huống 2 - Tiếp thị chéo 6Tình huống … Phân tích dữ liệu giỏ hàng (basket data analysis) Tiếp thị chéo (cross-marketing) Thiết kế catalog (catalog design) Phân loại dữ liệu (classification) và gom cụm dữ liệu (clustering) với các mẫu phổ biến … 7Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre- Relationship Post- processing Mining processing s amongRaw Data Items of Interest Items User (Rules) 8 Tổng quan về khai phá luật kết hợp Quá trình khai phá luật kết hợp Pre- Relationship Post- processing Mining s among processing Raw Data Items of Interest Items User (Rules) Transactional/ Association Items Relational Data RulesTransaction Items_bought A, B, C, D, F, A C (50%, 66.6%) …--------------------------------- … 2000 A, B, C 1000 A, C Khai phá tập phổ biến(FIs Sinh luật từ các tập phổ 4000 A, D – Frequent Itemsets). biến(ARs – Association 5000 B, E, F Rules). … Bài toán phân tích giỏ thị trường 9 Nội dung Tổng quan về khai phá luật kết hợp Các khái niệm cơ bản Bài toán khai phá luật kết hợp Phân tích tương quan Tóm tắt 10Các khái niệm cơ bản Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) 11Các khái niệm cơ bản Các khái niệm cơ bản - Item (phần tử) - Itemset (tập phần tử) - Transaction (giao dịch) - Association (sự kết hợp) và association rule (luật kết hợp) - Support (độ hỗ trợ) - Confidence (độ tin cậy) - Frequent itemset (tập phần tử phổ biến/thường xuyên) - Strong association rule (luật kết hợp mạnh) 12Các khái niệm cơ bản Dữ liệu mẫu của AllElectronics (sau quá trình tiền xử lý) Itemsets: Item: I4 {I1, I2, I5}, {I2}, … Transaction: T800 13Các khái niệm cơ bản Các khái niệm cơ bản - Item (phần tử) Các phần tử, mẫu, đối tượng đang được quan tâm. J = {I1, I2, …, Im}: tập tất cả m phần tử có thể có trong tập dữ liệu - Itemset (tập phần tử) Tập hợp các items Một itemset có k items gọi là k-itemset. - Transaction (giao dịch) Lần thực hiện tương tác với hệ thống (ví dụ: giao dịch “khách hàng mua hàng”) Liên hệ với một tập T gồm các phần tử được giao dịch 14Các khái niệm cơ bản Các khái niệm cơ bản - Association (sự kết hợp) và association rule (luật kết hợp) Sự kết hợp: các phần tử cùng xuất hiện với nhau trong một hay nhiều giao dịch. Thể hiện mối liên hệ giữa các phần tử/các tập phần tử Luật kết hợp: qui tắc kết hợp có điều kiện giữa các tập phần tử. Thể hiện mối liên hệ (có điều kiện) giữa các tập phần tử Cho A và B là các tập phần tử, luật kết hợp giữa A và B l ...
Tìm kiếm theo từ khóa liên quan:
Khai phá dữ liệu Bài giảng Khai phá dữ liệu Data mining Khai phá luật kết hợp Tiếp thị chéo Phân loại luật kết hợpGợi ý tài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 351 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 230 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 222 0 0 -
17 trang 186 0 0
-
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 170 0 0 -
8 trang 131 0 0
-
4 trang 115 0 0
-
Bài giảng Khai phá dữ liệu: Chương 5 - TS. Võ Thị Ngọc Châu
116 trang 48 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Chương 8 - ĐH Bách khoa TP.HCM
8 trang 45 0 0 -
68 trang 44 0 0