DATA MINING AND APPLICATION: BÀI TOÁN KHAI THÁC
Số trang: 25
Loại file: pdf
Dung lượng: 449.82 KB
Lượt xem: 16
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
QUI TRÌNH B0 : cây FP B1 : (conditional pattern bases) cho nút trên cây FP). B2 : cây FP (conditional FP tree) B3 : Khai thác qui cây FP và phát cho khi cây FP 1 duy ra các
Nội dung trích xuất từ tài liệu:
DATA MINING AND APPLICATION: BÀI TOÁN KHAI THÁC KHAI THÁC (DATA MINING) 1 BÀ I 3 - PH N 2 KHAI THÁCT P PH BI N & LU T K T H P 2 1N I DUNG1.2.3. 3 Bài toán khai thác là bài toán quan KTDL : ra tính quan DL các con là bao Bài toán khai thác LKH là bài toán X Y (X, Y I và X Y ={}) supp (X Y ) minsupp conf (X Y ) minconf 4 2Bài toán khai thác là bài toán tìm các các S (hay S) có mãn minsupp supp(S) minsuppCách : trên tính Tìm theo : toán Apriori (1994) Phát : toán FP-Growth (2000) Tìm trên CSDL hàng : toán 5 Charm (2002) CSDLKhi khai thác các dài CSDL và viênVí : tìm i1 i2 i100 : 100-1 = 1.27*1030 ! : viên và tra 6 3N I DUNG 1. 2. -Growth 3. 7 -GROWTH1. Khai thác không hàm viên. Nén CSDL thành trúc cây FP (Frequent Patern) qui cây FP 8 4 -GROWTH2. QUI TRÌNH B0 : cây FP B1 : (conditional pattern bases) cho nút trên cây FP). B2 : cây FP (conditional FP tree) B3 : Khai thác qui cây FP và phát cho khi cây FP 1 duy - ra các 9 B0) TID Items bought (ordered) frequent items {f, a, c, d, g, i, m, p} {f, c, a, m, p} 100 {a, b, c, f, l, m, o} {f, c, a, b, m} 200 minsupp = 60% {b, f, h, j, o, w} {f, b} 300 {b, c, k, s, p} {c, b, p} 400 {a, f, c, e, l, p, m, n} {f, c, a, m, p} 500 1. Tìm 1- Header Table CSDL 1 Item frequency head 2. f 4 vào trong F-list c 4 a 3 F-list=f-c-a-b-m-p b 3 m 3 3. CSDL theo F- p 3 list. CSDL và cây FP 10 5 (B0) TID Items bought (ordered) frequent items minsupp = 3 {f, a, c, d, g, i, m, p} {f, c, a, m, p} 100 {a, b, c, f, l, m, o} {f, c, a, b, m} 200 {b, f, h, j, o, w} {f, b} 300 {b, c, k, s, p} {c, b, p} 400 {a, f, c, e, l, p, m, n} {f, c, a, m, p} 500 {}1. Tìm 1- Header Table CSDL 1 f:1 Item frequency head f 4 c:12. c 4 vào trong F- a 3 a:1 b 3 list m 3 F-list=f-c-a-b-m-p ...
Nội dung trích xuất từ tài liệu:
DATA MINING AND APPLICATION: BÀI TOÁN KHAI THÁC KHAI THÁC (DATA MINING) 1 BÀ I 3 - PH N 2 KHAI THÁCT P PH BI N & LU T K T H P 2 1N I DUNG1.2.3. 3 Bài toán khai thác là bài toán quan KTDL : ra tính quan DL các con là bao Bài toán khai thác LKH là bài toán X Y (X, Y I và X Y ={}) supp (X Y ) minsupp conf (X Y ) minconf 4 2Bài toán khai thác là bài toán tìm các các S (hay S) có mãn minsupp supp(S) minsuppCách : trên tính Tìm theo : toán Apriori (1994) Phát : toán FP-Growth (2000) Tìm trên CSDL hàng : toán 5 Charm (2002) CSDLKhi khai thác các dài CSDL và viênVí : tìm i1 i2 i100 : 100-1 = 1.27*1030 ! : viên và tra 6 3N I DUNG 1. 2. -Growth 3. 7 -GROWTH1. Khai thác không hàm viên. Nén CSDL thành trúc cây FP (Frequent Patern) qui cây FP 8 4 -GROWTH2. QUI TRÌNH B0 : cây FP B1 : (conditional pattern bases) cho nút trên cây FP). B2 : cây FP (conditional FP tree) B3 : Khai thác qui cây FP và phát cho khi cây FP 1 duy - ra các 9 B0) TID Items bought (ordered) frequent items {f, a, c, d, g, i, m, p} {f, c, a, m, p} 100 {a, b, c, f, l, m, o} {f, c, a, b, m} 200 minsupp = 60% {b, f, h, j, o, w} {f, b} 300 {b, c, k, s, p} {c, b, p} 400 {a, f, c, e, l, p, m, n} {f, c, a, m, p} 500 1. Tìm 1- Header Table CSDL 1 Item frequency head 2. f 4 vào trong F-list c 4 a 3 F-list=f-c-a-b-m-p b 3 m 3 3. CSDL theo F- p 3 list. CSDL và cây FP 10 5 (B0) TID Items bought (ordered) frequent items minsupp = 3 {f, a, c, d, g, i, m, p} {f, c, a, m, p} 100 {a, b, c, f, l, m, o} {f, c, a, b, m} 200 {b, f, h, j, o, w} {f, b} 300 {b, c, k, s, p} {c, b, p} 400 {a, f, c, e, l, p, m, n} {f, c, a, m, p} 500 {}1. Tìm 1- Header Table CSDL 1 f:1 Item frequency head f 4 c:12. c 4 vào trong F- a 3 a:1 b 3 list m 3 F-list=f-c-a-b-m-p ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Khai thác dữ liệu và ứng dụng giáo trình bài giảng giáo án thực hành bài tập thực hành đồ án cuối kỳGợi ý tài liệu liên quan:
-
Giáo trình bài giảng: Cơ sở lý luận và các loại hình báo chí truyền thông
101 trang 98 1 0 -
Giáo trình bài giảng: Giao tiếp chuyên nghiệp trong truyền thông
79 trang 81 1 0 -
9 trang 62 0 0
-
74 trang 26 0 0
-
11 trang 25 0 0
-
DATA MINING AND APPLICATION: ĐỀ THI CUỐI KỲ
4 trang 22 0 0 -
Giáo trình Beginning DirectX9: Phần 2
83 trang 22 0 0 -
Giáo trình bài giảng Truyền dẫn số
174 trang 22 0 0 -
Bài tập thực hành môn học Tin học trong phân tích kết cấu - CSI ETABS
87 trang 21 0 0 -
DATA MINING AND APPLICATION: TỔNG QUAN
13 trang 21 0 0