Danh mục

Bài giảng Khai phá dữ liệu: Chương 5 - Trường ĐH Phan Thiết

Số trang: 64      Loại file: pdf      Dung lượng: 1.78 MB      Lượt xem: 15      Lượt tải: 0    
10.10.2023

Xem trước 7 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Khai phá dữ liệu: Chương 5 Phân lớp, cung cấp cho người học những kiến thức như: Giới thiệu phân lớp; Các kỹ thuật phân lớp. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu: Chương 5 - Trường ĐH Phan Thiết Chương 5 Phân lớpKHAI PHÁ DỮ LIỆU Nội dung1. Giới thiệu phân lớp2. Các kỹ tuật phân lớp DW DM 284 1. Giới thiệu phân lớp Bài toán phân lớp Đầu vào  Tập dữ liệu D = {di}  Tập các lớp C1, C2, …, Ck mỗi dữ liệu d thuộc một lớp Ci  Tập ví dụ Dexam = D1+D2+ …+ Dk với Di={dDexam: d thuộc C i}  Tập ví dụ Dexam đại diện cho tập D Đầu ra  Mô hình phân lớp: ánh xạ từ D sang C Sử dụng mô hình  d  D Dexam : xác định lớp của đối tượng d DW DM 285 Phân lớp: Quá trình hai pha Xây dựng mô hình: Tìm mô tả cho tập lớp đã có  Cho trước tập lớp C = {C1, C2, …, Ck}  Cho ánh xạ (chưa biết) từ miền D sang tập lớp C  Có tập ví dụ Dexam=D1+D2+ …+ Dk với Di={dDexam: dCi} Dexam được gọi là tập ví dụ mẫu.  Xây dựng ánh xạ (mô hình) phân lớp trên: Dạy bộ phân lớp.  Mô hình: Luật phân lớp, cây quyết định, công thức toán học… Pha 1: Dạy bộ phân lớp  Tách Dexam thành Dtrain (2/3) + Dtest (1/3). Dtrain và Dtest “tính đại diện” cho miền ứng dụng  Dtrain : xây dựng mô hình phân lớp (xác định tham số mô hình)  Dtest : đánh giá mô hình phân lớp (các độ đo hiệu quả)  Chọn mô hình có chất lượng nhất Pha 2: Sử dụng bộ phân lớp DW  d  D Dexam : xác định lớp của d. DM 286Ví dụ phân lớp: Bài toán cho vay Tid Refund Marital Status Taxable Income Cheat 1 No Single 75K No 2 Yes Married 50K No 3 No Single 75K No 4 No Married 150K Yes 5 No Single 40K No 6 No Married 80K Yes 7 No Single 75K No 8 Yes Married 50K No 9 Yes Married 50K No 10 No Married 150K Yes 11 No Single 40K No 12 No Married 150K Yes 13 No Married 80K Yes 14 No Single 40K No DW 15 No Married 80K Yes DM 287Phân lớp: Quá trình hai pha DW DM 288 Phân lớp: Quá trình hai pha Tid Attrib1 Attrib2 Attrib3 Class Learning 1 Yes Large 125K No algorithm 2 No Medium 100K No 3 No Small 70K No 4 Yes Medium 120K No Induction 5 No Large 95K Yes 6 No Medium 60K No 7 Yes Large 220K No Learn 8 No Small 85K Yes Model 9 No Medium 75K No 10 No Small 90K Yes Model10 Training Set Apply Tid Attrib1 Attrib2 Attrib3 Class Model 11 No Small 55K ? 12 Yes Medium 80K ? 13 Yes Large 110K ? Deduction 14 No Small 95K ? 15 No Large 67K ?10 Test Set DW DM 289 Các loại phân lớp– Phân lớp nhị phân/đa lớp Nhị phân: hai lớp (|C| = 2) Đa lớp: số lượng lớp > 2 (|C| > 2)– Phân lớp đơn nhãn/đa nhãn/phân cấp Đơn nhãn: Một đối tượng chỉ thuộc duy nhất một lớp– Đa nhãn: ...

Tài liệu được xem nhiều:

Tài liệu cùng danh mục:

Tài liệu mới: