Bài giảng Cây quyết định (ID3) và học quy nạp (ILA) - Tô Hoài Việt
Số trang: 27
Loại file: ppt
Dung lượng: 496.50 KB
Lượt xem: 5
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Cây quyết định (ID3) và học quy nạp (ILA) - Tô Hoài Việt giới thiệu đến bạn đọc những nội dung về: Cây quyết địnhHọc cây quyết định–thuật toán ID3, biểu diễn tri thức bằng luật, rút luật từ cây quyết định, thuật toán học quy nạp.
Nội dung trích xuất từ tài liệu:
Bài giảng Cây quyết định (ID3) và học quy nạp (ILA) - Tô Hoài ViệtCây quyết định (ID3) và Học Quy nạp (ILA) Tô Hoài Việt Khoa Công nghệ Thông tin Đại học Khoa học Tự nhiên TPHCM thviet@fit.hcmuns.edu.vn Trang 1 Nội dung• Cây quyết định• Học cây quyết định – Thuật toán ID3• Biểu diễn tri thức bằng luật• Rút luật từ cây quyết định• Thuật toán học quy nạp Trang 2Cây quyết định Cây quyết định biểu diễn: • Mỗi nút trong kiểm tra một thuộc tính • Mỗi nhánh tương ứng với giá trị thuộc tính • Mỗi nút lá được gán một phân lớp Định luật Occam: những cây đơn giản là những cây quyết định tốt hơn Trang 3 Thuật toán học ID3Được phát triển đồng thời bởi Quinlan trong AI và Breiman, Friedman, Olsen và Stone trong thống kêLặp: 1. Chọn A thuộc tính quyết định “tốt nhất” cho nút kế tiếp 2. Gán A là thuộc tính quyết định cho nút 3. Với mỗi giá trị của A, tạo nhánh con mới của nút 4. Phân loại các mẫu huấn luyện cho các nút lá 5. Nếu các mẫu huấn luyện được phân loại hoàn toàn thì NGƯNG, Ngược lại, lặp với các nút lá mới.Thuộc tính tốt nhất là gì? Trang 4 Entropy• S là tập các mẫu huấn luyện• p là tỷ lệ các mẫu dương trong S• H – p.log2p – (1 – p).log2(1 – p) Trang 5 Thuật toán học ID3Được phát triển đồng thời bởi Quinlan trong AI và Breiman, Friedman, Olsen và Stone trong thống kêLặp: 1. Chọn A thuộc tính quyết định “tốt nhất” cho nút kế tiếp 2. Gán A là thuộc tính quyết định cho nút 3. Với mỗi giá trị của A, tạo nhánh con mới của nút 4. Phân loại các mẫu huấn luyện cho các nút lá 5. Nếu các mẫu huấn luyện được phân loại hoàn toàn thì NGƯNG, Ngược lại, lặp với các nút lá mới.Thuộc tính tốt nhất sẽ làm tối thiểu hoá entropy trung bình của dữ liệu trong các nút con Trang 6Ví dụ Huấn luyện Trang 7 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- 4+,0- 2+,3- H = 0.971 H=0 H = 0.971Hrain = – 3/5.log23/5 – 2/5.log22/5 = 0.442 + 0.529 = 0.971Hovercast = – 4/4.log24/4 – 0/4.log20/4 = 0 + 0 = 0Hsunny = – 2/5.log22/5 – 3/5.log23/5 = 0.529 + 0.442 = 0.971 AE ( ĐHLTB ) pv H Av v Value ( A ) Trang 8 Ví dụ (tt) Outlook Temparature Rain Sunny Hot Cool Overcast Mild 3+,2- 4+,0- 2+,3- 2+,2- 4+,2- 3+,1-H = 0.971 H=0 H = 0.971 H=1 H = 0.918 H = 0.811AE = 5/14*.971 + 4/14*0 + 5/14*.971 AE = 4/14*1 + 6/14*.918 + 4/14*.811 = 0.694 = 0.911 Trang 9 Ví dụ (tt) Humidity Wind High Normal Weak Strong 3+,4- 6+,1- 6+,2- 3+,3-H = 0.985 H = 0.592 H = 0.811 H=1AE = 7/14*.985 + 7/14*.592 AE = 8/14*.811 + 6/14*1 = 0.788 = 0.892 Chọn Outlook là thuộc tính quyết định Trang 10 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- Yes 2+,3-Chọn thuộc tính gì tiếp theo?Tiếp tục thực hiện việc phân chia Trang 11 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- Yes 2+,3-AE (Rain, Temperature) = 2/5*1 + 3/5*.918 = 0.951AE (Rain, Humidity) = 2/5*1 + 3/5*.918 = 0.951AE (Rain, Wind) = 2/5*0 + 3/5*0 = 0 Trang 12 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- Yes 2+,3-AE (Sunny, Temperature) = 2/5*0 + 2/5*1 + 1/5*0= 0.4AE (Sunny, Humidity) = 2/5*0 + 3/5*0 = 0AE (Sunny, Wind) = 2/5*1 + 3/5*.918 = 0.951 Trang 13 Ví dụ (tt) Outlook Rain Sunny Overcast Wind Yes HumidityWeak Strong Normal HighYes Yes No No Trang 14 Tri thức dạng luật• Tri thức được biểu diễn dưới dạng luật: IF Điều kiện 1 ^ Điều kiện 2… THEN Kết luận• Dễ hiểu với con người, được sử dụng chủ yếu trong các hệ chuyên gia• Rút luật từ cây quyết định: đi từ nút gốc đến nút lá, lấy các phép thử làm tiền đề và phân loại của nút lá làm kết quả Trang 15 Rút luật từ cây quyết định ...
Nội dung trích xuất từ tài liệu:
Bài giảng Cây quyết định (ID3) và học quy nạp (ILA) - Tô Hoài ViệtCây quyết định (ID3) và Học Quy nạp (ILA) Tô Hoài Việt Khoa Công nghệ Thông tin Đại học Khoa học Tự nhiên TPHCM thviet@fit.hcmuns.edu.vn Trang 1 Nội dung• Cây quyết định• Học cây quyết định – Thuật toán ID3• Biểu diễn tri thức bằng luật• Rút luật từ cây quyết định• Thuật toán học quy nạp Trang 2Cây quyết định Cây quyết định biểu diễn: • Mỗi nút trong kiểm tra một thuộc tính • Mỗi nhánh tương ứng với giá trị thuộc tính • Mỗi nút lá được gán một phân lớp Định luật Occam: những cây đơn giản là những cây quyết định tốt hơn Trang 3 Thuật toán học ID3Được phát triển đồng thời bởi Quinlan trong AI và Breiman, Friedman, Olsen và Stone trong thống kêLặp: 1. Chọn A thuộc tính quyết định “tốt nhất” cho nút kế tiếp 2. Gán A là thuộc tính quyết định cho nút 3. Với mỗi giá trị của A, tạo nhánh con mới của nút 4. Phân loại các mẫu huấn luyện cho các nút lá 5. Nếu các mẫu huấn luyện được phân loại hoàn toàn thì NGƯNG, Ngược lại, lặp với các nút lá mới.Thuộc tính tốt nhất là gì? Trang 4 Entropy• S là tập các mẫu huấn luyện• p là tỷ lệ các mẫu dương trong S• H – p.log2p – (1 – p).log2(1 – p) Trang 5 Thuật toán học ID3Được phát triển đồng thời bởi Quinlan trong AI và Breiman, Friedman, Olsen và Stone trong thống kêLặp: 1. Chọn A thuộc tính quyết định “tốt nhất” cho nút kế tiếp 2. Gán A là thuộc tính quyết định cho nút 3. Với mỗi giá trị của A, tạo nhánh con mới của nút 4. Phân loại các mẫu huấn luyện cho các nút lá 5. Nếu các mẫu huấn luyện được phân loại hoàn toàn thì NGƯNG, Ngược lại, lặp với các nút lá mới.Thuộc tính tốt nhất sẽ làm tối thiểu hoá entropy trung bình của dữ liệu trong các nút con Trang 6Ví dụ Huấn luyện Trang 7 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- 4+,0- 2+,3- H = 0.971 H=0 H = 0.971Hrain = – 3/5.log23/5 – 2/5.log22/5 = 0.442 + 0.529 = 0.971Hovercast = – 4/4.log24/4 – 0/4.log20/4 = 0 + 0 = 0Hsunny = – 2/5.log22/5 – 3/5.log23/5 = 0.529 + 0.442 = 0.971 AE ( ĐHLTB ) pv H Av v Value ( A ) Trang 8 Ví dụ (tt) Outlook Temparature Rain Sunny Hot Cool Overcast Mild 3+,2- 4+,0- 2+,3- 2+,2- 4+,2- 3+,1-H = 0.971 H=0 H = 0.971 H=1 H = 0.918 H = 0.811AE = 5/14*.971 + 4/14*0 + 5/14*.971 AE = 4/14*1 + 6/14*.918 + 4/14*.811 = 0.694 = 0.911 Trang 9 Ví dụ (tt) Humidity Wind High Normal Weak Strong 3+,4- 6+,1- 6+,2- 3+,3-H = 0.985 H = 0.592 H = 0.811 H=1AE = 7/14*.985 + 7/14*.592 AE = 8/14*.811 + 6/14*1 = 0.788 = 0.892 Chọn Outlook là thuộc tính quyết định Trang 10 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- Yes 2+,3-Chọn thuộc tính gì tiếp theo?Tiếp tục thực hiện việc phân chia Trang 11 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- Yes 2+,3-AE (Rain, Temperature) = 2/5*1 + 3/5*.918 = 0.951AE (Rain, Humidity) = 2/5*1 + 3/5*.918 = 0.951AE (Rain, Wind) = 2/5*0 + 3/5*0 = 0 Trang 12 Ví dụ (tt) Outlook Rain Sunny Overcast 3+,2- Yes 2+,3-AE (Sunny, Temperature) = 2/5*0 + 2/5*1 + 1/5*0= 0.4AE (Sunny, Humidity) = 2/5*0 + 3/5*0 = 0AE (Sunny, Wind) = 2/5*1 + 3/5*.918 = 0.951 Trang 13 Ví dụ (tt) Outlook Rain Sunny Overcast Wind Yes HumidityWeak Strong Normal HighYes Yes No No Trang 14 Tri thức dạng luật• Tri thức được biểu diễn dưới dạng luật: IF Điều kiện 1 ^ Điều kiện 2… THEN Kết luận• Dễ hiểu với con người, được sử dụng chủ yếu trong các hệ chuyên gia• Rút luật từ cây quyết định: đi từ nút gốc đến nút lá, lấy các phép thử làm tiền đề và phân loại của nút lá làm kết quả Trang 15 Rút luật từ cây quyết định ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Cây quyết định Thuật toán ID3 Bài giảng Cây quyết định học quy nạp Biểu diễn tri thức bằng luật Cây quyết định ID3 Học quy nạp ILAGợi ý tài liệu liên quan:
-
9 trang 28 0 0
-
Bài giảng Trí tuệ nhân tạo: Bài 12 - Trương Xuân Nam
44 trang 23 0 0 -
Mô hình cây quyết định và ứng dụng trong 'mũi nhân tạo' để nhận dạng đối tượng từ mùi vị
5 trang 20 0 0 -
Bài giảng Trí tuệ nhân tạo: Biểu diễn tri thức - Nguyễn Nhật Quang
51 trang 17 0 0 -
Bài giảng Trí tuệ nhân tạo (Tuần 6)
6 trang 16 0 0 -
Bài giảng Trí tuệ nhân tạo - Chương 10: Học máy
23 trang 13 0 0 -
Luận văn: Hỗ trợ chẩn đoán tự động tổn thương xuất huyết/tụ máu dựa vào ảnh ct não
84 trang 12 0 0 -
Luận văn thạc sĩ: Ứng dụng hệ trợ giúp quyết định trong tiếp thị trực tuyến
13 trang 11 0 0 -
Luận văn thạc sĩ: Ứng dụng hệ trợ giúp quyết định trong dự báo kết quả học tập của học sinh THCS
26 trang 10 0 0 -
26 trang 2 0 0