Danh mục

Bài giảng Trí tuệ nhân tạo - Chương 10: Học máy

Số trang: 23      Loại file: pdf      Dung lượng: 536.67 KB      Lượt xem: 14      Lượt tải: 0    
tailieu_vip

Hỗ trợ phí lưu trữ khi tải xuống: 1,000 VND Tải xuống file đầy đủ (23 trang) 0
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Học (learning) là bất cứ sự thay đổi nào trong một hệ thống cho phép nó tiến hành tốt hơn trong lần thứ hai khi lặp lại cùng một nhiệm vụ hoặc với nhiệm vụ khác từ cùng một quần thể đó. (Herbert Simon). Để nắm bắt được nội dung chi tiết mời các bạn cùng tham khảo "Bài giảng Trí tuệ nhân tạo - Chương 10: Học máy".
Nội dung trích xuất từ tài liệu:
Bài giảng Trí tuệ nhân tạo - Chương 10: Học máy Chương 10: Máy Học 1 Học Máy (Machine Learning)  Học (learning) là bất cứ sự thay ñổi nào trong một hệ thống cho phép nó tiến hành tốt hơn trong lần thứ hai khi lặp lại cùng một nhiệm vụ hoặc với nhiệm vụ khác từ cùng một quần thể ñó. (Herbert Simon)  Học liên quan ñến vấn ñề khái quát hóa từ kinh nghiệm (dữ liệu rèn luyện) => bài toán quy nạp (induction)  Vì dữ liệu rèn luyện thường hạn chế, nên thường khái quát hóa theo một số khía cạnh nào ñó (heuristic) => tính thiên lệch quy nạp (inductive bias)  Có ba tiếp cận học:  Các phương pháp học dựa trên ký hiệu (symbol-based): ID3  Tiếp cận kết nối: Các mạng neuron sinh học  Tiếp cận di truyền hay tiến hóa: giải thuật genetic 2 Cây quyết ñịnh (ID3)  Là một giải thuật học ñơn giản nhưng thành công  Cây quyết ñịnh (Qð) là một cách biểu diễn cho phép chúng ta xác ñịnh phân loại của một ñối tượng bằng cách kiểm tra giá trị của một số thuộc tính.  Giải thuật có:  ðầu vào: Một ñối tượng hay một tập hợp các thuộc tính mô tả một tình huống  ðầu ra: thường là quyết ñịnh yes/no, hoặc các phân loại.  Trong cây quyết ñịnh:  Mỗi nút trong biểu diễn một sự kiểm tra trên một thuộc tính nào ñó, mỗi giá trị có thể của nó tương ñương với một nhánh của cây  Các nút lá thể hiện sự phân loại.  Kích cỡ của cây Qð tùy thuộc vào thứ tự của các kiểm tra trên các thuộc tính. 3 Ví dụ Cây Qð: Chơi Tennis  Mục ñích: học ñể xem có chơi Tennis không?  Cây quyết ñịnh: Quang cảnh nắng Âm u mưa ðộ ẩm Yes Gió cao Trung bình mạnh nhẹ No Yes No Yes 4 Quy nạp cây Qð từ các ví dụ  Ví dụ (hay dữ liệu rèn luyện cho hệ thống) gồm: Giá trị của các thuộc tính + Phân loại của ví dụ Ngày Quang cảnh Nhiệt ñộ ðộ ẩm Gió Chơi Tennis D1 Nắng Nóng Cao nhẹ Không D2 Nắng Nóng Cao Mạnh Không D3 Âm u Nóng Cao Nhẹ Có D4 Mưa ấm áp Cao nhẹ Có D5 Mưa Mát TB nhẹ Có D6 Mưa Mát TB Mạnh Không D7 Âm u Mát TB Mạnh Có D8 Nắng ấm áp Cao nhẹ Không D9 Nắng Mát TB nhẹ Có D10 Mưa ấm áp TB nhẹ Có D11 Nắng ấm áp TB Mạnh Có D12 Âm u ấm áp Cao Mạnh Có D13 Âm u Nóng TB nhẹ Có 5 D14 Mưa ấm áp Cao Mạnh không Làm sao ñể học ñược cây Qð  Tiếp cận ñơn giản  Học một cây mà có một lá cho mỗi ví dụ.  Học thuộc lòng một cách hoàn toàn các ví dụ.  Có thể sẽ không thực hiện tốt trong các trường hợp khác.  Tiếp cận tốt hơn:  Học một cây nhỏ nhưng chính xác phù hợp với các ví dụ  Occam’s razor – cái ñơn giản thường là cái tốt nhất! Giả thuyết có khả năng nhất là giả thuyết ñơn giản nhất thống nhất với tất cả các quan sát. 6 Xây dựng cây Qð: Trên - xuống Vòng lặp chính: 1. A Các khả năng có thể của nút con  Các ví dụ có cả âm và dương:  Tách một lần nữa  Tất cả các ví dụ còn lại ñều âm hoặc ñều dương  trả về cây quyết ñịnh  Không còn ví dụ nào  trả về mặc nhiên  Không còn thuộc tính nào (nhiễu)  Quyết ñịnh dựa trên một luật nào ñó (luật ña số) 8 +: D3, D4, D5, D7, D9, D10, D11, D12, D13 -: D1, D2, D6, D8, D14 Quang cảnh? Nắng Âm u Mưa +: D9, D11 +: D3, D7, D12, D13 +: D4, D5, D10 -: D1, D2, D8 -: -: D6, D14 +: D3, D4, D5, D7, D9, D10, D11, D12, D13 -: D1, D2, D6, D8, D14 ðộ ẩm? Cao Trung bình +: D3, D4, D12 +: D5, D9, D10, D11, D13 -: D1, D2, D8, D14 -: D6 9 +: D3, D4, D5, D7, D9, D10, D11, D12, D13 -: D1, D2, D6, D8, D14 Quang cảnh? Nắng Âm u Mưa +: D9, D11 +: D3, D7, D12, D13 +: D4, D5, D10 -: D1, D2, D8 -: -: D6, D14 ðộ ẩm? Yes Gió? Cao Mạnh Nhẹ TB +: +: D9, D11 +: +: D4, D5, D10 -: D1, D2, D8 -: -: D6, D14 -: No Yes No Yes 10 ID3 xây dựng cây Qð theo giải thuật sau: 11 ðánh giá hiệu suất  Chúng ta muốn có một cây Qð có thể phân loại ñúng một ví dụ mà nó chưa từng thấy qua.  Việc học sử dụng một “tập rèn luyện” (traning set), và  Việc ñánh giá hiệu suất sử dụng một “tập kiểm tra” (test set): ...

Tài liệu được xem nhiều: