Bài giảng Học máy (IT 4862): Chương 4.1 - Nguyễn Nhật Quang
Số trang: 17
Loại file: pdf
Dung lượng: 355.99 KB
Lượt xem: 18
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Chương 4 - Các phương pháp học có giám sát (học dựa trên các láng giềng gần nhất). Chương này trình bày những nội dung chính sau: Các khái niệm, các ví dụ về bài toán phân lớp, giải thuật phân lớp, giải thuật dự đoán, hàm tính khoảng cách, chuẩn háo miền giá trị thuộc tính,... Mời các bạn cùng tham khảo nội dung chi tiết.
Nội dung trích xuất từ tài liệu:
Bài giảng Học máy (IT 4862): Chương 4.1 - Nguyễn Nhật Quang Học Máy (IT 4862) Nguyễn ễ Nhật hậ Quang quangnn-fit@mail.hut.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin và truyền thông Năm học 2011-2012 Nội dung d môn ô học: h Giới thiệu chung g Đánh giá hiệu năng hệ thống học máy Các phương pháp học dựa trên xác suất Các phương pháp học có giám sát Học dựa trên các láng giềng gần nhất (Nearest neighbors learning) Các p phương gp pháp p học không gg giám sát Lọc cộng tác Học tăng cường Học Máy – IT 4862 2 Học dựa trên các láng giềng gần nhất Một số tên gọi khác của phương pháp học dựa trên các láng giềng gần nhất (Nearest neighbors learning) • Instance-based learning • Lazy learning • Memory Memory-based based learning Ý tưởng của phương pháp học dựa trên các láng giềng gần nhất ộ tập ập các ví dụ ụ học ọ • Với một ─ ─ (Đơn giản là) lưu lại các ví dụ học Chưa xây dựng một mô hình (mô tả) rõ ràng và tổng quát của hàm mục tiêu cần học • Đối với một ví dụ cần phân loại/dự đoán ─ Xét quan hệ giữa ví dụ đó với các ví dụ học để gán giá trị của hàm mục tiêu (một nhãn lớp, hoặc một giá trị thực) Học Máy – IT 4862 3 Học dựa trên các láng giềng gần nhất Biểu diễn đầu vào của bài toán • Mỗi ví dụ x được biểu diễn là một vectơ n chiều trong g không gg gian các vectơ X∈Rn • x = (x1,x2,…,xn), trong đó xi (∈R) là một số thực C thể Có ể áp dụng được với cả ả 2 kiểu ể bài toán học • Bài toán phân lớp (classification) Hàm mục ụ tiêu có g giá trịị rời rạc ạ ((a discrete-valued target g function)) ─ Đầu ra của hệ thống là một trong số các giá trị rời rạc đã xác định trước (một trong các nhãn lớp) ─ • Bài toán dự đoán/hồi quy (prediction/regression) Hàm mục tiêu có giá trị liên tục (a continuous-valued target function) ─ Đầu ra của hệ thống là một giá trị số thực ─ Học Máy – IT 4862 4 Ví dụ bài toán p phân lớp p Xét 1 láng giềng gần nhất → Gán z vào lớp c2 Xét 3 láng giềng gần nhất → Gán z vào lớp c1 Xét 5 láng giềng gần nhất → Gán z vào lớp c1 Học Máy – IT 4862 Lớp c1 Lớp c2 Ví dụ cần phân lớp z 5
Nội dung trích xuất từ tài liệu:
Bài giảng Học máy (IT 4862): Chương 4.1 - Nguyễn Nhật Quang Học Máy (IT 4862) Nguyễn ễ Nhật hậ Quang quangnn-fit@mail.hut.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin và truyền thông Năm học 2011-2012 Nội dung d môn ô học: h Giới thiệu chung g Đánh giá hiệu năng hệ thống học máy Các phương pháp học dựa trên xác suất Các phương pháp học có giám sát Học dựa trên các láng giềng gần nhất (Nearest neighbors learning) Các p phương gp pháp p học không gg giám sát Lọc cộng tác Học tăng cường Học Máy – IT 4862 2 Học dựa trên các láng giềng gần nhất Một số tên gọi khác của phương pháp học dựa trên các láng giềng gần nhất (Nearest neighbors learning) • Instance-based learning • Lazy learning • Memory Memory-based based learning Ý tưởng của phương pháp học dựa trên các láng giềng gần nhất ộ tập ập các ví dụ ụ học ọ • Với một ─ ─ (Đơn giản là) lưu lại các ví dụ học Chưa xây dựng một mô hình (mô tả) rõ ràng và tổng quát của hàm mục tiêu cần học • Đối với một ví dụ cần phân loại/dự đoán ─ Xét quan hệ giữa ví dụ đó với các ví dụ học để gán giá trị của hàm mục tiêu (một nhãn lớp, hoặc một giá trị thực) Học Máy – IT 4862 3 Học dựa trên các láng giềng gần nhất Biểu diễn đầu vào của bài toán • Mỗi ví dụ x được biểu diễn là một vectơ n chiều trong g không gg gian các vectơ X∈Rn • x = (x1,x2,…,xn), trong đó xi (∈R) là một số thực C thể Có ể áp dụng được với cả ả 2 kiểu ể bài toán học • Bài toán phân lớp (classification) Hàm mục ụ tiêu có g giá trịị rời rạc ạ ((a discrete-valued target g function)) ─ Đầu ra của hệ thống là một trong số các giá trị rời rạc đã xác định trước (một trong các nhãn lớp) ─ • Bài toán dự đoán/hồi quy (prediction/regression) Hàm mục tiêu có giá trị liên tục (a continuous-valued target function) ─ Đầu ra của hệ thống là một giá trị số thực ─ Học Máy – IT 4862 4 Ví dụ bài toán p phân lớp p Xét 1 láng giềng gần nhất → Gán z vào lớp c2 Xét 3 láng giềng gần nhất → Gán z vào lớp c1 Xét 5 láng giềng gần nhất → Gán z vào lớp c1 Học Máy – IT 4862 Lớp c1 Lớp c2 Ví dụ cần phân lớp z 5
Tìm kiếm theo từ khóa liên quan:
Giải thuật phân lớp Miền giá trị thuộc tính Bài giảng Học máy Phương pháp học có giám sát Láng giềng gần nhất Bài toán phân lớpGợi ý tài liệu liên quan:
-
Một số bất đẳng thức về lỗi phân lớp đối với bài toán phân lớp nhị phân
4 trang 30 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 5 - Nguyễn Nhật Quang
24 trang 29 0 0 -
Bài giảng Học máy: Bài 1 - Nguyễn Hoàng Long
0 trang 25 0 0 -
Bài giảng Học máy: Bài 7 - Nguyễn Hoàng Long
0 trang 22 0 0 -
Bài giảng Học máy (IT 4862): Chương 4.3 - Nguyễn Nhật Quang
30 trang 21 0 0 -
Bài giảng Khai phá dữ liệu: Chương 5 - Trường ĐH Phan Thiết
64 trang 21 0 0 -
Bài giảng Học máy (IT 4862): Chương 4.2 - Nguyễn Nhật Quang
37 trang 20 0 0 -
Bài giảng Học máy: Bài 4 - Nguyễn Hoàng Long
0 trang 19 0 0 -
Bài giảng Học máy: Bài 6 - Nguyễn Hoàng Long
0 trang 18 0 0 -
Thuật toán Nearmiss-SF cho bài toán phân lớp dữ liệu mất cân bằng và có số chiều lớn
7 trang 18 0 0