Bài giảng Khai phá dữ liệu: Bài 4 - Văn Thế Thành
Số trang: 14
Loại file: pdf
Dung lượng: 206.15 KB
Lượt xem: 22
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng "Khai phá dữ liệu - Bài 4: Phân lớp Classification" giới thiệu tới người đọc các kiến thức tổng quan phân lớp là gì, dự báo là gì, giới thiệu cây quyết định, phân lớp kiểu Bayes, những phương pháp phân lớp khác, độ chính xác trong phân lớp. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu: Bài 4 - Văn Thế ThànhBài 4:Phân lớp - ClassificationPhân Khai phá dữ liệu 1 Phân lớp và dự báo Tổng quan • Phân lớp là gì? Dự báo là gì? • Giới thiệ Giớ thiệu cây quyế quyết định • Phân lớp kiể kiểu Bayes • Những phương phá Nhữ pháp phân lớp khá khác • Độ chí ch í nh x á c trong phân l ớ p • Tóm tắt Khai phá dữ liệu 2 Phân lớp là gì? • Mục đích: ch: để dự đoán những nhãn phân lớp cho các bộ dữ liệu/mẫu mới • Đầu vào: một tập các mẫu dữ liệu huấn luyện, với một nhãn phân lớp cho mỗi mẫu dữ liệu • Đầu ra: ra: mô hình (bộ phân lớp) dựa trên tập huấn luyện và những nhãn phân lớp Khai phá dữ liệu 3 1 Một số số ứng dụng phân lớp tiêu biểu tiêu biể • dụng Tín dụ • Tiếp thị Tiế thị • Chẩn đoá Chẩ đoán y khoa • Phân hiệu quả Phân tích hiệ quả điề điều trị trị Khai phá dữ liệu 4 Dự đoá đoán là gì? • Tương tự với phân lớp o xây dựng một mô hình o sử dụng mô hình để dự đoán cho những giá trị chưa biết • Phương thứ thức chủ chủ đạo: Giậ Giật lùi o hồi quy tuyến tính và nhiều cấp o hồi quy không tuyến tính Khai phá dữ liệu 5 Phân lớp so với dự báo• Phân lớp: o dự đoán các nhãn phân lớp o phân lớp dữ liệu dựa trên tập huấn luyện và các giá trị trong một thuộc tính phân lớp và dùng nó để xác định lớp cho dữ liệu mới• Dự báo: o xây dựng mô hình các hàm giá trị liên tục o dự đoán những giá trị chưa biết Khai phá dữ liệu 6 2 Phân lớp - tiế tiến trì trình hai bứơc Bước 1:1. Bướ dựng mô hình từ tập huấn luyện Xây dự Bước 2:2. Bướ Sử dụng mô hình - kiểm tra tính đúng đắn của mô hình và dùng nó để phân lớp dữ liệu mới Khai phá dữ liệu 7 Xây dựng mô hình • Mỗi bộ bộ/mẫ /mẫu dữ dữ liệ liệu được phân vào một lớp được xác định trước • Lớp của một bộ/mẫu dữ liệu được xác B ướ c 1 thuộc tí định bởi thuộ tính gá lớp gán nhãn lớ • Tập các bộ/mẫu dữ liệu huấn luyện - tập huấ huấn luyệ luyện - được dùng để xây dựng mô hì hình luật • Mô hình được biểu diễn bởi các luậ phân lớp, các cây quyế quyết định hoặc thức toá các công thứ toán học Khai phá dữ liệu 8 Sử dụng mô hình • Phân lớlớp cho nhữ những đố đối tượ tượng mớ mới hoặc chưa đượ hoặ được phân lớ lớp B ướ c 2 • Đánh giá độ chí giá độ chính xá của mô hì xác củ hình o lớp biết trước của một mẫu/bộ dữ liệu đem kiểm tra được so sánh với kết quả thu được từ mô hình o tỉ lệ chính xác = phần trăm các mẫu/bộ dữ liệu được phân lớp đúng bởi mô hình trong số các lần kiểm tra Khai phá dữ liệu 9 3 Ví dụ: xây dựng mô hì xây dự hình Các thuật toán phân lớp Dữ liệu huấn luyệnNAME RANK YEARS TENURED Bộ phân lớpMary Assistant Prof 3 no (Mô hình)James Assistant Prof 7 yesBill Professor 2 ...
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu: Bài 4 - Văn Thế ThànhBài 4:Phân lớp - ClassificationPhân Khai phá dữ liệu 1 Phân lớp và dự báo Tổng quan • Phân lớp là gì? Dự báo là gì? • Giới thiệ Giớ thiệu cây quyế quyết định • Phân lớp kiể kiểu Bayes • Những phương phá Nhữ pháp phân lớp khá khác • Độ chí ch í nh x á c trong phân l ớ p • Tóm tắt Khai phá dữ liệu 2 Phân lớp là gì? • Mục đích: ch: để dự đoán những nhãn phân lớp cho các bộ dữ liệu/mẫu mới • Đầu vào: một tập các mẫu dữ liệu huấn luyện, với một nhãn phân lớp cho mỗi mẫu dữ liệu • Đầu ra: ra: mô hình (bộ phân lớp) dựa trên tập huấn luyện và những nhãn phân lớp Khai phá dữ liệu 3 1 Một số số ứng dụng phân lớp tiêu biểu tiêu biể • dụng Tín dụ • Tiếp thị Tiế thị • Chẩn đoá Chẩ đoán y khoa • Phân hiệu quả Phân tích hiệ quả điề điều trị trị Khai phá dữ liệu 4 Dự đoá đoán là gì? • Tương tự với phân lớp o xây dựng một mô hình o sử dụng mô hình để dự đoán cho những giá trị chưa biết • Phương thứ thức chủ chủ đạo: Giậ Giật lùi o hồi quy tuyến tính và nhiều cấp o hồi quy không tuyến tính Khai phá dữ liệu 5 Phân lớp so với dự báo• Phân lớp: o dự đoán các nhãn phân lớp o phân lớp dữ liệu dựa trên tập huấn luyện và các giá trị trong một thuộc tính phân lớp và dùng nó để xác định lớp cho dữ liệu mới• Dự báo: o xây dựng mô hình các hàm giá trị liên tục o dự đoán những giá trị chưa biết Khai phá dữ liệu 6 2 Phân lớp - tiế tiến trì trình hai bứơc Bước 1:1. Bướ dựng mô hình từ tập huấn luyện Xây dự Bước 2:2. Bướ Sử dụng mô hình - kiểm tra tính đúng đắn của mô hình và dùng nó để phân lớp dữ liệu mới Khai phá dữ liệu 7 Xây dựng mô hình • Mỗi bộ bộ/mẫ /mẫu dữ dữ liệ liệu được phân vào một lớp được xác định trước • Lớp của một bộ/mẫu dữ liệu được xác B ướ c 1 thuộc tí định bởi thuộ tính gá lớp gán nhãn lớ • Tập các bộ/mẫu dữ liệu huấn luyện - tập huấ huấn luyệ luyện - được dùng để xây dựng mô hì hình luật • Mô hình được biểu diễn bởi các luậ phân lớp, các cây quyế quyết định hoặc thức toá các công thứ toán học Khai phá dữ liệu 8 Sử dụng mô hình • Phân lớlớp cho nhữ những đố đối tượ tượng mớ mới hoặc chưa đượ hoặ được phân lớ lớp B ướ c 2 • Đánh giá độ chí giá độ chính xá của mô hì xác củ hình o lớp biết trước của một mẫu/bộ dữ liệu đem kiểm tra được so sánh với kết quả thu được từ mô hình o tỉ lệ chính xác = phần trăm các mẫu/bộ dữ liệu được phân lớp đúng bởi mô hình trong số các lần kiểm tra Khai phá dữ liệu 9 3 Ví dụ: xây dựng mô hì xây dự hình Các thuật toán phân lớp Dữ liệu huấn luyệnNAME RANK YEARS TENURED Bộ phân lớpMary Assistant Prof 3 no (Mô hình)James Assistant Prof 7 yesBill Professor 2 ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Khai phá dữ liệu Khai phá dữ liệu Phân lớp Classification Cây quyết định Phân lớp kiểu Bayes Độ chính xác trong phân lớpGợi ý tài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 351 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 230 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 222 0 0 -
Nâng cao hiệu quả tra cứu ảnh nhãn hiệu sử dụng cây quyết định và phản hồi liên quan
10 trang 173 0 0 -
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 170 0 0 -
8 trang 131 0 0
-
4 trang 115 0 0
-
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 7 - Nguyễn Nhật Quang
37 trang 92 0 0 -
Bài giảng Khai phá web - Bài 2: Học máy (Phần 1)
53 trang 50 0 0 -
Bài giảng Khai phá dữ liệu: Chương 5 - TS. Võ Thị Ngọc Châu
116 trang 48 0 0