Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1.2: Giới thiệu về Học máy và khai phá dữ liệu
Số trang: 29
Loại file: pdf
Dung lượng: 2.52 MB
Lượt xem: 28
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1.2: Giới thiệu về Học máy và khai phá dữ liệu. Chương này cung cấp cho học viên những nội dung về: nguồn dữ liệu; khai phá dữ liệu; phát hiện tri thức và khai phá dữ liệu; dữ liệu – thông tin – tri thức;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1.2: Giới thiệu về Học máy và khai phá dữ liệu 1 Nhập môn Học máy và Khai phá dữ liệu (IT3190) 2 Nội dung môn học • Lecture 1: Giới thiệu về Học máy và khai phá dữ liệu • Lecture 2: Thu thập và tiền xử lý dữ liệu • Lecture 3: Hồi quy tuyến tính (Linear regression) • Lecture 4+5: Phân cụm • Lecture 6: Phân loại và Đánh giá hiệu năng • Lecture 7: dựa trên láng giềng gần nhất (KNN) • Lecture 8: Cây quyết định và Rừng ngẫu nhiên • Lecture 9: Học dựa trên xác suất • Lecture 10: Mạng nơron (Neural networks) • Lecture 11: Máy vector hỗ trợ (SVM) • Lecture 12: Khai phá tập mục thường xuyên và các luật kết hợp • Lecture 13: Thảo luận ứng dụng trong thực tế 3 Nguồn dữ liệu 4 Khai phá dữ liệu - Dự đoán • Google Flu Trends: phát hiện các đợt bùng phát trước dữ liệu CDC hai tuần 5 Khai phá dữ liệu - Khám phá Subscribers in Youtube Views in Youtube H1 (TH Hanoi) 39,298 H1 (TH Hanoi) 22,002,049 HTV Entertainment 700,866 HTV Entertainment 589,368,537 VTV Go 841,629 VTV Go 372,993,993 VTC1 Tin Tuc 696,709 VTC1 Tin Tuc 980,345,169 THVL Giai Tri 1,032,878 THVL Giai Tri 1,088,750,732 THVL 1,350,236 THVL 1,542,390,919 Kênh truyền hình hiệu quả? Videos in Youtube Attractiveness 6% THVL 13% 18% THVL Giai Tri VTC1 Tin Tuc 9% 12% VTV Go HTV Entertainment 42% H1 (TH Hanoi) 6 Khai phá dữ liệu • Dữ liệu giúp mọi thứ rõ ràng hơn Searches for “Facebook” (John Canny, UC Berkeley) 7 Phát hiện tri thức và Khai phá dữ liệu The automatic extraction of non- obvious, hidden knowledge from large volumes of data (tự động trích rút những tri thức ẩn, không tường minh từ dữ liệu lớn) 8 Khái niệm dữ liệu • Dữ liệu chỉ là dữ kiện thô (Long and Long, 1998) • Dữ liệu… là các luồng dữ kiện thô biểu diễn các sự kiện… trước khi chúng được sắp xếp thành một dạng mà mọi người có thể hiểu và sử dụng (Laudon and Laudon, 1998) • Dữ liệu bao gồm các dữ kiện (Hayes, 1992), các ký hiệu được ghi lại (McNurlin và Sprague, 1998) Dữ liệu là tín hiệu (signals) thu được do quan sát, đo đạc, thu thập... từ các đối tượng. Cụ thể, dữ liệu là giá trị (values) của các thuộc tính (features) của các đối tượng, được biểu diễn bằng dãy các bits, các con số hay ký hiệu... Data 9 Khái niệm thông tin • Dữ liệu đã được đưa về một dạng có ý nghĩa và hữu ích đối với con người (Laudon and Laudon, 1998) • Dữ liệu đã được thu thập và xử lý thành một dạng có ý nghĩa. Đơn giản, thông tin là ý nghĩa mà chúng ta cung cấp cho các dữ kiện tích lũy (Long and Long, 1998) Thông tin là dữ liệu có ý nghĩa (data equiped with meaning), thu Information được khi xử lý dữ liệu để lọc bỏ đi các phần dư thừa, tìm ra phần cốt lõi đặc trưng cho dữ liệu. Data 10 Khái niệm tri thức • Kết quả của sự hiểu biết thông tin (Hayes, 1992) • Kết quả của việc ngấm thông tin (Hayes, 1992), Thông tin thu thập về một lĩnh vực quan tâm (Senn, 1990) • Thông tin có định hướng hoặc ý định, nó giúp hỗ trợ cho một quyết định hoặc một hành động (Zachman, 1987) Knowledge Tri thức là thông tin tích hợp, như Information quan hệ giữa các sự kiện, giữa các thông tin... thu được qua quá trình nhận thức, phát hiện hoặc học tập. Data 11 Dữ liệu – thông tin – tri thức Tri thức về các tri thức VD: khi nào áp dụng, áp dụng như thế nào Hiểu biết về một lĩnh Meta- vực nào đó, có thể dùng Knowledge để giải quyết các vấn đề Knowledge Kích thước nhỏ hơn, giá trị cao hơn với một Information số ý nghĩa nhất định Data Kích thước lớn, giá trị thấp, thường không rõ ý nghĩa 12 Ví dụ dữ liệu/thông tin/tri thức • Dữ liệu • Trời nhiệt độ là 5???? ???? • Thông tin • Ngoài trời lạnh quá • Tri thức • Nếu trời lạnh, bạn nên mặc áo ấm khi đi ra ngoài • Giá trị cảm nhận của dữ liệu tăng lên khi nó được chu ...
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1.2: Giới thiệu về Học máy và khai phá dữ liệu 1 Nhập môn Học máy và Khai phá dữ liệu (IT3190) 2 Nội dung môn học • Lecture 1: Giới thiệu về Học máy và khai phá dữ liệu • Lecture 2: Thu thập và tiền xử lý dữ liệu • Lecture 3: Hồi quy tuyến tính (Linear regression) • Lecture 4+5: Phân cụm • Lecture 6: Phân loại và Đánh giá hiệu năng • Lecture 7: dựa trên láng giềng gần nhất (KNN) • Lecture 8: Cây quyết định và Rừng ngẫu nhiên • Lecture 9: Học dựa trên xác suất • Lecture 10: Mạng nơron (Neural networks) • Lecture 11: Máy vector hỗ trợ (SVM) • Lecture 12: Khai phá tập mục thường xuyên và các luật kết hợp • Lecture 13: Thảo luận ứng dụng trong thực tế 3 Nguồn dữ liệu 4 Khai phá dữ liệu - Dự đoán • Google Flu Trends: phát hiện các đợt bùng phát trước dữ liệu CDC hai tuần 5 Khai phá dữ liệu - Khám phá Subscribers in Youtube Views in Youtube H1 (TH Hanoi) 39,298 H1 (TH Hanoi) 22,002,049 HTV Entertainment 700,866 HTV Entertainment 589,368,537 VTV Go 841,629 VTV Go 372,993,993 VTC1 Tin Tuc 696,709 VTC1 Tin Tuc 980,345,169 THVL Giai Tri 1,032,878 THVL Giai Tri 1,088,750,732 THVL 1,350,236 THVL 1,542,390,919 Kênh truyền hình hiệu quả? Videos in Youtube Attractiveness 6% THVL 13% 18% THVL Giai Tri VTC1 Tin Tuc 9% 12% VTV Go HTV Entertainment 42% H1 (TH Hanoi) 6 Khai phá dữ liệu • Dữ liệu giúp mọi thứ rõ ràng hơn Searches for “Facebook” (John Canny, UC Berkeley) 7 Phát hiện tri thức và Khai phá dữ liệu The automatic extraction of non- obvious, hidden knowledge from large volumes of data (tự động trích rút những tri thức ẩn, không tường minh từ dữ liệu lớn) 8 Khái niệm dữ liệu • Dữ liệu chỉ là dữ kiện thô (Long and Long, 1998) • Dữ liệu… là các luồng dữ kiện thô biểu diễn các sự kiện… trước khi chúng được sắp xếp thành một dạng mà mọi người có thể hiểu và sử dụng (Laudon and Laudon, 1998) • Dữ liệu bao gồm các dữ kiện (Hayes, 1992), các ký hiệu được ghi lại (McNurlin và Sprague, 1998) Dữ liệu là tín hiệu (signals) thu được do quan sát, đo đạc, thu thập... từ các đối tượng. Cụ thể, dữ liệu là giá trị (values) của các thuộc tính (features) của các đối tượng, được biểu diễn bằng dãy các bits, các con số hay ký hiệu... Data 9 Khái niệm thông tin • Dữ liệu đã được đưa về một dạng có ý nghĩa và hữu ích đối với con người (Laudon and Laudon, 1998) • Dữ liệu đã được thu thập và xử lý thành một dạng có ý nghĩa. Đơn giản, thông tin là ý nghĩa mà chúng ta cung cấp cho các dữ kiện tích lũy (Long and Long, 1998) Thông tin là dữ liệu có ý nghĩa (data equiped with meaning), thu Information được khi xử lý dữ liệu để lọc bỏ đi các phần dư thừa, tìm ra phần cốt lõi đặc trưng cho dữ liệu. Data 10 Khái niệm tri thức • Kết quả của sự hiểu biết thông tin (Hayes, 1992) • Kết quả của việc ngấm thông tin (Hayes, 1992), Thông tin thu thập về một lĩnh vực quan tâm (Senn, 1990) • Thông tin có định hướng hoặc ý định, nó giúp hỗ trợ cho một quyết định hoặc một hành động (Zachman, 1987) Knowledge Tri thức là thông tin tích hợp, như Information quan hệ giữa các sự kiện, giữa các thông tin... thu được qua quá trình nhận thức, phát hiện hoặc học tập. Data 11 Dữ liệu – thông tin – tri thức Tri thức về các tri thức VD: khi nào áp dụng, áp dụng như thế nào Hiểu biết về một lĩnh Meta- vực nào đó, có thể dùng Knowledge để giải quyết các vấn đề Knowledge Kích thước nhỏ hơn, giá trị cao hơn với một Information số ý nghĩa nhất định Data Kích thước lớn, giá trị thấp, thường không rõ ý nghĩa 12 Ví dụ dữ liệu/thông tin/tri thức • Dữ liệu • Trời nhiệt độ là 5???? ???? • Thông tin • Ngoài trời lạnh quá • Tri thức • Nếu trời lạnh, bạn nên mặc áo ấm khi đi ra ngoài • Giá trị cảm nhận của dữ liệu tăng lên khi nó được chu ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu Nhập môn Học máy và Khai phá dữ liệu Học máy và khai phá dữ liệu Khai phá dữ liệu Kiểu dữ liệu có cấu trúc Kiểu dữ liệu phi cấu trúcGợi ý tài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 351 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 230 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 222 0 0 -
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 170 0 0 -
8 trang 131 0 0
-
4 trang 115 0 0
-
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 7 - Nguyễn Nhật Quang
37 trang 92 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 3 - Nguyễn Nhật Quang
19 trang 50 0 0 -
Bài giảng Khai phá dữ liệu: Chương 5 - TS. Võ Thị Ngọc Châu
116 trang 48 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 9 - Nguyễn Nhật Quang
48 trang 47 0 0