Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1: Giới thiệu về Học máy và khai phá dữ liệu
Số trang: 38
Loại file: pdf
Dung lượng: 3.15 MB
Lượt xem: 12
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1.1: Giới thiệu về Học máy và khai phá dữ liệu. Chương này cung cấp cho học viên những nội dung về: học máy và khai phá dữ liệu; quy trình thực hiện - hướng tìm tri thức; quy trình thực hiện - hướng sản phẩm; phát triển sản phẩm - kinh nghiệm từ IBM;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1: Giới thiệu về Học máy và khai phá dữ liệu 1 Nhập môn Học máy và Khai phá dữ liệu (IT3190) 2 Nội dung môn học • Lecture 1: Giới thiệu về Học máy và khai phá dữ liệu • Lecture 2: Thu thập và tiền xử lý dữ liệu • Lecture 3: Hồi quy tuyến tính (Linear regression) • Lecture 4+5: Phân cụm • Lecture 6: Phân loại và Đánh giá hiệu năng • Lecture 7: dựa trên láng giềng gần nhất (KNN) • Lecture 8: Cây quyết định và Rừng ngẫu nhiên • Lecture 9: Học dựa trên xác suất • Lecture 10: Mạng nơron (Neural networks) • Lecture 11: Máy vector hỗ trợ (SVM) • Lecture 12: Khai phá tập mục thường xuyên và các luật kết hợp • Lecture 13: Thảo luận ứng dụng học máy và khai phá dữ liệu trong thực tế 3 Tại sao nên biết Học Máy & Khai phá dữ liệu? • “The most important general-purpose technology of our era is artificial intelligence, particularly machine learning” – Harvard Business Review https://hbr.org/cover-story/2017/07/the-business-of-artificial-intelligence • Nhu cầu lớn về Data Science • “Data scientist: the sexiest job of the 21st century” – Harvard Business Review. http://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ • “The Age of Big Data” – The New York Times http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the- world.html?pagewanted=all&_r=0 4 Tại sao? Industry 4.0 https://www.pwc.com/ca/en/industries/industry-4-0.html 5 Tại sao? AI & DS & Industry 4.0 Artificial Intelligence Machine Learning Industry 4.0 Data Science 6 Vài thành công: IBM’s Watson • Application IBM's Watson Supercomputer © Data Destroys Science Laboratory, Humans SOICT, in Jeopardy (2011) HUST, 2017 7 Vài thành công: Amazon’s secret “The company reported a 29% sales increase to $12.83 billion during its second fiscal quarter, up from $9.9 billion during the same time last year.” – Fortune, July 30, 2012 8 Vài thành công: GAN (2014) Tạo Trí tưởng tượng (Imagination) Ian Goodfellow Artificial faces Goodfellow, Ian, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. 'Generative adversarial nets.' In NIPS, pp. 2672-2680. 2014. 9 Vài thành công: AlphaGo (2016) http://www.wired.com/2016/01/in-a-huge-breakthrough-googles-ai-beats-a-top-player-at-the-game-of-go/ 10 Học máy -- Khai phá dữ liệu • Machine Learning Data Mining (ML - Học máy) (DM - Khai phá dữ liệu) To build computer systems that can To find new and useful knowledge improve themselves by learning from datasets. from data. (Xây dựng những hệ thống mà (Tìm ra/Khai phá những tri thức có khả năng tự cải thiện bản mới và hữu dụng từ các tập dữ thân bằng cách học từ dữ liệu.) liệu lớn.) • Some venues: NeurIPS, ICML, IJCAI, AAAI, ICLR, ACML, ECML Some venues: KDD, PKDD, PAKDD, ICDM, CIKM 11 Dữ liệu Phi cấu trúc Có cấu trúc – relational (table-like) texts in websites, emails, articles, tweets 2D/3D images, videos + meta spectrograms, DNAs, … 12 Quy trình thực hiện: hướng tìm tri thức Data Analysis, Insight & Data Data vizualization hypothesis processing & testing, & Policy collection Grasping ML Decision 70-90% tổng thời gian (John Dickerson, University of Maryland) 13 Quy trình thực hiện: hướng sản phẩm Business Analytic understanding approach Data Feedback requirements Data Deployment collection Data Evaluation understanding Data Modeling preparation 14 (http://www.theta.co.nz/) Phát triển sản phẩm: kinh nghiệ ...
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 1: Giới thiệu về Học máy và khai phá dữ liệu 1 Nhập môn Học máy và Khai phá dữ liệu (IT3190) 2 Nội dung môn học • Lecture 1: Giới thiệu về Học máy và khai phá dữ liệu • Lecture 2: Thu thập và tiền xử lý dữ liệu • Lecture 3: Hồi quy tuyến tính (Linear regression) • Lecture 4+5: Phân cụm • Lecture 6: Phân loại và Đánh giá hiệu năng • Lecture 7: dựa trên láng giềng gần nhất (KNN) • Lecture 8: Cây quyết định và Rừng ngẫu nhiên • Lecture 9: Học dựa trên xác suất • Lecture 10: Mạng nơron (Neural networks) • Lecture 11: Máy vector hỗ trợ (SVM) • Lecture 12: Khai phá tập mục thường xuyên và các luật kết hợp • Lecture 13: Thảo luận ứng dụng học máy và khai phá dữ liệu trong thực tế 3 Tại sao nên biết Học Máy & Khai phá dữ liệu? • “The most important general-purpose technology of our era is artificial intelligence, particularly machine learning” – Harvard Business Review https://hbr.org/cover-story/2017/07/the-business-of-artificial-intelligence • Nhu cầu lớn về Data Science • “Data scientist: the sexiest job of the 21st century” – Harvard Business Review. http://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ • “The Age of Big Data” – The New York Times http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the- world.html?pagewanted=all&_r=0 4 Tại sao? Industry 4.0 https://www.pwc.com/ca/en/industries/industry-4-0.html 5 Tại sao? AI & DS & Industry 4.0 Artificial Intelligence Machine Learning Industry 4.0 Data Science 6 Vài thành công: IBM’s Watson • Application IBM's Watson Supercomputer © Data Destroys Science Laboratory, Humans SOICT, in Jeopardy (2011) HUST, 2017 7 Vài thành công: Amazon’s secret “The company reported a 29% sales increase to $12.83 billion during its second fiscal quarter, up from $9.9 billion during the same time last year.” – Fortune, July 30, 2012 8 Vài thành công: GAN (2014) Tạo Trí tưởng tượng (Imagination) Ian Goodfellow Artificial faces Goodfellow, Ian, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. 'Generative adversarial nets.' In NIPS, pp. 2672-2680. 2014. 9 Vài thành công: AlphaGo (2016) http://www.wired.com/2016/01/in-a-huge-breakthrough-googles-ai-beats-a-top-player-at-the-game-of-go/ 10 Học máy -- Khai phá dữ liệu • Machine Learning Data Mining (ML - Học máy) (DM - Khai phá dữ liệu) To build computer systems that can To find new and useful knowledge improve themselves by learning from datasets. from data. (Xây dựng những hệ thống mà (Tìm ra/Khai phá những tri thức có khả năng tự cải thiện bản mới và hữu dụng từ các tập dữ thân bằng cách học từ dữ liệu.) liệu lớn.) • Some venues: NeurIPS, ICML, IJCAI, AAAI, ICLR, ACML, ECML Some venues: KDD, PKDD, PAKDD, ICDM, CIKM 11 Dữ liệu Phi cấu trúc Có cấu trúc – relational (table-like) texts in websites, emails, articles, tweets 2D/3D images, videos + meta spectrograms, DNAs, … 12 Quy trình thực hiện: hướng tìm tri thức Data Analysis, Insight & Data Data vizualization hypothesis processing & testing, & Policy collection Grasping ML Decision 70-90% tổng thời gian (John Dickerson, University of Maryland) 13 Quy trình thực hiện: hướng sản phẩm Business Analytic understanding approach Data Feedback requirements Data Deployment collection Data Evaluation understanding Data Modeling preparation 14 (http://www.theta.co.nz/) Phát triển sản phẩm: kinh nghiệ ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Nhập môn Học máy và Khai phá dữ liệu Nhập môn Học máy và Khai phá dữ liệu Học máy và khai phá dữ liệu Khai phá dữ liệu Machine learning Data miningTài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 353 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 236 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 233 0 0 -
9 trang 188 0 0
-
17 trang 187 0 0
-
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 178 0 0 -
8 trang 133 0 0
-
4 trang 118 0 0
-
Nuclear energy system's behavior and decision making using machine learning
8 trang 114 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 7 - Nguyễn Nhật Quang
37 trang 97 0 0