Bài giảng Học máy: Bài 4 - Nguyễn Hoàng Long
Số trang: 0
Loại file: pdf
Dung lượng: 1.44 MB
Lượt xem: 21
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng "Học máy - Bài 4: Hồi quy logistic, máy vec tơ hỗ trợ" cung cấp cho người học các kiến thức: Hồi quy logit, phân lớp và hồi quy, hồi quy logistic, hàm logistic trên dữ liệu default,... Mời các bạn cùng tham khảo nội dung chi tiết.
Nội dung trích xuất từ tài liệu:
Bài giảng Học máy: Bài 4 - Nguyễn Hoàng Long Hồi quy Logistic, Máy véc- tơ hỗ trợ (SVM) Nguyễn Thanh Tùng Khoa Công nghệ thông tin – Đại học Thủy Lợi tungnt@tlu.edu.vn Website môn học: https://sites.google.com/a/wru.vn/cse445spring2016/Bài giảng có sử dụng hình vẽ trong cuốn sách “An Introduction to Statistical Learning with Applications in R” với sựcho phép của tác giả, có sử dụng slides các khóa học CME250 của ĐH Stanford và IOM530 của ĐH Southern California CSE 445: Học máy | Học kỳ 1, 2016-2017Hồi quy Logit(Logistic Regression) CSE 445: Học máy | Học kỳ 1, 2016-2017 Types of Algorithms Do you have labeled data? Yes No Supervised Unsupervised What do you want to predict? Do you want to group the data? Category Quantity Yes No Classification Regression Cluster Dimensionality Analysis Reduction KNN LASSO K--meansSVM Logistic Linear PCA Hierarchical ICA Regression Regression Clustering SOM CSE 445: Học máy | Học kỳ 1, 2016-2017 Phân lớp• Hồi quy – dự đoán biến định lượng (liên tục) Y – Trong nhiều ứng dụng, biến đầu ra là định tính hoặc kiểu định danh/hạng mục• Phân lớp: Dự đoán biến đầu ra định tính – Gán mỗi quan sát cho một lớp/mục – vd: Bộ phân lớp K-láng giềng gần nhất trong bài học trước CSE 445: Học máy | Học kỳ 1, 2016-2017 Ví dụ về phân lớp• Các giao dịch thẻ tín dụng – Có phải dịch gian lận hay không khi ta dựa trên thông tin lịch sử giao dịch của chúng?• Rủi ro tín dụng – Liệu một cá nhân có bị vỡ nợ với tài khoản tín dụng của mình không?• Thị giác máy (Computer Vision) – Hiểu được các đối tượng xuất hiện trong ảnh CSE 445: Học máy | Học kỳ 1, 2016-2017 Ví dụ về phân lớpHình 4.1 , ISL 2013* CSE 445: Học máy | Học kỳ 1, 2016-2017 Phân lớp và Hồi quy• Phân lớp và Hồi quy có liên quan với nhau lớn.• Phân lớp hoạt động như hồi quy: – Dự đoán xác suất của 1 mẫu dữ liệu thuộc vào một lớp, ta gán vào 1 lớp có xác suất cao nhất CSE 445: Học máy | Học kỳ 1, 2016-2017 Hồi quy Logistic• Phân lớp nhị phân: Y nhận 2 giá trị (“0” hoặc “1”) với 2 lớp tương ứng• Mô hình hồi quy Logistic đối với bài toán phân lớp nhị phân – Ngưỡng để đạt được các quyết định phân lớp – Là mô hình hồi quy tuyến tính có chỉnh sửa để dự đoán xác suất trong [0, 1] CSE 445: Học máy | Học kỳ 1, 2016-2017 Ví dụ: Dữ liệu Credit Card Default• Ta cần dự đoán các khách hang có nguy cơ phá sản (default)• Các biến X là: • Thu nhập thường xuyên (Annual Income) • Cân đối thẻ hàng tháng (Monthly credit card balance)• Biến Y (Default) có kiểu rời rạc (categorical): Yes hoặc No• Làm sao để tìm quan hệ giữa Y và X? CSE 445: Học máy | Học kỳ 1, 2016-2017Tập dữ liệu Default CSE 445: Học máy | Học kỳ 1, 2016-2017Tại sao không dùng hồi quy tuyến tính?• Khi Y chỉ nhận giá trị Yes hoặc No (1 hoặc 0), tại sao mô hình hồi quy tuyến tính không thích hợp?• Nếu ta xây dựng mô hình hồi quy tuyến tính trên dữ liệu Default, thì với những cân đối tài chính thấp (low balances) ta sẽ dự đoán một xác suất âm, và với cân đối cao ta sẽ dự đoán xác suất trên 1! Khi biến Balance < 500, Pr(default) là số âm! Diễn giải giá trị nhỏ hơn 0 thế nào? CSE 445: Học máy | Học kỳ 1, 2016-2017Hàm Logistic trên dữ liệu DefaultXác suất của việc phá sản sát 0nhưng không âm đối với các tàikhoản có cân bằng tài chínhthấp, tương tự với cân bằng tàichính cao sẽ sát nhưng khônglớn hơn 1 β ...
Nội dung trích xuất từ tài liệu:
Bài giảng Học máy: Bài 4 - Nguyễn Hoàng Long Hồi quy Logistic, Máy véc- tơ hỗ trợ (SVM) Nguyễn Thanh Tùng Khoa Công nghệ thông tin – Đại học Thủy Lợi tungnt@tlu.edu.vn Website môn học: https://sites.google.com/a/wru.vn/cse445spring2016/Bài giảng có sử dụng hình vẽ trong cuốn sách “An Introduction to Statistical Learning with Applications in R” với sựcho phép của tác giả, có sử dụng slides các khóa học CME250 của ĐH Stanford và IOM530 của ĐH Southern California CSE 445: Học máy | Học kỳ 1, 2016-2017Hồi quy Logit(Logistic Regression) CSE 445: Học máy | Học kỳ 1, 2016-2017 Types of Algorithms Do you have labeled data? Yes No Supervised Unsupervised What do you want to predict? Do you want to group the data? Category Quantity Yes No Classification Regression Cluster Dimensionality Analysis Reduction KNN LASSO K--meansSVM Logistic Linear PCA Hierarchical ICA Regression Regression Clustering SOM CSE 445: Học máy | Học kỳ 1, 2016-2017 Phân lớp• Hồi quy – dự đoán biến định lượng (liên tục) Y – Trong nhiều ứng dụng, biến đầu ra là định tính hoặc kiểu định danh/hạng mục• Phân lớp: Dự đoán biến đầu ra định tính – Gán mỗi quan sát cho một lớp/mục – vd: Bộ phân lớp K-láng giềng gần nhất trong bài học trước CSE 445: Học máy | Học kỳ 1, 2016-2017 Ví dụ về phân lớp• Các giao dịch thẻ tín dụng – Có phải dịch gian lận hay không khi ta dựa trên thông tin lịch sử giao dịch của chúng?• Rủi ro tín dụng – Liệu một cá nhân có bị vỡ nợ với tài khoản tín dụng của mình không?• Thị giác máy (Computer Vision) – Hiểu được các đối tượng xuất hiện trong ảnh CSE 445: Học máy | Học kỳ 1, 2016-2017 Ví dụ về phân lớpHình 4.1 , ISL 2013* CSE 445: Học máy | Học kỳ 1, 2016-2017 Phân lớp và Hồi quy• Phân lớp và Hồi quy có liên quan với nhau lớn.• Phân lớp hoạt động như hồi quy: – Dự đoán xác suất của 1 mẫu dữ liệu thuộc vào một lớp, ta gán vào 1 lớp có xác suất cao nhất CSE 445: Học máy | Học kỳ 1, 2016-2017 Hồi quy Logistic• Phân lớp nhị phân: Y nhận 2 giá trị (“0” hoặc “1”) với 2 lớp tương ứng• Mô hình hồi quy Logistic đối với bài toán phân lớp nhị phân – Ngưỡng để đạt được các quyết định phân lớp – Là mô hình hồi quy tuyến tính có chỉnh sửa để dự đoán xác suất trong [0, 1] CSE 445: Học máy | Học kỳ 1, 2016-2017 Ví dụ: Dữ liệu Credit Card Default• Ta cần dự đoán các khách hang có nguy cơ phá sản (default)• Các biến X là: • Thu nhập thường xuyên (Annual Income) • Cân đối thẻ hàng tháng (Monthly credit card balance)• Biến Y (Default) có kiểu rời rạc (categorical): Yes hoặc No• Làm sao để tìm quan hệ giữa Y và X? CSE 445: Học máy | Học kỳ 1, 2016-2017Tập dữ liệu Default CSE 445: Học máy | Học kỳ 1, 2016-2017Tại sao không dùng hồi quy tuyến tính?• Khi Y chỉ nhận giá trị Yes hoặc No (1 hoặc 0), tại sao mô hình hồi quy tuyến tính không thích hợp?• Nếu ta xây dựng mô hình hồi quy tuyến tính trên dữ liệu Default, thì với những cân đối tài chính thấp (low balances) ta sẽ dự đoán một xác suất âm, và với cân đối cao ta sẽ dự đoán xác suất trên 1! Khi biến Balance < 500, Pr(default) là số âm! Diễn giải giá trị nhỏ hơn 0 thế nào? CSE 445: Học máy | Học kỳ 1, 2016-2017Hàm Logistic trên dữ liệu DefaultXác suất của việc phá sản sát 0nhưng không âm đối với các tàikhoản có cân bằng tài chínhthấp, tương tự với cân bằng tàichính cao sẽ sát nhưng khônglớn hơn 1 β ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Học máy Machine leaning Học máy Kỹ thuật lập trình Hồi quy logistic Máy vec tơ hỗ trợ Dữ liệu defaultGợi ý tài liệu liên quan:
-
Kỹ thuật lập trình trên Visual Basic 2005
148 trang 266 0 0 -
Phương pháp nhận diện biển số xe ô tô sử dụng học máy và thư viện OpenCV
6 trang 210 0 0 -
NGÂN HÀNG CÂU HỎI TRẮC NGHIỆM THIẾT KẾ WEB
8 trang 207 0 0 -
Giới thiệu môn học Ngôn ngữ lập trình C++
5 trang 195 0 0 -
Bài giảng Nhập môn về lập trình - Chương 1: Giới thiệu về máy tính và lập trình
30 trang 167 0 0 -
Luận văn: Nghiên cứu kỹ thuật giấu tin trong ảnh Gif
33 trang 153 0 0 -
Báo cáo thực tập Công nghệ thông tin: Lập trình game trên Unity
27 trang 118 0 0 -
Xác định đặc điểm tác giả văn bản tiếng Việt bằng học sâu
7 trang 117 0 0 -
Giáo trình về phân tích thiết kế hệ thống thông tin
113 trang 114 0 0 -
LUẬN VĂN: Tìm hiểu kỹ thuật tạo bóng cứng trong đồ họa 3D
41 trang 109 0 0