Bài giảng Học máy (IT 4862): Chương 1 - Nguyễn Nhật Quang
Số trang: 35
Loại file: pdf
Dung lượng: 539.07 KB
Lượt xem: 14
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Chương 1 - Giới thiệu chung. Chương này trình bày những nội dung chính sau: Giới thiệu về học máy, quá trình học máy, các thành phần chính của bài toán học máy, các vấn đề trong học máy, vấn đề over-fitting, các môi trường chính,.... Mời các bạn cùng tham khảo nội dung chi tiết.
Nội dung trích xuất từ tài liệu:
Bài giảng Học máy (IT 4862): Chương 1 - Nguyễn Nhật QuangHọc Máy(IT 4862)Nguyễnễ Nhậthậ Quangquangnn-fit@mail.hut.edu.vnTrường Đại học Bách Khoa Hà NộiViện Công nghệ thông tin và truyền thôngNăm học 2011-2012Nội ddung mônô hhọc:Giới thiệu chung• Học máy• Công cụ WEKAĐánh giá hiệu năng hệ thốngố học máyCác phương pháp học dựa trên xác suấtCác phương pháp học có giám sátCác pphươnggpphápp họcọ khônggggiám sátLọc cộng tácHọc tăng cườngHọc Máy – IT 48622Giới thiệu về Học máyHọc máy (Machine Learning – ML) là một lĩnh vực nghiên cứu của Trítuệ nhân tạo (Artificial Intelligence – AI)Các định nghĩa về học máy→ Một quá trình nhờ đó một hệ thống cải thiện hiệu suất (hiệu quả hoạtđộng) của nó [Simon, 1983]→ Một quá trình mà một chương trình máy tính cải thiện hiệu suất của nótrong một công việc thông qua kinh nghiệm [Mitchell, 1997]→ Việcệ lậpập trình các máyy tính để tối ưu hóa mộtộ tiêu chí hiệuệ suất dựaự trêncác dữ liệu ví dụ hoặc kinh nghiệm trong quá khứ [Alpaydin, 2004]Biểu diễn một bài toán học máy [Mitchell, 1997]H máyHọcá = Cải thiệthiện hiệuhiệ quảả mộtột côngô việciệ thôngthô qua kikinhh nghiệmhiệ• Một công việc (nhiệm vụ) T• Đối với các tiêu chí đánh giá hiệu năng P• Thông qua (sử dụng) kinh nghiệm EHọc Máy – IT 48623Ví dụ bài toán học máy (1)Lọc thư rác – Email spamfiltering• T: Dự đoán (để lọc) những thư điệnpemail))tử nào là thư rác ((spam• P: % of các thư điện tử gửi đến đượcphân loại chính xác• E: Một tập các thư điện tử (emails)mẫu, mỗi thư điện tử được biểu diễnbằng một tập thuộc tính (vd: tập từkhó ) vàkhóa)à nhãnhã lớplớ (thư(th thường/thưth ờ /thrác) tương ứngHọc Máy – IT 4862Thư rác?ThưthườngThưrác4Ví dụ bài toán học máy (2)Phân loại các trang WebT: Phân loại các trang Web theo các chủ đềề đã định trướcP: Tỷ lệ (%) các trang Web được phân loại chính xácE: Một tậpEtậ cácá trangtW b trongWeb,tđó mỗiỗi trangtW b gắnWebắ vớiới mộtộtchủ đềChủđề?Học Máy – IT 48625
Nội dung trích xuất từ tài liệu:
Bài giảng Học máy (IT 4862): Chương 1 - Nguyễn Nhật QuangHọc Máy(IT 4862)Nguyễnễ Nhậthậ Quangquangnn-fit@mail.hut.edu.vnTrường Đại học Bách Khoa Hà NộiViện Công nghệ thông tin và truyền thôngNăm học 2011-2012Nội ddung mônô hhọc:Giới thiệu chung• Học máy• Công cụ WEKAĐánh giá hiệu năng hệ thốngố học máyCác phương pháp học dựa trên xác suấtCác phương pháp học có giám sátCác pphươnggpphápp họcọ khônggggiám sátLọc cộng tácHọc tăng cườngHọc Máy – IT 48622Giới thiệu về Học máyHọc máy (Machine Learning – ML) là một lĩnh vực nghiên cứu của Trítuệ nhân tạo (Artificial Intelligence – AI)Các định nghĩa về học máy→ Một quá trình nhờ đó một hệ thống cải thiện hiệu suất (hiệu quả hoạtđộng) của nó [Simon, 1983]→ Một quá trình mà một chương trình máy tính cải thiện hiệu suất của nótrong một công việc thông qua kinh nghiệm [Mitchell, 1997]→ Việcệ lậpập trình các máyy tính để tối ưu hóa mộtộ tiêu chí hiệuệ suất dựaự trêncác dữ liệu ví dụ hoặc kinh nghiệm trong quá khứ [Alpaydin, 2004]Biểu diễn một bài toán học máy [Mitchell, 1997]H máyHọcá = Cải thiệthiện hiệuhiệ quảả mộtột côngô việciệ thôngthô qua kikinhh nghiệmhiệ• Một công việc (nhiệm vụ) T• Đối với các tiêu chí đánh giá hiệu năng P• Thông qua (sử dụng) kinh nghiệm EHọc Máy – IT 48623Ví dụ bài toán học máy (1)Lọc thư rác – Email spamfiltering• T: Dự đoán (để lọc) những thư điệnpemail))tử nào là thư rác ((spam• P: % of các thư điện tử gửi đến đượcphân loại chính xác• E: Một tập các thư điện tử (emails)mẫu, mỗi thư điện tử được biểu diễnbằng một tập thuộc tính (vd: tập từkhó ) vàkhóa)à nhãnhã lớplớ (thư(th thường/thưth ờ /thrác) tương ứngHọc Máy – IT 4862Thư rác?ThưthườngThưrác4Ví dụ bài toán học máy (2)Phân loại các trang WebT: Phân loại các trang Web theo các chủ đềề đã định trướcP: Tỷ lệ (%) các trang Web được phân loại chính xácE: Một tậpEtậ cácá trangtW b trongWeb,tđó mỗiỗi trangtW b gắnWebắ vớiới mộtộtchủ đềChủđề?Học Máy – IT 48625
Tìm kiếm theo từ khóa liên quan:
Môi trường học máy Bài giảng Học máy Quá trình học máy Bài toán học máy Thành phần học máy Vấn đề over-fittingGợi ý tài liệu liên quan:
-
Bài giảng Học máy: Bài 1 - Nguyễn Hoàng Long
0 trang 25 0 0 -
Bài giảng Học máy: Bài 7 - Nguyễn Hoàng Long
0 trang 22 0 0 -
Đánh giá độ tương đồng hình ảnh bằng học sâu sử dụng mạng bộ ba
6 trang 21 0 0 -
Bài giảng Học máy (IT 4862): Chương 4.3 - Nguyễn Nhật Quang
30 trang 20 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 1 - Nguyễn Nhật Quang
54 trang 19 0 0 -
Bài giảng Học máy (IT 4862): Chương 4.2 - Nguyễn Nhật Quang
37 trang 19 0 0 -
Bài toán học máy cho khảo sát sự hội tụ của chuỗi số dựa trên lớp chuỗi con của chuỗi điều hòa
8 trang 19 0 0 -
Bài giảng Học máy: Bài 4 - Nguyễn Hoàng Long
0 trang 19 0 0 -
Bài giảng Học máy: Bài 6 - Nguyễn Hoàng Long
0 trang 18 0 0 -
Bài giảng Học máy (IT 4862): Chương 4.1 - Nguyễn Nhật Quang
17 trang 17 0 0