Danh mục

Bài giảng Học máy (IT 4862): Chương 1 - Nguyễn Nhật Quang

Số trang: 35      Loại file: pdf      Dung lượng: 539.07 KB      Lượt xem: 14      Lượt tải: 0    
10.10.2023

Xem trước 4 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Chương 1 - Giới thiệu chung. Chương này trình bày những nội dung chính sau: Giới thiệu về học máy, quá trình học máy, các thành phần chính của bài toán học máy, các vấn đề trong học máy, vấn đề over-fitting, các môi trường chính,.... Mời các bạn cùng tham khảo nội dung chi tiết.
Nội dung trích xuất từ tài liệu:
Bài giảng Học máy (IT 4862): Chương 1 - Nguyễn Nhật QuangHọc Máy(IT 4862)Nguyễnễ Nhậthậ Quangquangnn-fit@mail.hut.edu.vnTrường Đại học Bách Khoa Hà NộiViện Công nghệ thông tin và truyền thôngNăm học 2011-2012Nội ddung mônô hhọc:„Giới thiệu chung• Học máy• Công cụ WEKA„Đánh giá hiệu năng hệ thốngố học máy„Các phương pháp học dựa trên xác suất„Các phương pháp học có giám sát„Các pphươnggpphápp họcọ khônggggiám sát„Lọc cộng tác„Học tăng cườngHọc Máy – IT 48622Giới thiệu về Học máy„„Học máy (Machine Learning – ML) là một lĩnh vực nghiên cứu của Trítuệ nhân tạo (Artificial Intelligence – AI)Các định nghĩa về học máy→ Một quá trình nhờ đó một hệ thống cải thiện hiệu suất (hiệu quả hoạtđộng) của nó [Simon, 1983]→ Một quá trình mà một chương trình máy tính cải thiện hiệu suất của nótrong một công việc thông qua kinh nghiệm [Mitchell, 1997]→ Việcệ lậpập trình các máyy tính để tối ưu hóa mộtộ tiêu chí hiệuệ suất dựaự trêncác dữ liệu ví dụ hoặc kinh nghiệm trong quá khứ [Alpaydin, 2004]„Biểu diễn một bài toán học máy [Mitchell, 1997]H máyHọcá = Cải thiệthiện hiệuhiệ quảả mộtột côngô việciệ thôngthô qua kikinhh nghiệmhiệ• Một công việc (nhiệm vụ) T• Đối với các tiêu chí đánh giá hiệu năng P• Thông qua (sử dụng) kinh nghiệm EHọc Máy – IT 48623Ví dụ bài toán học máy (1)Lọc thư rác – Email spamfiltering• T: Dự đoán (để lọc) những thư điệnpemail))tử nào là thư rác ((spam• P: % of các thư điện tử gửi đến đượcphân loại chính xác• E: Một tập các thư điện tử (emails)mẫu, mỗi thư điện tử được biểu diễnbằng một tập thuộc tính (vd: tập từkhó ) vàkhóa)à nhãnhã lớplớ (thư(th thường/thưth ờ /thrác) tương ứngHọc Máy – IT 4862Thư rác?ThưthườngThưrác4Ví dụ bài toán học máy (2)Phân loại các trang Web„T: Phân loại các trang Web theo các chủ đềề đã định trước„P: Tỷ lệ (%) các trang Web được phân loại chính xác„E: Một tậpEtậ cácá trangtW b trongWeb,tđó mỗiỗi trangtW b gắnWebắ vớiới mộtộtchủ đềChủđề?Học Máy – IT 48625

Tài liệu được xem nhiều: