Tóm tắt luận văn Thạc sĩ: Nghiên cứu thuật toán học máy SVM và ứng dụng trong bài toán khai phá ý kiến phản hồi của khách hàng trên website
Số trang: 26
Loại file: pdf
Dung lượng: 881.65 KB
Lượt xem: 17
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Đề tài nghiên cứu thuật toán học máy SVM và ứng dụng trong bài toán khai phá ý kiến phản hồi của khách hàng trên website, gồm 3 chương chính với các nội dung cơ bản nhất về thuật toán học. Mời các bạn tham khảo!
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Nghiên cứu thuật toán học máy SVM và ứng dụng trong bài toán khai phá ý kiến phản hồi của khách hàng trên website HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- NGUYỄN THỊ LAN ANH NGHIÊN CỨU THUẬT TOÁN HỌC MÁY SVM VÀ ỨNG DỤNG TRONG BÀI TOÁN KHAI PHÁ Ý KIẾN PHẢN HỒI CỦA KHÁCH HÀNG TRÊN WEBSITE Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ Hà Nội - 2013 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS HOÀNG XUÂN DẬU Phản biện 1: …………………………………………………………………… Phản biện 2: …………………………………………………………………… Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ............... Có thể tìm hiểu luận văn tại: - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1MỞ ĐẦUVới sự phát triển mạnh mẽ của mạng Internet, thương mạiđiện tử, thời đại của công nghệ thông tin. Mọi người có cơhội chia sẽ những ý kiến, quan điểm của mình, đưa các bàiđánh giá về các sản phẩm tại các trang web thương mạiđiện tử và diễn đạt quan điểm của họ trên hầu hết bất kỳthứ gì ở diễn đàn, nhóm thảo luận và các blog, các tácphẩm văn học mà họ đọc, chúng được gọi chung là nộidung do người dùng tạo ra. Một cá nhân nếu muốn muamột sản phẩm, cá nhân đó không nhất thiết phải giới hạntham khảo bạn bè và gia đình nữa bởi vì có nhiều ngườiđánh giá sản phẩm trên trang Web đó đưa những ý kiếnliên quan đến việc sử dụng sản phẩm. Đây là nguồn thôngtin quan trọng, cung cấp cho người mua hàng cái nhìn toàndiện hơn về một sản phẩm mà họ định mua. Còn đối vớinhà sản xuất, đánh giá của khách hàng là cơ sở để tiếnhành cải tiến, hoàn thiện sản phẩm của mình.Tuy nhiên, việc tìm kiếm những nguồn ý kiến và giám sátchúng trên Web vẫn là một công việc hết sức khó khăn bởivì có một số lượng lớn những nguồn khác nhau và mỗinguồn ngoài ra còn có số lượng lớn văn bản ý kiến hoặc 2cảm nghĩ. Trong nhiều trường hợp, các ý kiến thường ẩnbên trong những bài viết dài. Điều đó gây khó khăn chongười đọc để tìm kiếm các nguồn liên quan, tríchnhữngcâu liên quan đến quan điểm đánh giá, đọc, tóm tắtvà tổ chức chúng thành dạng có thể sử dụng được.Do đó, việc nghiên cứu phát triển hệ thống tự động là cầnthiết trong việc phát hiện, tổng hợp và phân loại các ýkiến người dùng. Phân tích cảm nghĩ, còn được biết đếnnhư khai thác ý kiến, phát triển lên từ những nhu cầu này.Đây là một bài toán lớn nhiều thách thức đối trong lĩnhvực xử lý ngôn ngữ tự nhiên và khai phá văn bản.Theo hướng nghiên cứu thuật toán học máy để xử lýnguồn dữ liệu như đã đề cập, tôi chọn đề tài “Nghiên cứuthuật toán học máy SVM và ứng dụng trong bài toán khaiphá ý kiến phản hồi của khách hàng trên website” làm đềtài luận văn thạc sỹ của mình.Luận văn gồm 3 chương chính với các nội dung sau:Chương 1 – Tổng quan về học máy và bài toán khai phá ýkiến phản hồi khách hàng - trình bày các khái niệm về cơbản của học máy và giới thiệu khái quát về bài toán khai 3phá ý kiến phản hồi khách hàng và ứng dụng của nó trongcác lĩnh vực công nghệ thông tin.Chương 2 – Phương pháp học máy SVM – trình bày cơ sởthuật toán học máy SVM, các dạng SVM và ứng dụng củaSVM.Chương 3 - Ứng dụng SVM vào bài toán khai phá ý kiếnphản hồi khách hàng trên website – xây dựng mô hình ứngdụng SVM vào việc giải quyết bài toán khai phá ý kiếnphản hồi khách hàng trên website, cài đặt thử nghiệm vàđánh giá kết quả thu được.Chương 1 – TỔNG QUAN VỀ HỌC MÁY VÀ BÀITOÁN KHAI PHÁ Ý KIẾN PHẢN HỒI KHÁCHHÀNG1.1. Tổng quan về học máy1.1.1. Giới thiệu học máy Học máy (Machine Learning) là một ngành khoahọc nghiên cứu các thuật toán cho phép máy tính có thểhọc được các khái niệm (concept). Cụ thể hơn, học máy làmột phương pháp để tạo ra các chương trình máy tính 4bằng việc phân tích các tập dữ liệu. Học máy có liên quanmật thiết đến thống kê, vì cả hai lĩnh vực đều nghiên cứuviệc phân tích dữ liệu. Tuy nhiên khác với thống kê, họcmáy tập trung vào sự phức tạp của các giải thuật trong việcthực thi tính toán.1.1.2. Học không giám sát, học có giám sát và học bán giám sát1.1.2.1. Học không giám sát Học máy không giám sát (unsupervised learning) làphương pháp học máy nhằm tìm ra một mô hình phù hợpvới các quan sát. Cho trước một mẫu chỉ gồm các đốitượng (objects),cần tìm kiếm cấu trúc quan tâm(interesting structures) của dữ liệu, và nhóm các đối tượnggiống nhau.1.1.2.2. Học có giám sát Học có giám sát (supervised learning) là một kĩthuật của ngành học máy để xây dựng một hàm (function)từ tập dữ liệu huấn luyện. Dữ liệu huấn luyện bao gồm cáccặp gồm đối tượng đầu vào (thường dạng vec-tơ), và đầura mong muốn. Đầu ra của một hàm có thể là một giá trị 5liên tục (gọi là hồi qui), hay có thể là dự đoán một nhãnphân loại cho một đối tượng đầu vào (gọi là phân loại).1.1.2.3. Học bán giám sát Học bán giám sát (semi-supervised learning) là mộtlớp của kỹ thuật học máy, sử dụng cả dữ liệu đã gán nhãnvà chưa gán nhãn để huấn luyện - điển hình là một lượngnhỏ dữ liệu có gán nhãn cùng với lượng lớn dữ liệu chưagán nhãn. Học bán giám sát đứng giữa học không giám sát(không có bất kì dữ liệu đã được nhãn nào) và có giám sát(toàn bộ dữ liệu đều được g ...
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Nghiên cứu thuật toán học máy SVM và ứng dụng trong bài toán khai phá ý kiến phản hồi của khách hàng trên website HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- NGUYỄN THỊ LAN ANH NGHIÊN CỨU THUẬT TOÁN HỌC MÁY SVM VÀ ỨNG DỤNG TRONG BÀI TOÁN KHAI PHÁ Ý KIẾN PHẢN HỒI CỦA KHÁCH HÀNG TRÊN WEBSITE Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ Hà Nội - 2013 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS HOÀNG XUÂN DẬU Phản biện 1: …………………………………………………………………… Phản biện 2: …………………………………………………………………… Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ............... Có thể tìm hiểu luận văn tại: - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1MỞ ĐẦUVới sự phát triển mạnh mẽ của mạng Internet, thương mạiđiện tử, thời đại của công nghệ thông tin. Mọi người có cơhội chia sẽ những ý kiến, quan điểm của mình, đưa các bàiđánh giá về các sản phẩm tại các trang web thương mạiđiện tử và diễn đạt quan điểm của họ trên hầu hết bất kỳthứ gì ở diễn đàn, nhóm thảo luận và các blog, các tácphẩm văn học mà họ đọc, chúng được gọi chung là nộidung do người dùng tạo ra. Một cá nhân nếu muốn muamột sản phẩm, cá nhân đó không nhất thiết phải giới hạntham khảo bạn bè và gia đình nữa bởi vì có nhiều ngườiđánh giá sản phẩm trên trang Web đó đưa những ý kiếnliên quan đến việc sử dụng sản phẩm. Đây là nguồn thôngtin quan trọng, cung cấp cho người mua hàng cái nhìn toàndiện hơn về một sản phẩm mà họ định mua. Còn đối vớinhà sản xuất, đánh giá của khách hàng là cơ sở để tiếnhành cải tiến, hoàn thiện sản phẩm của mình.Tuy nhiên, việc tìm kiếm những nguồn ý kiến và giám sátchúng trên Web vẫn là một công việc hết sức khó khăn bởivì có một số lượng lớn những nguồn khác nhau và mỗinguồn ngoài ra còn có số lượng lớn văn bản ý kiến hoặc 2cảm nghĩ. Trong nhiều trường hợp, các ý kiến thường ẩnbên trong những bài viết dài. Điều đó gây khó khăn chongười đọc để tìm kiếm các nguồn liên quan, tríchnhữngcâu liên quan đến quan điểm đánh giá, đọc, tóm tắtvà tổ chức chúng thành dạng có thể sử dụng được.Do đó, việc nghiên cứu phát triển hệ thống tự động là cầnthiết trong việc phát hiện, tổng hợp và phân loại các ýkiến người dùng. Phân tích cảm nghĩ, còn được biết đếnnhư khai thác ý kiến, phát triển lên từ những nhu cầu này.Đây là một bài toán lớn nhiều thách thức đối trong lĩnhvực xử lý ngôn ngữ tự nhiên và khai phá văn bản.Theo hướng nghiên cứu thuật toán học máy để xử lýnguồn dữ liệu như đã đề cập, tôi chọn đề tài “Nghiên cứuthuật toán học máy SVM và ứng dụng trong bài toán khaiphá ý kiến phản hồi của khách hàng trên website” làm đềtài luận văn thạc sỹ của mình.Luận văn gồm 3 chương chính với các nội dung sau:Chương 1 – Tổng quan về học máy và bài toán khai phá ýkiến phản hồi khách hàng - trình bày các khái niệm về cơbản của học máy và giới thiệu khái quát về bài toán khai 3phá ý kiến phản hồi khách hàng và ứng dụng của nó trongcác lĩnh vực công nghệ thông tin.Chương 2 – Phương pháp học máy SVM – trình bày cơ sởthuật toán học máy SVM, các dạng SVM và ứng dụng củaSVM.Chương 3 - Ứng dụng SVM vào bài toán khai phá ý kiếnphản hồi khách hàng trên website – xây dựng mô hình ứngdụng SVM vào việc giải quyết bài toán khai phá ý kiếnphản hồi khách hàng trên website, cài đặt thử nghiệm vàđánh giá kết quả thu được.Chương 1 – TỔNG QUAN VỀ HỌC MÁY VÀ BÀITOÁN KHAI PHÁ Ý KIẾN PHẢN HỒI KHÁCHHÀNG1.1. Tổng quan về học máy1.1.1. Giới thiệu học máy Học máy (Machine Learning) là một ngành khoahọc nghiên cứu các thuật toán cho phép máy tính có thểhọc được các khái niệm (concept). Cụ thể hơn, học máy làmột phương pháp để tạo ra các chương trình máy tính 4bằng việc phân tích các tập dữ liệu. Học máy có liên quanmật thiết đến thống kê, vì cả hai lĩnh vực đều nghiên cứuviệc phân tích dữ liệu. Tuy nhiên khác với thống kê, họcmáy tập trung vào sự phức tạp của các giải thuật trong việcthực thi tính toán.1.1.2. Học không giám sát, học có giám sát và học bán giám sát1.1.2.1. Học không giám sát Học máy không giám sát (unsupervised learning) làphương pháp học máy nhằm tìm ra một mô hình phù hợpvới các quan sát. Cho trước một mẫu chỉ gồm các đốitượng (objects),cần tìm kiếm cấu trúc quan tâm(interesting structures) của dữ liệu, và nhóm các đối tượnggiống nhau.1.1.2.2. Học có giám sát Học có giám sát (supervised learning) là một kĩthuật của ngành học máy để xây dựng một hàm (function)từ tập dữ liệu huấn luyện. Dữ liệu huấn luyện bao gồm cáccặp gồm đối tượng đầu vào (thường dạng vec-tơ), và đầura mong muốn. Đầu ra của một hàm có thể là một giá trị 5liên tục (gọi là hồi qui), hay có thể là dự đoán một nhãnphân loại cho một đối tượng đầu vào (gọi là phân loại).1.1.2.3. Học bán giám sát Học bán giám sát (semi-supervised learning) là mộtlớp của kỹ thuật học máy, sử dụng cả dữ liệu đã gán nhãnvà chưa gán nhãn để huấn luyện - điển hình là một lượngnhỏ dữ liệu có gán nhãn cùng với lượng lớn dữ liệu chưagán nhãn. Học bán giám sát đứng giữa học không giám sát(không có bất kì dữ liệu đã được nhãn nào) và có giám sát(toàn bộ dữ liệu đều được g ...
Tìm kiếm theo từ khóa liên quan:
Tóm tắt luận văn thạc sĩ Luận văn thạc sĩ Luận văn thạc sĩ công nghệ thông tin Nghiên cứu thuật toán học máy svm Đề tài nghiên cứu thuật toán học Ứng dụng khai phá trên webTài liệu liên quan:
-
30 trang 560 0 0
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 367 5 0 -
97 trang 332 0 0
-
97 trang 317 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 304 0 0 -
26 trang 290 0 0
-
155 trang 285 0 0
-
26 trang 277 0 0
-
115 trang 269 0 0
-
64 trang 267 0 0