Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Khai phá dữ liệu vết duyệt web cho tư vấn cá nhân hóa
Số trang: 25
Loại file: pdf
Dung lượng: 1,008.13 KB
Lượt xem: 7
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Đề tài được thực hiện với mục tiêu nhằm xây dựng một mô hình hệ tư vấn tự động trên các website tạp chí Tiếng Việt, nhằm mục đích gợi ý những nội dung liên quan tới sở thích của từng cá nhân người dùng, dựa trên lịch sử duyệt web của họ trên website đó (vết duyệt web). Mời các bạn cùng tham khảo Luận văn.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Khai phá dữ liệu vết duyệt web cho tư vấn cá nhân hóaĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN THẠC ĐAN THANHKHAI PHÁ DỮ LIỆU VẾT DUYỆT WEBCHO TƯ VẤN CÁ NHÂN HÓANgành: Hệ thống thông tinChuyên ngành: Hệ thống thông tinMã số: 60480104TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TINHà Nội - 2016Lời mở đầuĐối mặt với tình trạng bùng nổ thông tin hiện nay, càng ngày bạncàng mất nhiều thời gian trong việc lựa chọn thông tin hay sản phẩm nàophù hợp với mình. Cùng với sự phát triển của thương mại điện tử (ecommerce), hệ tư vấn xuất hiện với vai trò vô cùng quan trọng trong việchỗ trợ người dùng lựa chọn sản phẩm phù hợp đồng thời tăng giá trị kinhdoanh cho doanh nghiệp. Và cho đến nay, hệ tư vấn được ứng dụng rộngkhắp trên nhiều lĩnh vực khác như mạng xã hội, các trang tin tức, giải trí,du lịch,…, với bất cứ thông tin nào người dùng quan tâm thì chúng ta đềucó thể thấy sự xuất hiện của hệ tư vấn.Mặc dù vai trò và lợi ích của một hệ tư vấn là rất lớn, tuy nhiên ởViệt Nam, hệ thống này vẫn chưa thực sự phổ biến và còn khá thô sơ. Đaphần các trang web Việt Nam hiện nay chưa có một hệ thống gợi ý hiệuquả dựa trên profile của người dùng, mà chỉ sử dụng các phương pháp đơngiản như gán nhãn tay (thẻ catagoried tags), thống kê để gợi ý những thôngtin, sản phẩm liên quan với sản phẩm đang được xem, hay gợi ý nhữngthông tin nổi bật nhiều người quan tâm.Chính vì vậy, luận văn mong muốn xây dựng một mô hình hệ tư vấntự động trên các website tạp chí tiếng việt, nhằm mục đích gợi ý những nộidung liên quan tới sở thích của từng cá nhân người dùng, dựa trên lịch sửduyệt web của họ trên website đó (vết duyệt web).Nội dung của luận văn bao gồm những nội dung sau:Chương 1. Hệ tư vấn và bài toán tư vấn: Trình bày những nội dungcơ bản về hệ tư vấn bao gồm mô tả bài toán tư vấn, ứng dụng và các hệthống nổi tiếng, phân loại các kĩ thuật tư vấn.Chương 2. Khai phá dữ liệu vết duyệt web của người dùng cho hệ tưvấn: Phân loại dữ liệu profile người dùng, ưu nhược điểm của từng loại dữliệu và một số nghiên cứu, phương pháp ứng dụng trên các miền dữ liệunày. Giới thiệu về hệ tư vấn nội dung website dựa trên vết duyệt web đượcxây dựng trong luận văn.Chương 3. Mô hình hệ tư vấn nội dung trên website dựa trên vếtduyệt web: Trình bày mô hình tư vấn nội dung trên một website do chúngtôi đề xuất, là mô hình tư vấn cộng tác kết hợp phương pháp ước lượnghạng giả định theo mô hình chủ đề ẩn LDA.Chương 4. Thực nghiệm và đánh giá: Thử nghiệm và đánh giá môhình hệ thống với dữ liệu thực tế từ trang web http://www.otoxemay.vn/ vàhttp://www.emdep.vn/Phần kết luận tổng kết nội dung chính của luận văn, các vấn đề còntồn tại và định hướng phát triển của hệ thống.Chương 1Hệ tư vấn và bài toán tư vấnGiới thiệu về hệ tư vấnHệ tư vấn (recommender system, còn được gọi là hệ gợi ý) là côngcụ phần mềm và kỹ thuật cung cấp các tư vấn về các mục (item; ví dụphim, CD, nhà hàng,…) cho một người dùng [2]. Item là thuật ngữ chungđể chỉ những gì mà hệ thống muốn tư vấn cho người dùng. Một vài hệ tưvấn nổi tiếng [3] như hệ tư vấn phim của MovieLens, tư vấn sách và CDscủa Amazon.com, tư vấn nhà hàng của Adaptive Place Advisor,…1.1Bài toán tư vấnTheo Adomavicius và Tuzhilin trong [5], trong hầu hết các trườnghợp, bài toán tư vấn được coi là bài toán ước lượng trước hạng của các itemchưa được người dùng xem xét. Việc ước lượng này thường dựa trên nhữngđánh giá đã có của chính người dùng đó hoặc những người dùng khác.Những item có hạng cao nhất sẽ được dùng để tư vấn. Một cách hình thức,bài toán tư vấn được mô tả như sau:Gọi C là tập tất cả người dùng; S là tập tất cả các item có thể tư vấn.Hàm u(c,s) đo độ phù hợp (hay hạng) của item s với user c: u: C x S → R.Với mỗi người dùng c ∈ C, cần tìm sản phẩm s′ ∈ S sao cho hàm u(c, s’) đạtgiá trị lớn nhất: ∀c ∈ C, s′c = arg max u(c, s’), s’ ∈ SVấn đề chính của hệ tư vấn là các giá trị hàm u chưa có được trêntoàn không gian R mà chỉ trên một miền nhỏ của không gian đó. Nhiệm vụcủa hệ tư vấn là ngoại suy, dự đoán hạng mà người dùng ci đánh giá mộtitem sj chưa được đánh giá, từ đó đưa ra danh sách các item có hạng caonhất với người dùng ci.1.2Các kĩ thuật tư vấnCác hệ thống tư vấn thường được phân thành bốn loại dựa trên kỹthuật tư vấn [4]:- Dựa trên nội dung (content-based): người dùng được gợi ý những sảnphẩm tương tự như các sản phẩm từng được họ đánh giá cao.- Cộng tác (collaborative): người dùng được gợi ý những sản phẩmđược đánh giá cao bởi những người có cùng sở thích với họ.- Dựa trên tri thức (knowledge-based): người dùng được gợi ý các sảnphẩm đáp ứng với các yêu cầu đặt ra của họ.- Lai ghép (hybrid): kết hợp các phương pháp trên.1.3Kĩ thuật tư vấn dựa trên nội dungHệ tư vấn dựa trên nội dung đưa ra các tư vấn dựa trên phỏng đoánrằng một người có thể thích các sản phẩm có nhiều đặc trưng tương tự với1.3.1các sản phẩm mà họ đã từng ưa thích. Theo [5], với phương pháp tư vấndựa trên nội dung, độ phù hợp u(c, s) của sản phẩm s với người dùng cđược đánh giá dựa trên độ phù hợp u(c, si), trong đó si ϵ S và “tương tự”như s. Ví dụ, để gợi ý một bộ phim cho người dùng c, hệ thống tư vấn sẽtìm các đặc điểm của những bộ phim từng được c đánh giá cao (như diễnviên, đạo diễn…); sau đó chỉ những bộ phim tương đồng với sở thích của cmới được giới thiệu.Hình 1.1 Tư vấn dựa trên nội dung [7]Phương pháp tư vấn theo nội dung làm việc khá hiệu quả với các tàiliệu văn bản và đã có nhiều ứng dụng trên thực tế như hệ thống lọc email,thư rác… phương pháp này vẫn được khá nhiều hệ thống tư vấn sử dụng dotính dễ cài đặt, và hiệu quả trong xử lý dữ liệu là văn bản. Nhược điểmchính của phương pháp này là gặp khó khăn trong vấn đề trích chọn đặctrưng với kiểu dữ liệu không phải là văn bản.Kĩ thuật tư vấn cộng tácTheo Adomavicius và cộng sự [5], không giống như phương pháp tưvấn dựa trên nội dung, hệ thống cộng tác dự đoán đ ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Khai phá dữ liệu vết duyệt web cho tư vấn cá nhân hóaĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN THẠC ĐAN THANHKHAI PHÁ DỮ LIỆU VẾT DUYỆT WEBCHO TƯ VẤN CÁ NHÂN HÓANgành: Hệ thống thông tinChuyên ngành: Hệ thống thông tinMã số: 60480104TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TINHà Nội - 2016Lời mở đầuĐối mặt với tình trạng bùng nổ thông tin hiện nay, càng ngày bạncàng mất nhiều thời gian trong việc lựa chọn thông tin hay sản phẩm nàophù hợp với mình. Cùng với sự phát triển của thương mại điện tử (ecommerce), hệ tư vấn xuất hiện với vai trò vô cùng quan trọng trong việchỗ trợ người dùng lựa chọn sản phẩm phù hợp đồng thời tăng giá trị kinhdoanh cho doanh nghiệp. Và cho đến nay, hệ tư vấn được ứng dụng rộngkhắp trên nhiều lĩnh vực khác như mạng xã hội, các trang tin tức, giải trí,du lịch,…, với bất cứ thông tin nào người dùng quan tâm thì chúng ta đềucó thể thấy sự xuất hiện của hệ tư vấn.Mặc dù vai trò và lợi ích của một hệ tư vấn là rất lớn, tuy nhiên ởViệt Nam, hệ thống này vẫn chưa thực sự phổ biến và còn khá thô sơ. Đaphần các trang web Việt Nam hiện nay chưa có một hệ thống gợi ý hiệuquả dựa trên profile của người dùng, mà chỉ sử dụng các phương pháp đơngiản như gán nhãn tay (thẻ catagoried tags), thống kê để gợi ý những thôngtin, sản phẩm liên quan với sản phẩm đang được xem, hay gợi ý nhữngthông tin nổi bật nhiều người quan tâm.Chính vì vậy, luận văn mong muốn xây dựng một mô hình hệ tư vấntự động trên các website tạp chí tiếng việt, nhằm mục đích gợi ý những nộidung liên quan tới sở thích của từng cá nhân người dùng, dựa trên lịch sửduyệt web của họ trên website đó (vết duyệt web).Nội dung của luận văn bao gồm những nội dung sau:Chương 1. Hệ tư vấn và bài toán tư vấn: Trình bày những nội dungcơ bản về hệ tư vấn bao gồm mô tả bài toán tư vấn, ứng dụng và các hệthống nổi tiếng, phân loại các kĩ thuật tư vấn.Chương 2. Khai phá dữ liệu vết duyệt web của người dùng cho hệ tưvấn: Phân loại dữ liệu profile người dùng, ưu nhược điểm của từng loại dữliệu và một số nghiên cứu, phương pháp ứng dụng trên các miền dữ liệunày. Giới thiệu về hệ tư vấn nội dung website dựa trên vết duyệt web đượcxây dựng trong luận văn.Chương 3. Mô hình hệ tư vấn nội dung trên website dựa trên vếtduyệt web: Trình bày mô hình tư vấn nội dung trên một website do chúngtôi đề xuất, là mô hình tư vấn cộng tác kết hợp phương pháp ước lượnghạng giả định theo mô hình chủ đề ẩn LDA.Chương 4. Thực nghiệm và đánh giá: Thử nghiệm và đánh giá môhình hệ thống với dữ liệu thực tế từ trang web http://www.otoxemay.vn/ vàhttp://www.emdep.vn/Phần kết luận tổng kết nội dung chính của luận văn, các vấn đề còntồn tại và định hướng phát triển của hệ thống.Chương 1Hệ tư vấn và bài toán tư vấnGiới thiệu về hệ tư vấnHệ tư vấn (recommender system, còn được gọi là hệ gợi ý) là côngcụ phần mềm và kỹ thuật cung cấp các tư vấn về các mục (item; ví dụphim, CD, nhà hàng,…) cho một người dùng [2]. Item là thuật ngữ chungđể chỉ những gì mà hệ thống muốn tư vấn cho người dùng. Một vài hệ tưvấn nổi tiếng [3] như hệ tư vấn phim của MovieLens, tư vấn sách và CDscủa Amazon.com, tư vấn nhà hàng của Adaptive Place Advisor,…1.1Bài toán tư vấnTheo Adomavicius và Tuzhilin trong [5], trong hầu hết các trườnghợp, bài toán tư vấn được coi là bài toán ước lượng trước hạng của các itemchưa được người dùng xem xét. Việc ước lượng này thường dựa trên nhữngđánh giá đã có của chính người dùng đó hoặc những người dùng khác.Những item có hạng cao nhất sẽ được dùng để tư vấn. Một cách hình thức,bài toán tư vấn được mô tả như sau:Gọi C là tập tất cả người dùng; S là tập tất cả các item có thể tư vấn.Hàm u(c,s) đo độ phù hợp (hay hạng) của item s với user c: u: C x S → R.Với mỗi người dùng c ∈ C, cần tìm sản phẩm s′ ∈ S sao cho hàm u(c, s’) đạtgiá trị lớn nhất: ∀c ∈ C, s′c = arg max u(c, s’), s’ ∈ SVấn đề chính của hệ tư vấn là các giá trị hàm u chưa có được trêntoàn không gian R mà chỉ trên một miền nhỏ của không gian đó. Nhiệm vụcủa hệ tư vấn là ngoại suy, dự đoán hạng mà người dùng ci đánh giá mộtitem sj chưa được đánh giá, từ đó đưa ra danh sách các item có hạng caonhất với người dùng ci.1.2Các kĩ thuật tư vấnCác hệ thống tư vấn thường được phân thành bốn loại dựa trên kỹthuật tư vấn [4]:- Dựa trên nội dung (content-based): người dùng được gợi ý những sảnphẩm tương tự như các sản phẩm từng được họ đánh giá cao.- Cộng tác (collaborative): người dùng được gợi ý những sản phẩmđược đánh giá cao bởi những người có cùng sở thích với họ.- Dựa trên tri thức (knowledge-based): người dùng được gợi ý các sảnphẩm đáp ứng với các yêu cầu đặt ra của họ.- Lai ghép (hybrid): kết hợp các phương pháp trên.1.3Kĩ thuật tư vấn dựa trên nội dungHệ tư vấn dựa trên nội dung đưa ra các tư vấn dựa trên phỏng đoánrằng một người có thể thích các sản phẩm có nhiều đặc trưng tương tự với1.3.1các sản phẩm mà họ đã từng ưa thích. Theo [5], với phương pháp tư vấndựa trên nội dung, độ phù hợp u(c, s) của sản phẩm s với người dùng cđược đánh giá dựa trên độ phù hợp u(c, si), trong đó si ϵ S và “tương tự”như s. Ví dụ, để gợi ý một bộ phim cho người dùng c, hệ thống tư vấn sẽtìm các đặc điểm của những bộ phim từng được c đánh giá cao (như diễnviên, đạo diễn…); sau đó chỉ những bộ phim tương đồng với sở thích của cmới được giới thiệu.Hình 1.1 Tư vấn dựa trên nội dung [7]Phương pháp tư vấn theo nội dung làm việc khá hiệu quả với các tàiliệu văn bản và đã có nhiều ứng dụng trên thực tế như hệ thống lọc email,thư rác… phương pháp này vẫn được khá nhiều hệ thống tư vấn sử dụng dotính dễ cài đặt, và hiệu quả trong xử lý dữ liệu là văn bản. Nhược điểmchính của phương pháp này là gặp khó khăn trong vấn đề trích chọn đặctrưng với kiểu dữ liệu không phải là văn bản.Kĩ thuật tư vấn cộng tácTheo Adomavicius và cộng sự [5], không giống như phương pháp tưvấn dựa trên nội dung, hệ thống cộng tác dự đoán đ ...
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Công nghệ thông tin Dữ liệu vết duyệt web Mô hình hệ tư vấn tự động Lịch sử duyệt web Vết duyệt webGợi ý tài liệu liên quan:
-
52 trang 411 1 0
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 358 5 0 -
97 trang 310 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 297 0 0 -
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 291 0 0 -
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 286 0 0 -
74 trang 275 0 0
-
96 trang 275 0 0
-
97 trang 270 0 0
-
Tài liệu dạy học môn Tin học trong chương trình đào tạo trình độ cao đẳng
348 trang 265 1 0