Tóm tắt Luận án tiến sĩ Kỹ thuật: Một số phương pháp học máy xác định đặc điểm người dùng trên mạng internet
Số trang: 28
Loại file: pdf
Dung lượng: 608.77 KB
Lượt xem: 12
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận án này thực hiện các nghiên cứu trên cả hai lĩnh vực: xác định đặc điểm tác giả văn bản và xác định đặc điểm người dùng dựa trên hành vi. Các nghiên cứu về xác định đặc điểm tác giả văn bản được thực hiện trên các văn bản tiếng Việt là loại ngôn ngữ chưa được nghiên cứu nhiều.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án tiến sĩ Kỹ thuật: Một số phương pháp học máy xác định đặc điểm người dùng trên mạng internet BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Dương Trần Đức MỘT SỐ PHƯƠNG PHÁP HỌC MÁY XÁC ĐỊNHĐẶC ĐIỂM NGƯỜI DÙNG TRÊN MẠNG INTERNET Chuyên ngành: Kỹ thuật máy tính Mã số: 9.48.01.06 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT Hà Nội – Năm 2018Công trình được hoàn thành tại: Học viện Công nghệ Bưu chínhViễn thôngNgười hướng dẫn khoa học: PGS. TS. Phạm Bảo Sơn TS. Tân HạnhPhản biện 1:…………………………………………… …………………………………………….Phản biện 2:…………………………………………… …………………………………………….Phản biện 3…………………………………………… …………………………………………….Luận án được bảo vệ trước Hội đồng chấm luận cấp Học việnhọp tại: Học viện Công nghệ Bưu chính Viễn thôngVào hồi giờ ngày tháng năm Có thể tìm hiểu luận án tại thư viện: Học viện Công nghệ Bưuchính Viễn thông 1 MỞ ĐẦU Ngày nay, chỉ với một thiết bị được kết nối đến mạng Internet,người dùng có thể dễ dàng sử dụng các kênh trao đổi thông tin nhưwebsite, email, diễn đàn, mạng xã hội, hoặc các dịch vụ khác nhưtìm kiếm thông tin, thương mại điện tử (TMĐT) v.v. Một đặc điểmchung của các hệ thống này là không bắt buộc người dùng cung cấpchính xác thông tin cá nhân khi sử dụng. Việc này nhằm khuyếnkhích người dùng trong quá trình sử dụng, tuy nhiên cũng tạo ra mộtsố vấn đề như người dùng nặc danh hoặc giả mạo, hay việc cá nhânhóa hệ thống nhằm tăng trải nghiệm cho người dùng, thúc đẩy bánhàng, quảng cáo trực tuyến khó được thực hiện một cách hiệu quả.Do đó, xác định đặc điểm người dùng là một trong những mối quantâm hàng đầu của các nhà cung cấp dịch vụ trên mạng Internet. Tuynhiên, có nhiều người dùng không tự tiết lộ các thông tin cá nhân docác vấn đề về an toàn và riêng tư. Vì vậy, để có được thông tin cá cánhân người dùng, cần phải dự đoán từ các “dấu vết” người dùng đểlại trên hệ thống, có thể là các văn bản hoặc các hành vi ngườ dùngđã thực hiện. Luận án này thực hiện các nghiên cứu trên cả hai lĩnh vực: xácđịnh đặc điểm tác giả văn bản và xác định đặc điểm người dùng dựatrên hành vi. Các nghiên cứu về xác định đặc điểm tác giả văn bảnđược thực hiện trên các văn bản tiếng Việt là loại ngôn ngữ chưađược nghiên cứu nhiều. Các nghiên cứu về xác định đặc điểm ngườidùng dựa trên hành vi được thực hiện trên dữ liệu của hệ thốngthương mại điện tử, là loại hệ thống có nhu cầu cao trong việc cánhân hóa nhằm giới thiệu sản phẩm và quảng cáo đúng mục tiêu. 21. MỤC TIÊU CỦA LUẬN ÁN Dựa trên nhu cầu thực tiễn và các kết quả nghiên cứu trướcđây ở trong nước và quốc tế, luận án đặt ra các mục tiêu chính nhưsau:- Nghiên cứu vấn đề xác định đặc điểm tác giả văn bản trên loại văn bản mới, chưa được nghiên cứu trước đây. Nghiên cứu các phương pháp trích chọn đặc trưng mới cho vấn đề xác định đặc điểm tác giả văn bản, nhằm tăng độ chính xác hoặc tính độc lập trong quá trình nhận diện, có thể tận dụng các đặc điểm đặc thù của ngôn ngữ tiếng Việt- Nghiên cứu vấn đề xác định đặc điểm người dùng dựa trên hành vi trong các hệ thống có nhu cầu cá nhân hóa cao như hệ thống TMĐT. Nghiên cứu, đề xuất các phương pháp trích chọn đặc trưng hiệu quả và các phương pháp phân loại phù hợp.2. PHẠM VI NGHIÊN CỨU Xác định đặc điểm người dùng là một lĩnh vực rộng, trên cảkhía cạnh loại người dùng và đặc điểm người dùng. Luận án xác địnhcác đối tượng người dùng trong các nghiên cứu là người dùng trênmạng Internet. Đối với nghiên cứu xác định đặc điểm người dùng dựa trênphân tích văn bản, luận án này thực hiện các nghiên cứu về xác địnhđặc điểm tác giả bài viết diễn đàn tiếng Việt với các đặc điểm nhậndiện bao gồm giới tính, độ tuổi, nghề nghiệp, và vùng miền. Xácđịnh đặc điểm người dùng dựa trên phân tích hành vi có sự hạn chếtrong vấn đề thu thập dữ liệu mẫu, luận án này chỉ thực hiện nghiên 3cứu về dự đoán đặc điểm giới tính của khách hàng dựa trên dữ liệutruy cập hệ thống TMĐT.3. CÁC ĐÓNG GÓP CỦA LUẬN ÁN Đóng góp trong lĩnh vực xác định đặc điểm tác giả vănbản: - Nghiên cứu việc ứng dụng các loại đặc trưng và phương pháp nhận diện khác nhau, trong đó tập trung phân tích sâu về các đặc trưng dựa trên nội dung. Đề xuất một phương pháp nhận diện dựa trên loại đặc trưng mới là theo âm tiết và vần trong tiếng Việt. Loại đặc trưng này cho độ chính xác cao hơn khi kết hợp và có tính độc lập dữ liệu hơn so với các đặc trưng nội dung. Đóng góp trong lĩnh vực xác định đặc điểm người dùngdựa trên hành vi: - Nghiên cứu vấn đề dự đoán giới tính khách hàng dựa trên dữ liệu lịch sử truy cập hệ TMĐT. Luận án nghiên cứu các phương pháp trích chọn đặc trưng và phân loại hiệu quả, trong đó đề xuất phương pháp trích chọn đặc trưng sử dụng biểu diễn dạng cây của danh sách sản phẩm và phân loại.4. BỐ CỤC CỦA LUẬN ÁN Nội dung của luận án bao gồm 3 chương và một phụ lục.Chương 1 khảo sát và đánh giá các công trình đã thực hiện trong lĩnhvực nghiên cứu của luận án. Chương 2 trình bày về vấn đề xác địnhđặc điểm tác giả bài viết diễn đàn tiếng Việt, bao gồm phương pháptiếp cận và các kết quả thực nghiệm. Chương 3 mô tả các kết quả 4nghiên cứu về dự đoán giới tính khách hàng dựa trên dữ liệu lịch sửtruy cập hệ TMĐT. Phần cuối của luận án trình bày các kết luận vàhướng nghiên cứu tiếp theo. Phần phụ lục trình bày về ứng dụng thửnghiệm dịch vụ xác định đặc điểm tác giả văn bản tiếng Việt. CHƯƠNG 1 TỔNG QUAN ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án tiến sĩ Kỹ thuật: Một số phương pháp học máy xác định đặc điểm người dùng trên mạng internet BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Dương Trần Đức MỘT SỐ PHƯƠNG PHÁP HỌC MÁY XÁC ĐỊNHĐẶC ĐIỂM NGƯỜI DÙNG TRÊN MẠNG INTERNET Chuyên ngành: Kỹ thuật máy tính Mã số: 9.48.01.06 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT Hà Nội – Năm 2018Công trình được hoàn thành tại: Học viện Công nghệ Bưu chínhViễn thôngNgười hướng dẫn khoa học: PGS. TS. Phạm Bảo Sơn TS. Tân HạnhPhản biện 1:…………………………………………… …………………………………………….Phản biện 2:…………………………………………… …………………………………………….Phản biện 3…………………………………………… …………………………………………….Luận án được bảo vệ trước Hội đồng chấm luận cấp Học việnhọp tại: Học viện Công nghệ Bưu chính Viễn thôngVào hồi giờ ngày tháng năm Có thể tìm hiểu luận án tại thư viện: Học viện Công nghệ Bưuchính Viễn thông 1 MỞ ĐẦU Ngày nay, chỉ với một thiết bị được kết nối đến mạng Internet,người dùng có thể dễ dàng sử dụng các kênh trao đổi thông tin nhưwebsite, email, diễn đàn, mạng xã hội, hoặc các dịch vụ khác nhưtìm kiếm thông tin, thương mại điện tử (TMĐT) v.v. Một đặc điểmchung của các hệ thống này là không bắt buộc người dùng cung cấpchính xác thông tin cá nhân khi sử dụng. Việc này nhằm khuyếnkhích người dùng trong quá trình sử dụng, tuy nhiên cũng tạo ra mộtsố vấn đề như người dùng nặc danh hoặc giả mạo, hay việc cá nhânhóa hệ thống nhằm tăng trải nghiệm cho người dùng, thúc đẩy bánhàng, quảng cáo trực tuyến khó được thực hiện một cách hiệu quả.Do đó, xác định đặc điểm người dùng là một trong những mối quantâm hàng đầu của các nhà cung cấp dịch vụ trên mạng Internet. Tuynhiên, có nhiều người dùng không tự tiết lộ các thông tin cá nhân docác vấn đề về an toàn và riêng tư. Vì vậy, để có được thông tin cá cánhân người dùng, cần phải dự đoán từ các “dấu vết” người dùng đểlại trên hệ thống, có thể là các văn bản hoặc các hành vi ngườ dùngđã thực hiện. Luận án này thực hiện các nghiên cứu trên cả hai lĩnh vực: xácđịnh đặc điểm tác giả văn bản và xác định đặc điểm người dùng dựatrên hành vi. Các nghiên cứu về xác định đặc điểm tác giả văn bảnđược thực hiện trên các văn bản tiếng Việt là loại ngôn ngữ chưađược nghiên cứu nhiều. Các nghiên cứu về xác định đặc điểm ngườidùng dựa trên hành vi được thực hiện trên dữ liệu của hệ thốngthương mại điện tử, là loại hệ thống có nhu cầu cao trong việc cánhân hóa nhằm giới thiệu sản phẩm và quảng cáo đúng mục tiêu. 21. MỤC TIÊU CỦA LUẬN ÁN Dựa trên nhu cầu thực tiễn và các kết quả nghiên cứu trướcđây ở trong nước và quốc tế, luận án đặt ra các mục tiêu chính nhưsau:- Nghiên cứu vấn đề xác định đặc điểm tác giả văn bản trên loại văn bản mới, chưa được nghiên cứu trước đây. Nghiên cứu các phương pháp trích chọn đặc trưng mới cho vấn đề xác định đặc điểm tác giả văn bản, nhằm tăng độ chính xác hoặc tính độc lập trong quá trình nhận diện, có thể tận dụng các đặc điểm đặc thù của ngôn ngữ tiếng Việt- Nghiên cứu vấn đề xác định đặc điểm người dùng dựa trên hành vi trong các hệ thống có nhu cầu cá nhân hóa cao như hệ thống TMĐT. Nghiên cứu, đề xuất các phương pháp trích chọn đặc trưng hiệu quả và các phương pháp phân loại phù hợp.2. PHẠM VI NGHIÊN CỨU Xác định đặc điểm người dùng là một lĩnh vực rộng, trên cảkhía cạnh loại người dùng và đặc điểm người dùng. Luận án xác địnhcác đối tượng người dùng trong các nghiên cứu là người dùng trênmạng Internet. Đối với nghiên cứu xác định đặc điểm người dùng dựa trênphân tích văn bản, luận án này thực hiện các nghiên cứu về xác địnhđặc điểm tác giả bài viết diễn đàn tiếng Việt với các đặc điểm nhậndiện bao gồm giới tính, độ tuổi, nghề nghiệp, và vùng miền. Xácđịnh đặc điểm người dùng dựa trên phân tích hành vi có sự hạn chếtrong vấn đề thu thập dữ liệu mẫu, luận án này chỉ thực hiện nghiên 3cứu về dự đoán đặc điểm giới tính của khách hàng dựa trên dữ liệutruy cập hệ thống TMĐT.3. CÁC ĐÓNG GÓP CỦA LUẬN ÁN Đóng góp trong lĩnh vực xác định đặc điểm tác giả vănbản: - Nghiên cứu việc ứng dụng các loại đặc trưng và phương pháp nhận diện khác nhau, trong đó tập trung phân tích sâu về các đặc trưng dựa trên nội dung. Đề xuất một phương pháp nhận diện dựa trên loại đặc trưng mới là theo âm tiết và vần trong tiếng Việt. Loại đặc trưng này cho độ chính xác cao hơn khi kết hợp và có tính độc lập dữ liệu hơn so với các đặc trưng nội dung. Đóng góp trong lĩnh vực xác định đặc điểm người dùngdựa trên hành vi: - Nghiên cứu vấn đề dự đoán giới tính khách hàng dựa trên dữ liệu lịch sử truy cập hệ TMĐT. Luận án nghiên cứu các phương pháp trích chọn đặc trưng và phân loại hiệu quả, trong đó đề xuất phương pháp trích chọn đặc trưng sử dụng biểu diễn dạng cây của danh sách sản phẩm và phân loại.4. BỐ CỤC CỦA LUẬN ÁN Nội dung của luận án bao gồm 3 chương và một phụ lục.Chương 1 khảo sát và đánh giá các công trình đã thực hiện trong lĩnhvực nghiên cứu của luận án. Chương 2 trình bày về vấn đề xác địnhđặc điểm tác giả bài viết diễn đàn tiếng Việt, bao gồm phương pháptiếp cận và các kết quả thực nghiệm. Chương 3 mô tả các kết quả 4nghiên cứu về dự đoán giới tính khách hàng dựa trên dữ liệu lịch sửtruy cập hệ TMĐT. Phần cuối của luận án trình bày các kết luận vàhướng nghiên cứu tiếp theo. Phần phụ lục trình bày về ứng dụng thửnghiệm dịch vụ xác định đặc điểm tác giả văn bản tiếng Việt. CHƯƠNG 1 TỔNG QUAN ...
Tìm kiếm theo từ khóa liên quan:
Kỹ thuật máy tính Luận án tiến sĩ Kỹ thuật Phương pháp học máy Đặc điểm của văn bản trực tuyến Đặc điểm người dùngGợi ý tài liệu liên quan:
-
32 trang 231 0 0
-
27 trang 185 0 0
-
200 trang 159 0 0
-
Trích xuất danh mục khía cạnh sử dụng BERT với hàm mất mát cân bằng
9 trang 134 0 0 -
142 trang 130 0 0
-
Luận án Tiến sĩ Kỹ thuật: Nghiên cứu và phát triển hệ thống năng lượng điện mặt trời
142 trang 127 0 0 -
Giáo trình môn xử lý tín hiệu số - Chương 5
12 trang 121 0 0 -
Tóm tắt Luận án tiến sĩ Kỹ thuật: Mô hình hóa và điều khiển dự báo hệ thống phân phối vật liệu nano
27 trang 120 0 0 -
27 trang 109 0 0
-
27 trang 102 0 0