Phương pháp biểu diễn cây cho dự đoán giới tính khách hàng dựa trên dữ liệu thương mại điện tử
Số trang: 7
Loại file: pdf
Dung lượng: 1.06 MB
Lượt xem: 16
Lượt tải: 0
Xem trước 1 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết này đề xuất một phương pháp dự đoán giới tính của khách hàng dựa trên dữ liệu lịch sử truy cập hệ thống TMĐT. Chúng tôi sử dụng phương pháp học máy trên một tập các đặc trưng được trích xuất từ thông tin xem sản phẩm của người dùng để dự đoán giới tính của họ.
Nội dung trích xuất từ tài liệu:
Phương pháp biểu diễn cây cho dự đoán giới tính khách hàng dựa trên dữ liệu thương mại điện tử Dương Trần Đức<br /> <br /> <br /> <br /> PHƢƠNG PHÁP BIỂU DIỄN CÂY CHO DỰ<br /> ĐOÁN GIỚI TÍNH KHÁCH HÀNG DỰA TRÊN<br /> DỮ LIỆU THƢƠNG MẠI ĐIỆN TỬ<br /> Dƣơng Trần Đức<br /> Học viện Công nghệ Bưu chính Viễn thông<br /> <br /> <br /> <br /> Tóm tắtt: Các đặc điểm cá nhân của khách hàng thi trong trƣờng hợp khách hàng truy cập lần đầu hoặc<br /> nhƣ giới tính, độ tuổi, v.v. cung cấp các thông tin khách hàng chƣa đăng ký sử dụng hệ thống. Ngƣợc<br /> quan trọng cho các nhà cung cấp dịch vụ thƣơng mại lại, phƣơng pháp cá nhân hóa dựa trên đặc điểm cá<br /> điện tử (TMĐT) trong các hoạt động quảng cáo và cá nhân của ngƣời dùng hữu ích kể cả khi ngƣời dùng<br /> nhân hóa hệ thống. Tuy nhiên, khách hàng trực tuyến chƣa từng sử dụng hệ thống. Tuy nhiên, các thông tin<br /> thƣờng hạn chế cung cấp thông tin do vấn đề riêng tƣ. về đặc điểm cá nhân của ngƣời dùng thƣờng khó thu<br /> Bài báo này đề xuất một phƣơng pháp dự đoán giới thập đƣợc, do ngƣời dùng Internet thƣờng không sẵn<br /> sàng cung cấp các thông tin cá nhân có tính riêng tƣ.<br /> tính của khách hàng dựa trên dữ liệu lịch sử truy cập<br /> Vì lý do này, trong nhiều trƣờng hợp, cách duy nhất để<br /> hệ thống TMĐT. Chúng tôi sử dụng phƣơng pháp học có đƣợc thông tin đặc điểm cá nhân của ngƣời dùng là<br /> máy trên một tập các đặc trƣng đƣợc trích xuất từ dự đoán dựa trên các dữ liệu khác mà ngƣời dùng để<br /> thông tin xem sản phẩm của ngƣời dùng để dự đoán lại trên hệ thống.<br /> giới tính của họ. Các thực nghiệm đƣợc thực hiện trên<br /> tập dữ liệu đƣợc cung cấp trong khuôn khổ cuộc thi Vấn đề dự đoán đặc điểm ngƣời dùng dựa trên<br /> về khai phá dữ liệu trong Hội nghị PAKDD’15. Kết phân tích văn bản (còn gọi dự đoán đặc điểm tác giả<br /> quả có độ chính xác 81.9% trên độ đo chính xác cân văn bản - author profiling) đã đƣợc nghiên cứu trong<br /> bằng và 82.3% trên độ đo macro F1 cho thấy thuật nhiều thập kỷ, tuy nhiên, trong nhiều trƣờng hợp,<br /> toán học máy và các đặc trƣng đƣợc đề xuất đã mang ngƣời dùng không để lại các văn bản trên hệ thống.<br /> Một phƣơng pháp khác có thể đƣợc sử dụng để dự<br /> lại hiệu quả tốt trong nhận diện giới tính của khách<br /> đoán đặc điểm ngƣời dùng là dựa vào hành vi của họ<br /> hàng.<br /> trên hệ thống, chẳng hạn các hành vi duyệt web ([6],<br /> Từ khóa: học máy, dữ liệu lớn, dự đoán giới tính. [13]), phân tích lƣu lƣợng web ([3]), hoặc hành vi xem<br /> danh mục sản phẩm. Ƣu điểm chính của phƣơng pháp<br /> I. MỞ ĐẦU<br /> tiếp cận này là trong hầu hết các trƣờng hợp, ngƣời<br /> Ngày nay, rất nhiều các ứng dụng web nhƣ các hệ dùng sẽ thực hành các hành vi trên hệ thống nhƣ truy<br /> thống thƣơng mại điện tử (TMĐT), các máy tìm kiếm, cập vào các trang web, nhấp chuột vào các mặt<br /> các hệ thống quảng cáo trực tuyến, sử dụng các đặc hàng/mục tin, xem danh mục sản phẩm v.v.<br /> điểm cá nhân hóa để làm gia tăng sự trải nghiệm của<br /> ngƣời dùng và thúc đẩy hoạt động kinh doanh, bán Trong nghiên cứu này, chúng tôi giải quyết vấn đề<br /> hàng. Với một dịch vụ đƣợc cá nhân hóa tốt, thông tin dự đoán giới tính ngƣời dùng dựa trên dữ liệu xem<br /> hiển thị sẽ đƣợc tối ƣu hóa cho mỗi ngƣời dùng cá danh mục sản phẩm nhƣ thời gian/thời lƣợng xem,<br /> nhân thay vì giống nhau cho toàn bộ ngƣời dùng. danh sách các sản phẩm/loại sản phẩm đã xem v.v.<br /> Chẳng hạn, một hệ thống TMĐT có thể hiển thị các Tập dữ liệu thực nghiệm đƣợc cung cấp bởi Tập đoàn<br /> thông tin khuyến mãi hoặc giới thiệu sản phẩm có liên FPT trong cuộc thi về khai phá dữ liệu trong khuôn<br /> quan đến từng khách hàng thay vì hiển thị quảng cáo khổ Hội nghị Quốc tế về Khai phá dữ liệu và Phát<br /> chung hoặc giới thiệu các sản phẩm ngẫu nhiên. hiện tri thức khu vực Châu Á Thái Bình Dƣơng năm<br /> 2015 (PAKDD’15). Ý tƣởng của phƣơng pháp là khai<br /> Việc cá nhân hóa thông tin hiển thị dựa trên 2 loại thác tối đa mối quan hệ giữa các sản phẩm/loại sản<br /> dữ liệu chính: dữ liệu lịch sử (chẳng hạn các mặt hàng phẩm đƣợc xem trong cùng 1 lƣợt xem dựa trên 1 biểu<br /> trƣớc đó đã xem hoặc đã mua v.v.) và đặc điểm cá diễn dạng cây của danh sách sản phẩm/loại sản phâm.<br /> nhân của ngƣời dùng (chẳng hạn giới tính, độ tuổi, Theo đó, bên cạnh các đặc ...
Nội dung trích xuất từ tài liệu:
Phương pháp biểu diễn cây cho dự đoán giới tính khách hàng dựa trên dữ liệu thương mại điện tử Dương Trần Đức<br /> <br /> <br /> <br /> PHƢƠNG PHÁP BIỂU DIỄN CÂY CHO DỰ<br /> ĐOÁN GIỚI TÍNH KHÁCH HÀNG DỰA TRÊN<br /> DỮ LIỆU THƢƠNG MẠI ĐIỆN TỬ<br /> Dƣơng Trần Đức<br /> Học viện Công nghệ Bưu chính Viễn thông<br /> <br /> <br /> <br /> Tóm tắtt: Các đặc điểm cá nhân của khách hàng thi trong trƣờng hợp khách hàng truy cập lần đầu hoặc<br /> nhƣ giới tính, độ tuổi, v.v. cung cấp các thông tin khách hàng chƣa đăng ký sử dụng hệ thống. Ngƣợc<br /> quan trọng cho các nhà cung cấp dịch vụ thƣơng mại lại, phƣơng pháp cá nhân hóa dựa trên đặc điểm cá<br /> điện tử (TMĐT) trong các hoạt động quảng cáo và cá nhân của ngƣời dùng hữu ích kể cả khi ngƣời dùng<br /> nhân hóa hệ thống. Tuy nhiên, khách hàng trực tuyến chƣa từng sử dụng hệ thống. Tuy nhiên, các thông tin<br /> thƣờng hạn chế cung cấp thông tin do vấn đề riêng tƣ. về đặc điểm cá nhân của ngƣời dùng thƣờng khó thu<br /> Bài báo này đề xuất một phƣơng pháp dự đoán giới thập đƣợc, do ngƣời dùng Internet thƣờng không sẵn<br /> sàng cung cấp các thông tin cá nhân có tính riêng tƣ.<br /> tính của khách hàng dựa trên dữ liệu lịch sử truy cập<br /> Vì lý do này, trong nhiều trƣờng hợp, cách duy nhất để<br /> hệ thống TMĐT. Chúng tôi sử dụng phƣơng pháp học có đƣợc thông tin đặc điểm cá nhân của ngƣời dùng là<br /> máy trên một tập các đặc trƣng đƣợc trích xuất từ dự đoán dựa trên các dữ liệu khác mà ngƣời dùng để<br /> thông tin xem sản phẩm của ngƣời dùng để dự đoán lại trên hệ thống.<br /> giới tính của họ. Các thực nghiệm đƣợc thực hiện trên<br /> tập dữ liệu đƣợc cung cấp trong khuôn khổ cuộc thi Vấn đề dự đoán đặc điểm ngƣời dùng dựa trên<br /> về khai phá dữ liệu trong Hội nghị PAKDD’15. Kết phân tích văn bản (còn gọi dự đoán đặc điểm tác giả<br /> quả có độ chính xác 81.9% trên độ đo chính xác cân văn bản - author profiling) đã đƣợc nghiên cứu trong<br /> bằng và 82.3% trên độ đo macro F1 cho thấy thuật nhiều thập kỷ, tuy nhiên, trong nhiều trƣờng hợp,<br /> toán học máy và các đặc trƣng đƣợc đề xuất đã mang ngƣời dùng không để lại các văn bản trên hệ thống.<br /> Một phƣơng pháp khác có thể đƣợc sử dụng để dự<br /> lại hiệu quả tốt trong nhận diện giới tính của khách<br /> đoán đặc điểm ngƣời dùng là dựa vào hành vi của họ<br /> hàng.<br /> trên hệ thống, chẳng hạn các hành vi duyệt web ([6],<br /> Từ khóa: học máy, dữ liệu lớn, dự đoán giới tính. [13]), phân tích lƣu lƣợng web ([3]), hoặc hành vi xem<br /> danh mục sản phẩm. Ƣu điểm chính của phƣơng pháp<br /> I. MỞ ĐẦU<br /> tiếp cận này là trong hầu hết các trƣờng hợp, ngƣời<br /> Ngày nay, rất nhiều các ứng dụng web nhƣ các hệ dùng sẽ thực hành các hành vi trên hệ thống nhƣ truy<br /> thống thƣơng mại điện tử (TMĐT), các máy tìm kiếm, cập vào các trang web, nhấp chuột vào các mặt<br /> các hệ thống quảng cáo trực tuyến, sử dụng các đặc hàng/mục tin, xem danh mục sản phẩm v.v.<br /> điểm cá nhân hóa để làm gia tăng sự trải nghiệm của<br /> ngƣời dùng và thúc đẩy hoạt động kinh doanh, bán Trong nghiên cứu này, chúng tôi giải quyết vấn đề<br /> hàng. Với một dịch vụ đƣợc cá nhân hóa tốt, thông tin dự đoán giới tính ngƣời dùng dựa trên dữ liệu xem<br /> hiển thị sẽ đƣợc tối ƣu hóa cho mỗi ngƣời dùng cá danh mục sản phẩm nhƣ thời gian/thời lƣợng xem,<br /> nhân thay vì giống nhau cho toàn bộ ngƣời dùng. danh sách các sản phẩm/loại sản phẩm đã xem v.v.<br /> Chẳng hạn, một hệ thống TMĐT có thể hiển thị các Tập dữ liệu thực nghiệm đƣợc cung cấp bởi Tập đoàn<br /> thông tin khuyến mãi hoặc giới thiệu sản phẩm có liên FPT trong cuộc thi về khai phá dữ liệu trong khuôn<br /> quan đến từng khách hàng thay vì hiển thị quảng cáo khổ Hội nghị Quốc tế về Khai phá dữ liệu và Phát<br /> chung hoặc giới thiệu các sản phẩm ngẫu nhiên. hiện tri thức khu vực Châu Á Thái Bình Dƣơng năm<br /> 2015 (PAKDD’15). Ý tƣởng của phƣơng pháp là khai<br /> Việc cá nhân hóa thông tin hiển thị dựa trên 2 loại thác tối đa mối quan hệ giữa các sản phẩm/loại sản<br /> dữ liệu chính: dữ liệu lịch sử (chẳng hạn các mặt hàng phẩm đƣợc xem trong cùng 1 lƣợt xem dựa trên 1 biểu<br /> trƣớc đó đã xem hoặc đã mua v.v.) và đặc điểm cá diễn dạng cây của danh sách sản phẩm/loại sản phâm.<br /> nhân của ngƣời dùng (chẳng hạn giới tính, độ tuổi, Theo đó, bên cạnh các đặc ...
Tìm kiếm theo từ khóa liên quan:
Dữ liệu lớn Dự đoán giới tính Dữ liệu thương mại điện tử Phương pháp học máy Dịch vụ thƣơng mại điện tửGợi ý tài liệu liên quan:
-
Một vài khía cạnh của phân tích dữ liệu lớn trong kinh tế
10 trang 216 0 0 -
Trích xuất danh mục khía cạnh sử dụng BERT với hàm mất mát cân bằng
9 trang 128 0 0 -
Tác động của ứng dụng công nghệ tài chính đến hiệu quả hoạt động của ngân hàng thương mại Việt Nam
10 trang 112 0 0 -
Áp dụng phương pháp học máy để phát hiện tấn công DDoS trong môi trường thực nghiệm mạng SDN
5 trang 97 0 0 -
7 trang 91 0 0
-
Dữ liệu lớn cho nhà quản lý: Phần 1
143 trang 59 0 0 -
Tầm quan trọng của học máy trong phân tích dữ liệu lớn
6 trang 51 0 0 -
Big data và xu hướng ứng dụng trong hoạt động thông tin - thư viện
6 trang 41 0 0 -
Nguồn nhân lực trong mô hình trung tâm tri thức số
7 trang 37 0 0 -
7 trang 35 0 0