Thông tin tài liệu:
Bài viết Mô hình tư vấn lọc cộng tác tích hợp dựa trên ma trận tương đồng sản phẩm đề xuất một phương pháp để cải thiện độ chính xác của mô hình tư vấn lọc cộng tác dựa trên sản phẩm (IBCF) bằng cách tích hợp ma trận tương đồng dựa trên các thuộc tính sản phẩm vào quá trình xây dựng mô hình.
Nội dung trích xuất từ tài liệu:
Mô hình tư vấn lọc cộng tác tích hợp dựa trên ma trận tương đồng sản phẩm
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 1(110).2017 55
MÔ HÌNH TƯ VẤN LỌC CỘNG TÁC TÍCH HỢP DỰA TRÊN MA TRẬN
TƯƠNG ĐỒNG SẢN PHẨM
ITEM-BASED COLLABORATIVE FILTERING RECOMMENDATION MODEL BASED
ON SIMILARITY MATRIX OF ITEMS
Phan Quốc Nghĩa1, Đặng Hoài Phương2, Huỳnh Xuân Hiệp3
1
Trường Đại học Trà Vinh; nghiatvnt@tvu.edu.vn
2
Trường Đại học Bách khoa, Đại học Đà Nẵng; dhphuong@dut.udn.vn
3
Trường Đại học Cần Thơ; hxhiep@ctu.edu.vn
Tóm tắt - Bài báo đề xuất một phương pháp để cải thiện độ chính Abstract - In this paper, we propose a method to improve the
xác của mô hình tư vấn lọc cộng tác dựa trên sản phẩm (IBCF) accuracy of item-based collaborative filtering recommendation model
bằng cách tích hợp ma trận tương đồng dựa trên các thuộc tính (IBCF) by integrating the similarity matrix based on the information of
sản phẩm vào quá trình xây dựng mô hình. Trong mô hình tư vấn item attributes into the process of building recommendation model. It is
lọc cộng tác dựa trên sản phẩm truyền thống, kết quả tư vấn được called integrated recommendation model. In the traditional item-based
xây dựng chỉ dựa trên ma trận xếp hạng của người dùng cho các collaborative filtering recommendation model, the recommendation
sản phẩm. Kết quả tư vấn của mô hình đề xuất được xây dựng results are built based only on the rating matrix of users for the items.
dựa trên hai ma trận tương đồng: (1) ma trận tương đồng dựa trên In this integrated recommendation model, the recommendation results
giá trị hạng của người dùng cho các sản phẩm; (2) ma trận tương are based on two similarity matrices: the similarity matrix based on the
đồng dựa trên thông tin mô tả các sản phẩm. Thông qua thực rating value of users for items and the similarity matrix based on the
nghiệm trên tập dữ liệu MSWeb cho thấy rằng mô hình đề xuất cho information of item attributes. Through experiments on MSWeb
kết quả chính xác hơn mô hình tư vấn lọc cộng tác truyền thống. dataset, it shows that the results of our recommendation model are
more accurate than the results of traditional item-based collaborative
filtering recommendation model.
Từ khóa - độ đo tương đồng; tư vấn lọc cộng tác; ma trận xếp Key words - similarity measures; item-based collaborative filtering
hạng; ma trận tương đồng; ma trận tích hợp. recommendation system; rating matrix; similarity matrix; integrated
similarity matrix.
1. Đặt vấn đề tạo nên một bước cải tiến đáng kể về không gian lưu trữ và
Hệ tư vấn lọc cộng tác dựa trên sản phẩm là một mô hình thời gian chi phí cho các tính toán phức tạp của hệ thống này
hệ tư vấn được phát triển dựa trên hệ tư vấn lọc cộng tác [7], [1], [15].
[14], [19]. Nó được giới thiệu lần đầu tiên trên tạp chí ACM Trong bài viết này, chúng tôi đề xuất một phương pháp
vào năm 2001 [1]. Không lâu sau đó, hệ thống này được để cải thiện độ chính xác của mô hình tư vấn lọc cộng tác
Amazon.com ứng dụng để giới thiệu các sản phẩm của họ dựa trên sản phẩm bằng cách tích hợp ma trận tương đồng
đến người dùng [6]. Khác với hệ tư vấn lọc cộng tác dựa trên dựa trên các thuộc tính sản phẩm vào quá trình xây dựng
người dùng (User-based) sử dụng sự tương đồng giữa các mô hình tư vấn. Trong đó, mô hình tư vấn được xây dựng
người dùng để dự đoán sở thích của người dùng, hệ tư vấn dựa trên hai ma trận tương đồng: ma trận tương đồng được
lọc cộng tác dựa trên sản phẩm tìm ra các sản phẩm để giới xây dựng dựa trên dữ liệu xếp hạng của người dùng cho
thiệu đến người dùng bằng cách tìm ra sự tương đồng giữa các sản phẩm và ma trận tương đồng được xây dựng dựa
các sản phẩm từ ma trận xếp hạng (Rating matrix) [15]. Việc trên các thuộc tính sản phẩm. Sau khi xây dựng mô hình,
xác định sự tương đồng giữa hai sản phẩm được suy luận từ chúng tôi triển khai chạy thực nghiệm mô hình trên tập dữ
kết quả xếp hạng của người dùng, chứ không dựa trên đặc liệu MSWeb [12], đồng thời so sánh kết quả với mô hình
tính của sản phẩm như trong mô hình tư vấn dựa trên nội tư vấn lọc cộng tác dựa trên sản phẩm truyền thống.
dung (content-based) [2]. Nếu hai sản phẩm được xếp hạng
cao cùng một người dùng thì hai sản phẩm này được xem là 2. Ma trận tương đồng của các sản phẩm dựa trên các
tương đồng và người dùng được hy vọng sẽ có cùng sở thích thuộc tính
trên các sản phẩm tương đồng. Hệ tư vấn lọc cộng tác dựa 2.1. Khoảng cách giữa hai sản phẩm
trên sản phẩm là giải pháp hiệu quả cho các hệ thống tư vấn Hiện tại, có nhiều cách tính khoảng cách giữa hai sản
online [18], [13]. Bởi vì trong các hệ thống này, số lượng phẩm trong không gian vector n chiều. Để tính khoảng cách
người dùng thường tăng rất nhanh so với số lượng sản phẩm. giữa 2 sản phẩm, chúng tôi áp dụng phương pháp tính
Do đó, việc tìm ra kết quả tư vấn dựa trên các người dùng sẽ khoảng cách Euclidean [17]. Đây là phương pháp tính
phức tạp và mất nhiều thời gian hơn so với việc tìm ra kết khoảng cách được sử dụng nhiều trong các bài toán phân
quả tư vấn dựa trên các sản phẩm. Ngoài ra, mô hình này còn lớp dữ ...