Ứng dụng mô hình Mapreduce vào bài toán tìm kiếm những khách hàng có cùng nhu cầu sản phẩm trong thương mại điện tử
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Ứng dụng mô hình Mapreduce vào bài toán tìm kiếm những khách hàng có cùng nhu cầu sản phẩm trong thương mại điện tử Tạp chí Khoa học – Trường Đại học Phú Yên, Số 27 (2021), 63-69 63 ỨNG DỤNG MÔ HÌNH MAPREDUCE VÀO BÀI TOÁN TÌM KIẾM NHỮNG KHÁCH HÀNG CÓ CÙNG NHU CẦU SẢN PHẨM TRONG THƯƠNG MẠI ĐIỆN TỬ Trần Xuân Hiệp, Phan Thị Thanh Thủy* Trường Đại học Phú Yên Ngày nhận bài: 07/05/2020; Ngày nhận đăng: 28/05/2021 Tóm tắt Tìm kiếm những khách hàng có cùng nhu cầu sản phẩm đang trở nên rất quan trọng trong lĩnh vực thương mại điện tử. Những người có cùng mối quan tâm, thông tin cá nhân phù hợp và những tương tác của họ với cộng đồng là nguồn dữ liệu quan trọng được chọn để phân tích. Bài báo này giới thiệu phương pháp phân tích hồ sơ cá nhân bằng cách áp dụng các giải thuật phổ biến vào mô hình Map-Reduce dựa trên Hadoop framework. Đây là phương pháp nhằm tạo ra công cụ hiệu quả, tiết kiệm thời gian và công sức tìm ra danh sách tối ưu những người có cùng sở thích để phục vụ doanh nghiệp tư vấn sản phẩm cho khách hàng. Từ khoá: MapReduce, Hadoop, so trùng ngữ nghĩa, phân tích ngữ nghĩa 1. Giới thiệu làm thế nào để mô tả sơ lược mối quan tâm Sự phát triển của cuộc cách mạng công sản phẩm của một người và làm thế nào để nghiệp 4.0 trong những năm gần đây đã tạo tính toán sự tương tự giữa các hồ sơ cá ra cơ hội hơn cho lĩnh vực thương mại điện nhân về lĩnh vực quan tâm. Phương pháp tử. Trước nhu cầu ngày càng cao của khách phổ biến nhất được sử dụng để tính độ hàng, những bài toán, giải pháp nhằm nâng tương tự là phép tính cosin (Rajesh cao chất lượng dịch vụ ngày càng trở nên Thiagarajan, Geetha Manjunath, and M. cấp thiết và phức tạp. Vấn đề tìm kiếm Stumptner, 2008). Trong phương pháp này, khách hàng có cùng nhu cầu về sản phẩm những profile được trình bày như là một tập trong thương mại điện tử một cách hiệu những từ khóa (có trọng số). Sự tương đồng quả, nhanh chóng trên một tập dữ liệu rất được tính bởi phép tính cosine của hai lớn là một trong những bài toán luôn đặt ra vectơ được đại diện bởi hai tập từ khoá nhiều vấn đề cho các nhà kinh doanh được đánh giá cao. Phương pháp này thì thương mại điện tử. Trên cơ sở này chúng đơn giản để thực hiện, nhưng nó chỉ đề cập ta có thể phát triển phương pháp xây dựng đến sự phù hợp cú pháp của từ và không có hồ sơ cá nhân (proflile) chứa các thông tin khả năng trong những trường hợp đòi hỏi của khách hàng một cách khoa học, từ đó so sánh ngữ nghĩa của từ. Để đáp ứng nhu xây dựng phương pháp so trùng các thông cầu cho việc phù hợp ngữ nghĩa chúng ta tin cá nhân để tìm ra sự tương đồng theo cần mô tả một cách rõ ràng mối quan hệ từng nhóm sản phẩm. giữa các từ. Những mối quan hệ giữa các từ Việc tìm kiếm những người có cùng mối hoặc các thuật ngữ cũng có thể được suy quan tâm một lĩnh vực bao gồm hai vấn đề: tính hoàn toàn, bằng cách sử dụng phương ___________________________ pháp phân tích ngữ nghĩa tiềm ẩn (T. K. * Email: thuycdsppy@yahoo.com Landauer, P. W. Foltz, and D. Laham, 1998). 64 Journal of Science – Phu Yen University, No.27 (2021), 63-69 Việc tra cứu trong kho dữ liệu khổng lồ việc. Thư viện MapReduce tiếp nhận các chứa thông tin cá nhân trong cộng đồng này kết quả này và xuất ra kết quả cuối cùng bằng cách lựa chọn từng người thực chất là của bài toán dưới các dạng dữ liệu khác nhau. một việc tốn rất nhiều thời gian, đồng thời Trong mô hình MapReduce, dữ liệu vào khả năng tìm được người thích hợp không được chia thành nhiều mảnh nhỏ, mỗi mảnh cao. Với sự bùng nổ thông tin hiện nay, được xử lý độc lập bởi các hàm Map. Kết việc xử lý và lưu trữ khối dữ liệu khổng lồ quả xử lý của các hàm Map sẽ lại được ngày một phát triển đã trở thành một thách phân thành nhiều tập hợp khác nhau, sắp thức lớn với nhiều vấn đề đặt ra. Nhưng xếp và chuyển tiếp đến các hàm Reduce. thực tế này đang dần thay đổi khi các kỹ Hình 1 sau minh họa cách làm việc trên. thuật xử lý phân tán xuất hiện, đáng kể nhất là MapReduce. Mục đích quan trọng nhất của MapReduce là tăng tốc độ thực thi xử lý dữ liệu trên tập hợp dữ liệu lớn (Jeffrey Dean and Sanjay Ghemawat, 2004). Mô hình MapReduce dựa trên hai hàm Map và Reduce. MapReduce là một giải pháp tốt cho các dạng bài toán xử lý khối lượng dữ liệu phát sinh khổng lồ với các tác vụ phân tích và tính toán phức tạp, trong các lĩnh vực như khai thác dữ liệu, phân tích và mô phỏng. Bài báo này trình bày phương pháp Hình 1: Mô hình hoạt động MapReduce nghiên cứu và kết quả thử nghiệm việc áp 2.1.2 Hadoop dụng giải thuật tìm kiếm những người có Hadoop là dự án chủ chốt của hãng cùng sở thích trong cộng đồng khoa học Apache nhằm cung cấp công cụ và hỗ trợ dựa trên mô hình MapReduce. cho các hệ thống tính toán phân tán. Dựa 2. Phương pháp nghiên cứu trên ý tưởng MapReduce của Google, 2.1. MapReduce Hadoop tự xử lý tất cả các khâu phức tạp để 2.1.1 Mô hình MapReduce bảo đảm hệ thống hoạt động thông suốt và Nhiệm vụ tính toán trong mô hình nhường việc định nghĩa tính toán luận lý MapReduce nhận dữ liệu vào và ra đều là của ứng dụng lại cho lập trình viên. một tập hợp lớn các cặp khóa/giá trị. Mô Hai thành phần chính của dự án Hadoop hình này dựa trên 2 bước cơ bản: là framework MapReduce cung cấp khả - Map: nhận dòng dữ liệu thô và xử lý, năng tính toán phân tán, và hệ thống file tạo ra các cặp khóa/giá trị. Thư viện HDFS (Hadoop Distributed File System). MapRedu ...
Tìm kiếm theo từ khóa liên quan:
So trùng ngữ nghĩa Phân tích ngữ nghĩa Mô hình Map-Reduce Cách mạng công nghiệp 4.0 Năng tính toán phân tán Ngôn ngữ JavaTài liệu cùng danh mục:
-
6 trang 816 0 0
-
Các nhân tố ảnh hưởng đến sự hài lòng của khách hàng khi mua sắm trên Shopee tại TP. Hồ Chí Minh
10 trang 552 11 0 -
Bài giảng Quản trị tác nghiệp thương mại điện tử - PGS.TS Nguyễn Văn Minh
249 trang 520 9 0 -
6 trang 459 7 0
-
Giáo trình Thương mại điện tử: Phần 1 - TS. Ao Thu Hoài
102 trang 387 7 0 -
7 trang 349 2 0
-
Giáo trình Thương mại điện tử căn bản: Phần 1 - TS. Trần Văn Hòe
181 trang 319 6 0 -
Nghiên cứu các nhân tố ảnh hưởng đến hành vi mua hàng trên TikTok Shop của sinh viên trường Hutech
6 trang 313 1 0 -
Bộ câu hỏi trắc nghiệm môn Thương mại điện tử (Có đáp án)
26 trang 278 2 0 -
Bài giảng Thanh toán điện tử: Chương 1 - ĐH Thương Mại
32 trang 273 4 0
Tài liệu mới:
-
Khảo sát tình trạng dinh dưỡng trước mổ ở người bệnh ung thư đại trực tràng
9 trang 20 0 0 -
94 trang 18 0 0
-
Tham vấn Thanh thiếu niên - ĐH Mở Bán công TP Hồ Chí Minh
276 trang 19 0 0 -
Kết hợp luân phiên sóng T và biến thiên nhịp tim trong tiên lượng bệnh nhân suy tim
10 trang 18 0 0 -
Đề thi giữa học kì 1 môn Ngữ văn lớp 9 năm 2024-2025 có đáp án - Trường THCS Nguyễn Trãi, Thanh Khê
14 trang 20 0 0 -
Đánh giá hiệu quả giải pháp phát triển thể chất cho sinh viên Trường Đại học Kiến trúc Hà Nội
8 trang 18 0 0 -
Tỉ lệ và các yếu tố liên quan đoạn chi dưới ở bệnh nhân đái tháo đường có loét chân
11 trang 19 0 0 -
39 trang 18 0 0
-
Đề thi học kì 1 môn Tiếng Anh lớp 6 năm 2024-2025 có đáp án - Trường TH&THCS Quang Trung, Hội An
6 trang 18 1 0 -
Tôm ram lá chanh vừa nhanh vừa dễRất dễ làm, nhanh gọn mà lại ngon. Nhà mình
7 trang 18 0 0