Danh mục

Ứng dụng các mô hình học máy và BigQuery dự đoán quyết định mua hàng

Số trang: 7      Loại file: pdf      Dung lượng: 641.72 KB      Lượt xem: 13      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Nghiên cứu "Ứng dụng các mô hình học máy và BigQuery dự đoán quyết định mua hàng" sử dụng BigQuery Machine Learning (BigQuery ML) để giải quyết vấn đề dự đoán quyết định mua hàng của người tiêu dùng. Các mô hình được sử dụng để đào tạo bao gồm các mô hình hồi quy logistic và rừng ngẫu nhiên. Từ đó đưa ra những đánh giá độ chính xác, chi phí và đề xuất một số ý kiến trong việc sử dụng BigQuery ML cho các bài toán dự đoán quyết định mua hàng. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Ứng dụng các mô hình học máy và BigQuery dự đoán quyết định mua hàng KỶ YẾU HỘI THẢO KHOA HỌC CẤP THÀNH PHỐ ỨNG DỤNG CÁC MÔ HÌNH HỌC MÁY VÀ BIGQUERY DỰ ĐOÁN QUYẾT ĐỊNH MUA HÀNG Lê Nhật Tùng1 Tóm tắt: Ngày nay, học máy được sử dụng rộng rãi trong nhiều lĩnh vực như thương mạiđiện tử, chứng khoán, y học. Dữ liệu được thu thập cho những vấn đề này là rất lớn và việc huấnluyện các mô hình dự đoán đòi hỏi rất nhiều thời gian. Dẫn đến sự ra đời của các kỹ thuật và côngnghệ mới phù hợp để xử lý dữ liệu lớn. Trong dự án này, chúng tôi sẽ sử dụng BigQuery MachineLearning (BigQuery ML) để giải quyết vấn đề dự đoán quyết định mua hàng của người tiêu dùng.Các mô hình được sử dụng để đào tạo bao gồm các mô hình hồi quy logistic và rừng ngẫu nhiên.Chúng tôi sẽ đánh giá độ chính xác, chi phí và đề xuất một số ý kiến trong việc sử dụng BigQueryML cho các bài toán dự đoán quyết định mua hàng. Từ khóa: dữ liệu lớn, BigQuery, học máy, dự đoán, quyết định mua hàng 1. Giới thiệu 1.1. Bài toán dự đoán quyết định mua hàng Trong mô hình học có giám sát thường có hai bài toán chính: bài toán dự đoán (đối với biếnmục tiêu liên tục) và bài toán phân loại (đối với biến mục tiêu rời rạc). Tuy nhiên, đối với một sốbài toán phân loại có ít lớp, chẳng hạn với 2 lớp, ta có thể biến đổi sang bài toán dự đoán xác suấtthuộc một lớp nào đó. Trong dự án này, dựa trên thông tin thu thập được về lượt truy cập của kháchhàng, chúng ta cần phân lớp các giá trị thành 0, 1. Trong đó, giá trị 1 khi khách hàng quyết địnhthêm sản phẩm thì sẽ được thêm vào giỏ hàng, ngược lại sẽ có có giá trị bằng 0. Tuy nhiên, thay vìphân lớp chính xác ngay từ đầu, chúng ta dự đoán tỷ lệ khách hàng quyết định lựa chọn sản phẩm.Tỷ lệ này sẽ có giá trị từ 0 đến 1, từ tỷ lệ này chúng ta lựa chọn một ngưỡng phù hợp để đưa raquyết định cuối cùng về lớp phân loại. Dựa trên các thông tin truy cập vào các trang thương mại điện tử, được thu thập từ người truycập. Các thông tin có thể bao gồm: thời gian, địa điểm, số trang đã duyệt, tổng số lần truy cập,phương tiện sử dụng, thiết bị sử dụng ….. Chúng ta có thể dự đoán xem khách truy cập có ra quyếtđịnh mua hàng hay không bằng cách xây dựng các mô hình dự đoán. 2. Phương pháp 2.1. BigQuery BigQuery là kho dữ liệu doanh nghiệp không có máy chủ và tiết kiệm chi phí. Chức năngchính của BigQuery là kích hoạt các truy vấn phân tích tương tác trên dữ liệu lớn (Tigani & Naidu,2014). BigQuery ML cho phép các nhà khoa học dữ liệu và nhà phân tích dữ liệu xây dựng, vậnhành các mô hình học máy trên dữ liệu có cấu trúc và bán cấu trúc. BigQuery ML tích hợp các môhình học máy, sử dụng các câu lệnh SQL đơn giản và có thời gian truy xuất nhanh. Sau quá trìnhhuấn luyện, chúng ta có thể sử dụng các mô hình để dự đoán thông qua Vertex AI hoặc tích hợp vàoác dự án cá nhân (BigQuery, 2022).1 Thạc sĩ; đơn vị công tác: Khoa Công nghệ, Trường Đại học Công nghệ Đồng Nai; Email: lenhattung@dntu.edu.vn 309 MARKETING GIAI ĐOẠN BÌNH THƯỜNG MỚI 2.2. Mô hình hồi quy logistic Hồi quy logistic là thuật toán thường được sử dụng cho các tác vụ phân loại trong học máy.Đây là thuật toán học có giám sát, nó đưa ra dự đoán về xác suất xảy ra sự kiện, dựa trên dữ liệuđầu vào. Hồi quy logistic là một loại phân tích hồi quy trong đó biến kết quả là nhị phân hoặc phânđôi, nghĩa là nó chỉ có thể có hai giá trị có thể, chẳng hạn như 1 hoặc 0. Mục tiêu của hồi quylogistic là tìm ra mô hình phù hợp nhất để mô tả mối quan hệ giữa biến kết quả và một tập hợp cácbiến độc lập. Điều này đạt được bằng cách sử dụng thuật toán tối ưu hóa để điều chỉnh các hệ sốcủa mô hình sao cho mô hình có thể dự đoán chính xác kết quả dựa trên dữ liệu đầu vào (Bishop,2006; Nguyễn Văn Tuấn, 2020). Khi có nhiều biến dự đoán, công thức hồi quy logistic như sau: ? ?0 + ?1 ?1+ ?2 ?2+ … + ? ? ? ? ? = (1) 1 + ? ?0 + ?1 ?1 + ?2 ?2+ … + ? ? ? ? Trong công thức này, ? là xác suất dự đoán của kết quả, ?0 là số hạng chặn và ?1 , ?2 , … , ? ? làcác hệ số cho các biến dự đoán ?1 , ?2 , … , ? ? . Công thức về cơ bản giống như trường hợp một biến,nhưng với các thuật ngữ bổ sung cho mỗi biến dự đoán bổ sung. Mô hình sử dụng công thức này đểdự đoán xác suất mà một đầu vào nhất định thuộc về một lớp nhất định, dựa trên giá trị của các biếndự đoán. Sau đó, mô hình có thể sử dụng một giá trị ngưỡng để xác định xem xác suất dự đoán cóđủ cao để phân loại đầu vào thuộc về lớp đó hay không. Ví dụ: nếu ngưỡng được đặt thành 0,5, thìcác đầu vào có xác suất dự đoán lớn hơn 0,5 sẽ được phân loại ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: