Danh mục

Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 1: Tổng quan về khai phá dữ liệu trong kinh doanh

Số trang: 21      Loại file: pdf      Dung lượng: 1.52 MB      Lượt xem: 14      Lượt tải: 0    
Thư viện của tui

Hỗ trợ phí lưu trữ khi tải xuống: 7,000 VND Tải xuống file đầy đủ (21 trang) 0
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 1: Tổng quan về khai phá dữ liệu trong kinh doanh. Chương này cung cấp cho học viên những kiến thức về: khai phá dữ liệu; khái niệm kho dữ liệu; một số mẫu dữ liệu trong kinh doanh cần khai phá; tầm quan trọng của khai phá dữ liệu trong kinh doanh; quy trình khai phá dữ liệu trong kinh doanh;... Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 1: Tổng quan về khai phá dữ liệu trong kinh doanhKHAI PHÁ DL TRONG KINH DOANH BỘ MÔN TIN HỌC KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 1 GIỚI THIỆU HỌC PHẦN Chương 1: Tổng quan về khai phá dữ liệu trong kinh doanh Chương 2: Tiền xử lý và Tổ chức dữ liệu kinh doanh Chương 3: Sử dụng công cụ OLAP trong khai phá dữ liệu Chương 4: Một số bài toán khai phá trong kinh doanh KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 2 1 Tài liệu tham khảoTài liệu tham khảo bắt buộc[1] Phân tích và khai phá dữ liệu. Đại học Thương mại, 2019.Nguyễn Thị Thu Thủy, NXB HĐ Hồ Tú Bảo (2018). Bài giảng về khoa học dữ liệu và khai phá dữliệu.Kho dữ liệu của Microsoft https://azure.microsoft.com/Cios, K.J., Pedrycz, W., Swiniarski, R.W., Kurgan, L. (2007). Datamining: A Knowledge Discovery Approach. Springer, 2007.Fayyad, U., Piatetsky-shapiro, G. and Smith, P. (1996). From DataMining to Knowledge Discovery in Databases. Communicationsof the ACM, 39, 37-54 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 3 Đánh giá ◦ Điểm chuyên cần: 10% ◦ Điểm thực hành: 30% ◦ Điểm thi hết học phần: 60% KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 4 2Applicationhttps://www.solver.com/welcome-students-xlminerXLMiner™ is a comprehensive data mining add-in for Excel. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 5BI in sql serverSQL Server 2008 Business Intelligence platformhttps://www.microsoft.com/en-us/download/details.aspx?id=7687 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 6 3Chương 1: Tổng quan về khaiphá dữ liệu trong kinh doanh1.1. Giới thiệu chung 1.1.1. Khai phá dữ liệu là gì 1.1.2. Khái niệm kho dữ liệu 1.1.3. Một số mẫu dữ liệu trong kinh doanh cần khai phá 1.1.3. Tầm quan trọng của khai phá dữ liệu trong kinhdoanh1.2. Quy trình khai phá dữ liệu trong kinh doanh 1.2.1. Xác định mục tiêu 1.2.2. Chuẩn bị và tổ chức dữ liệu KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 71.1. Giới thiệu chung 1.1.1. Khai phá dữ liệu là gìLà một loạt các kỹ thuật nhằm phát hiện ra các thông tin cógiá trị tiềm ẩn trong các tập dữ liệu lớnVề bản chất, khai phá dữ liệu là những vấn đề liên quan đếnviệc phân tích các dữ liệu và sử dụng các kỹ thuật để tìm racác mẫu nằm ẩn sâu trong tập dữ liệu. Nói cách khác nó chính là điểm giao giữa các phươngpháp và kỹ thuật của học máy, thống kê và các hệ thống cơsở dữ liệu này. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 8 4Ví dụTrong một siêu thị, qua khảo sát cho thấy ngườimua bàn chải đánh răng vào ngày chủ nhật cũngmua kem đánh răng.  Tăng doanh thu: đặt 2 sản phẩm này cạnhnhau.Tăng số lượng bán ra của 2 loại sản phẩm đó nhiềuhơn vào những ngày chủ nhật. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 9Các kỹ thuật của khai phá dữliệuAssociation (Kết hợp): Tìm mối quan hệ giữa các biến.Ví dụ như trong một cửa hàng bán lẻ, có thể xác định sản phẩm được muacùng với nhau thường xuyên và thông tin này có thể được sử dụng để tiếpthị các sản phẩm này.Clustering (Phân cụm): Xác định mối quan hệ hợp lýtrong các sản phẩm và nhóm chúng lại với nhau.Ví dụ như trong một cửa hàng bán lẻ, kem đánh răng và bàn chải đánh răngcó thể được nhóm lại.Classifying (Phân loại): Liên quan đến việc áp dụng mộtmô hình được biết đến với các dữ liệu mới. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 10 5Nhiệm vụ của khai phá dữ liệuCó thể phân thành 2 loại chính đó là Dự đoán(Predictive) và Mô tả (Descriptive):Predictive:◦ Classification - phân lớp◦ Regression - hồi quy◦ Deviation Detection - phát hiện độ lệchDescriptive:◦ Clustering - phân cụm◦ Association Rule Discovery - phát hiện luật kết hợp. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 11Một số thuật toán phổ biếnDescision tree: Cây qu ...

Tài liệu được xem nhiều: