![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 3: Sử dụng công cụ OLAP trong khai phá dữ liệu
Số trang: 14
Loại file: pdf
Dung lượng: 904.50 KB
Lượt xem: 19
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 3: Sử dụng công cụ OLAP trong khai phá dữ liệu. Chương này cung cấp cho học viên những kiến thức về: tổng quan chung SQL server analysis service; xây dựng OLAP Cube; xây dựng Report;... Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 3: Sử dụng công cụ OLAP trong khai phá dữ liệu Association rules at the 1-item values of X Có thể sử dụng cách như trên đểtìm luật kết hợp của 1-item VD: Consider the rule: Milk → Bread. Out of total 12 transactions Milk occurs 9 times while (Milk, Bread) occurs 7 times. The rule has a support level of 7/12 (or 58 percent) and a confidence level of 7/9 (or 77 percent). Thus, the next valid association rule is as follows: Milk → Bread {S = 58%, C = 77%}. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 133 Chương 3: Sử dụng công cụ OLAP trong khai phá dữ liệu3.1. Tồng quan chung về SQL server analysis service 3.1.1. Một số khái niệm liên quan 3.1.2. Tổ chức mô hình cơ sở dữ liệu đa chiều 3.1.3. Giới thiệu và cài đặt công cụ OLAP3.2. Xây dựng OLAP Cube 3.2.1. Xây dựng DB Engine 3.2.2. Thiết lập nguồn , bảng Fact 3.2.3. Thiết lập các chiều cho Cube 3.2.4. Xây dựng Cube3.3. Xây dựng Report 3.3.1. Thiết lập nguồn cho Report 3.3.2. Lập Report từ cơ sở dữ liệu nhiều chiều 3.3.3. Quản lý Report (bảo mật- security, truyền- KHAI PHÁ subscription, DỮ LIỆU TRONG KINH DOANH quản lý thực thi –excution). 134 673.1. Tổng quan chung về SQLserver analysis service3.1.1. Một số khái niệm liên quanSQL Server Analysis Service là một công cụ phân tích dữ liệuđược sử dụng trong hỗ trợ quyết định và phân tích kinhdoanh.Dữ liệu phân tích được lưu trữ dưới mô hình bảng, hìnhkhối đa chiều (cubes), và các mô hình khai phá dữ liệu màNSD có thể truy cập từ các báo cáo, bảng tính và bảng điềukhiền. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 135OLAP Cube là thuật ngữ dùng để chỉ dữ liệu có nhiềuchiều (Cube) mà có thể xử lý phân tích online (OLAP).Thường số chiều của Cube là 3, còn nếu số chiều của dữ liệulớn hơn 3, dữ liệu này còn được gọi là hypercube.Dữ liệu nhiều chiều (multi-dimension) có thể hiểu đơn giảnlà dữ liệu mà người dùng muốn nhóm theo các tiêu chí khácnhau. Ví dụ, dữ liệu tài chính của một công ty được nhómtheo sản phẩm, khung thời gian, thành phố.. để so sánh.Mỗi tiêu chí (sản phẩm, khung thời gian, địa điểm...) làmột chiều dữ liệu vì nó cung cấp một góc nhìn khác đến dữliệu hiện có KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 136 68Fact table có thể được hiểu như là bảng chứa các dữliệu có tính chất đo lường (measurement). Một fact(hay còn gọi là measure) trong Data warehouse đượcdùng để minh họa cho một trường (field/column)chứa một giá trị đo lường đượcTiến trình ETL (Extract-Transform-Load)Tiến trình ETL là một quy trình dùng để lấy dữ liệu từ các hệthống nguồn sau đó xử lý và đưa nó vào data warehouse. Nóbao gồm các chức năng: Rút trích dữ liệu; biến đổi dữ liệu; vàtải (load) vào kho dữ liệu hoặc các hệ thống báo cáo khác KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 137 Mô hình các bước của tiến trình ETL KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 138 69Thống nhất hóa (roll-up) là quá trình tập hợp lại dữliệu từ một hay nhiều chiềuDrill- down – chi tiết hóa: ngược với roll-upChọn và cắt lát dữ liệu (slice-còn gọi là chọn vàchiếu): là kĩ thuật cho phép ta lấy ra khối dữ liệunhiều chiều (rubic), sau đó tiến hành phân tíchbằng các nhát cắt khác nhau dựa trên khối đó. Kếtquả thu được sẽ là một khối dữ liệu con KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 1393.1.2. Tổ chức mô hình cơ sởdữ liệu đa chiềuLược đồ đa chiều hình sao (star schema) là kiểuđơn giản nhất của lược đồ data mart. Lược đồsao bao gồm một hoặc nhiều bảng Fact, thamchiếu đến một số bảng dimension.Khi ta liên kết Fact table và Dimension table lại vớinhau dựa trên các Primary Key của dimension vàForeign Key tương ứng của fact, ta được một lượcđồ dữ liệu dạng hình sao - Star schema. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 140 70VD KHAI PHÁ DỮ LIỆU TRONG KINH DOANH ...
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 3: Sử dụng công cụ OLAP trong khai phá dữ liệu Association rules at the 1-item values of X Có thể sử dụng cách như trên đểtìm luật kết hợp của 1-item VD: Consider the rule: Milk → Bread. Out of total 12 transactions Milk occurs 9 times while (Milk, Bread) occurs 7 times. The rule has a support level of 7/12 (or 58 percent) and a confidence level of 7/9 (or 77 percent). Thus, the next valid association rule is as follows: Milk → Bread {S = 58%, C = 77%}. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 133 Chương 3: Sử dụng công cụ OLAP trong khai phá dữ liệu3.1. Tồng quan chung về SQL server analysis service 3.1.1. Một số khái niệm liên quan 3.1.2. Tổ chức mô hình cơ sở dữ liệu đa chiều 3.1.3. Giới thiệu và cài đặt công cụ OLAP3.2. Xây dựng OLAP Cube 3.2.1. Xây dựng DB Engine 3.2.2. Thiết lập nguồn , bảng Fact 3.2.3. Thiết lập các chiều cho Cube 3.2.4. Xây dựng Cube3.3. Xây dựng Report 3.3.1. Thiết lập nguồn cho Report 3.3.2. Lập Report từ cơ sở dữ liệu nhiều chiều 3.3.3. Quản lý Report (bảo mật- security, truyền- KHAI PHÁ subscription, DỮ LIỆU TRONG KINH DOANH quản lý thực thi –excution). 134 673.1. Tổng quan chung về SQLserver analysis service3.1.1. Một số khái niệm liên quanSQL Server Analysis Service là một công cụ phân tích dữ liệuđược sử dụng trong hỗ trợ quyết định và phân tích kinhdoanh.Dữ liệu phân tích được lưu trữ dưới mô hình bảng, hìnhkhối đa chiều (cubes), và các mô hình khai phá dữ liệu màNSD có thể truy cập từ các báo cáo, bảng tính và bảng điềukhiền. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 135OLAP Cube là thuật ngữ dùng để chỉ dữ liệu có nhiềuchiều (Cube) mà có thể xử lý phân tích online (OLAP).Thường số chiều của Cube là 3, còn nếu số chiều của dữ liệulớn hơn 3, dữ liệu này còn được gọi là hypercube.Dữ liệu nhiều chiều (multi-dimension) có thể hiểu đơn giảnlà dữ liệu mà người dùng muốn nhóm theo các tiêu chí khácnhau. Ví dụ, dữ liệu tài chính của một công ty được nhómtheo sản phẩm, khung thời gian, thành phố.. để so sánh.Mỗi tiêu chí (sản phẩm, khung thời gian, địa điểm...) làmột chiều dữ liệu vì nó cung cấp một góc nhìn khác đến dữliệu hiện có KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 136 68Fact table có thể được hiểu như là bảng chứa các dữliệu có tính chất đo lường (measurement). Một fact(hay còn gọi là measure) trong Data warehouse đượcdùng để minh họa cho một trường (field/column)chứa một giá trị đo lường đượcTiến trình ETL (Extract-Transform-Load)Tiến trình ETL là một quy trình dùng để lấy dữ liệu từ các hệthống nguồn sau đó xử lý và đưa nó vào data warehouse. Nóbao gồm các chức năng: Rút trích dữ liệu; biến đổi dữ liệu; vàtải (load) vào kho dữ liệu hoặc các hệ thống báo cáo khác KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 137 Mô hình các bước của tiến trình ETL KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 138 69Thống nhất hóa (roll-up) là quá trình tập hợp lại dữliệu từ một hay nhiều chiềuDrill- down – chi tiết hóa: ngược với roll-upChọn và cắt lát dữ liệu (slice-còn gọi là chọn vàchiếu): là kĩ thuật cho phép ta lấy ra khối dữ liệunhiều chiều (rubic), sau đó tiến hành phân tíchbằng các nhát cắt khác nhau dựa trên khối đó. Kếtquả thu được sẽ là một khối dữ liệu con KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 1393.1.2. Tổ chức mô hình cơ sởdữ liệu đa chiềuLược đồ đa chiều hình sao (star schema) là kiểuđơn giản nhất của lược đồ data mart. Lược đồsao bao gồm một hoặc nhiều bảng Fact, thamchiếu đến một số bảng dimension.Khi ta liên kết Fact table và Dimension table lại vớinhau dựa trên các Primary Key của dimension vàForeign Key tương ứng của fact, ta được một lượcđồ dữ liệu dạng hình sao - Star schema. KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 140 70VD KHAI PHÁ DỮ LIỆU TRONG KINH DOANH ...
Tìm kiếm theo từ khóa liên quan:
Khai phá dữ liệu trong kinh doanh Bài giảng Khai phá dữ liệu trong kinh doanh SQL server analysis service Khai phá dữ liệu Xây dựng OLAP Cube Xây dựng ReportTài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 353 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 236 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 233 0 0 -
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 178 0 0 -
8 trang 133 0 0
-
4 trang 118 0 0
-
Bài giảng Khai phá dữ liệu: Chương 5 - TS. Võ Thị Ngọc Châu
116 trang 64 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Chương 8 - ĐH Bách khoa TP.HCM
8 trang 49 0 0 -
68 trang 48 0 0
-
Bài giảng Khai phá dữ liệu (Data mining): Clustering - Trịnh Tấn Đạt
70 trang 44 0 0