Danh mục

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 7: Phép toán và truy vấn OLAP

Số trang: 63      Loại file: pdf      Dung lượng: 2.35 MB      Lượt xem: 1      Lượt tải: 0    
Xem trước 7 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 7: Phép toán và truy vấn OLAP, trình bày các nội dung chính như sau: Phép toán OLAP; Truy vấn OLAP: SQL99, MDX. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 7: Phép toán và truy vấn OLAP KHO DỮ LIỆU VÀKINH DOANH THÔNG MINH Bài 7: Phép toán và truy vấn OLAP Nội dung Phép toán OLAP Truy vấn OLAP: SQL99, MDX 2 Truy vấn DW• Truy vấn DW là các truy vấn lớn – Phần lớn dữ liệu – Thường là truy vấn đọc• Sự dư thừa là cần thiết – Materialized views, special-purpose indexes, denormalized schemas• Dữ liệu được cập nhật theo các chu kỳ – Hàng ngày hay hàng tuần• Mục đích là để phân tích dữ liệu – OLAP (OnLine Analytical Processing) 3 Truy vấn DW• OLAP được sử dụng trong các lĩnh vực – Quản lý thông tin • Bán hàng theo nhóm sản phẩm/vùng/năm – Chính phủ • Điều tra dân số – CSDL khoa học • Tin học địa chất, tin học sinh học – V.v...• Mục đích: Thời gian đáp ứng là vài giây hay vài phút 4 1. Các phép toán OLAP• Các phép toán OLAP chuẩn tắc – Roll-up – Drill-down – Slice and dice – Pivot (rotate)• Các phép toán khác – Aggregate functions – Ranking and comparing – Drill-across – Drill-through 5 1.1. Roll-up• Roll-up (drill-up) – Dùng các giá trị tổ hợp hiện thười của bảng fact và thực hiện các phép tổ hợp thêm – Tổng hợp dữ liệu bằng cách • Leo tiếp lên mức cao của cây phân cấp (hierarchical roll-up) • Giảm số chiều • Hay tổng hợp của cả 2 kỹ thuật trên – Sử dụng để tăng thêm tính tổng hợp • Thí dụ từ Time.Week sang Time.Year 6 1.1. Roll-up• Leo lên mức cao hơn của cây phân cấp – Performed on the fact table and some dimension tables by climbing up the attribute hierarchies • E.g., climbed the Time hierarchy to Quarter and Article hierarchy to Prod. group 7 1.1. Roll-up• Giảm số chiều – Are done solely on the fact table by dropping one or more dimensions • E.g., drop the Client dimension 8 1.1. Roll-up• Leo lên đỉnh cao nhất của cây phân cấp chính là một phép giảm số chiều 9 1.2. Drill-down• Khoan xuống – Ngược của cuộn lên – Thực hiện việc “giải tổ hợp” • Từ mức tổng hợp cao xuống mức tổng hợp thấp – Thêm chiều mới – Yêu cầu có dữ liệu của mức chi tiết hơn • Không thể khoan xuống thêm nếu không có dữ liệu 101.2. Thí dụ roll-up và drill-down 11 1.3. Slice• Lát cắt/slice: là tập con của mảng nhiều chiều tương ứng với giá trị đơn ở một chiều nào đó và phép chiếu ở các chiều còn lại – E.g., project on Geo (store) and Time from values corresponding to Laptops in the product dimension 12 1.3. Slice• Là phép toán chọn theo điều kiện bằng• Mệnh đề WHERE trong SQL – Thí dụ lát cắt cho sản phẩm là laptops 13 1.4. Dice• Khúc cắt: là tập con của mảng nhiều chiều mà được chọn theo dải trên 1 chiều hoặc chọn bằng trên nhiều chiều – Thí dụ 141.4. Dice 15 1.5. Pivot• Pivot: tổ chức lại dữ liệu cho mục đích hiển thị – Pivot đơn giản nhất là chọn 2 chiều và thực hiện tổ hợp các giá trị đo • Các giá trị tổ hợp thường được trình bày theo một lưới (bảng) mỗi vị trí/ô (x,y) tương ứng với giá trị tổ hợp của giá trị đo • x,y là các giá trị trên 2 chiều được chọn – Kết quả cũng được gọi là cross–tabulation 16 1.5. Pivot• Pivot dữ liệu sau 17 1.5. Pivot• Pivot trên City và Day 18 Các yêu cầu phân tích chính• Các phép toán OLAP thường khó thể hiện bằng các ngôn ngữ truy vấn – Đại đa số các nhà phân tích và ra quyết định không thích dạng ngôn ngữ truy vấn SELECT f.region, z.month, sum(a.price * a.volume) FROM Order a, Time z, PoS f WHERE a.pos = f.name AND a.date = z.date GROUP BY f.region, z.month - Phần mềm OLAP thường cho phép thực hiện các phép toán qua giao diện đồ họa 19 Trực quan hóa dữ liệu OLAP• Thí dụ về 2 chiều Products và Store 20

Tài liệu được xem nhiều: