Danh mục

Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 5

Số trang: 71      Loại file: pdf      Dung lượng: 462.81 KB      Lượt xem: 22      Lượt tải: 0    
10.10.2023

Phí tải xuống: 2,000 VND Tải xuống file đầy đủ (71 trang) 0
Xem trước 8 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Kỹ thuật mô hình hoá các chiều cơ sởGiới thiệuCác bước mô hình kho dữ liệu Độ thô dữ liệu (Data Granularity) Lưu trữ dữ liệu Các phân cấp thuộc tính Truy vấn KDL và OLAP Các lỗi thường gặp khi xây dựng 1 KDL Ví dụ
Nội dung trích xuất từ tài liệu:
Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 5Chương 5: Kỹ thuật mô hình hoáChương 5: các chiều cơ sở Giới thiệu Gi Các bước mô hình kho dữ liệu• Độ thô dữ liệu (Data Granularity)• Lưu trữ dữ liệu• Các phân cấp thuộc tính• Truy vấn KDL và OLAP• Các lỗi thường gặp khi xây dựng 1 KDL• Ví dụ• Các tầng• Tầng khái niệm Conceptual layer – dữ liệu và xử lí dữ liệu• Tầng logic Logical layer – dữ liệu và xử lí kinh doanh• Tầng vật lý Physical layer – cấu trúc bên trong• Các chủ thể, dữ kiện và mối quan hệ Tầng trong hệ thống thông tin Conceptual Layer Logical Layer Logical Layer Physical Layer Physical LayerOperational systems Warehouse Các thành phần chính• Phân cấp thuộc tính của các chiều• Mối quan hệ Location Dimension• Dữ kiện Region Product Dimension Time Dimension District Manufacturer Account Year Store Brand Account Week Product_key Product Store_key Acct_Week_key Sales Data Các tiến trình mô hình hóa• Xác định yêu cầu của người dùng• Hướng dẫn người dùng hiểu về công nghệ KDL Các tiến trình mô hình hóa• Định nghĩa mô hình kinh doanh• Mô hình hóa các chiều• Chọn mô hình lưu trữ Conceptual Model Logical Model Physical Model Các công cụ và phương pháp• Chọn các công cụ với giao diện đồ họa – Tạo lập tài liệu – Định nghĩa các liên kết và ràng buộc• Phương pháp luận• Mô hình hoá• Xây dựng sản phẩm Tóm lược các lược dồ– Sao– Bông tuyết– Đa sao Mô hình hóa các chiều Mô• Mô hình dựa vào nội dung của dữ liệu• Mô hình với các tổng hợp cần thiết• Mô hình phải đáp ứng yêu cầu phân tích sâu, và tổng hợp• Có thể không chuẩn hóa - star• Có thể chuẩn hóa - snowflake• Xây dựng các phân cấp Mô hình các bảng tóm tắt Mô• Định nghĩa các bảng tóm tắt trước khi thiết kế• Dùng các bảng riêng để chứa các tổng hợp/tóm tắt SALES BY MONTH/REGION Month Region Tot_Sales$ SALES FACTS Jan 97 North 41,000 Sales$ Region Month Jan 97 East 10,000 10,000 North Jan 97 Feb 97 South 40,000 12,000 South Feb 97 Mar 97 West 17,000 11,000 North Jan 97 15,000 West Mar 97 18,000 South Feb 97 20,000 North Jan 97 SALES BY MONTH 10,000 East Jan 97 Month Tot_Sales 2,000 West Mar 97 Jan 97 51,000 Feb 97 40,000 Mar 97 17,000 Khi nào thì tóm tắt dữ liệu Khi• Phân tích và đưa ra quyết định để truy cập trực tiếp các tổng hợp có sẵn hay tính toán tại thời điểm thực hiện câu hỏi.• Việc tính toán các tỉ số nén cho phép quyết định nên chọn phương án nào Queried Rows Displayed Rows Calculation Ratio 1,341 22 22/11341 0.0164 234 22 22/234 0.09 30 22 22/30 0.73 20 22 22/20 1.1 Các công cụ• Logic Works• Micro Strategy• Oracle Designer/2000 Data Mart Designer• Prism Solutions• Smart Corporation Ví dụ Kho dữ liệu: Grocery Store• Một dây chuyền các cửa hàng tạp phẩm nằm rãi rác 3 bang ở Mỹ• Các kho: các siêu thị với các cửa hàng như tạp phẩm, bơ sữa, thịt, thức ăn lạnh, bánh mỳ, đồ uống, ..• Khoảng 60.000 sản phẩm tại mỗi khoVí dụ điển hình của KDL trích từ KIM 96 Cơ sở Cơ• Dữ liệu sẵn sàng cho việc xây dựng KDL – Dữ liệu từ các hệ thống nguồn: OLTP – Được làm sạch• Xây dựng kho DL: Mô hình các tiến trình kinh doanh nào ? – Định nghĩa độ thô của dữ liệu để phù hợp với KDL – Mô hình hoá cấu trúc KDL – Biến đổi dữ liệu theo cấu trúc Kho DL – Tính toán các tổng hợp và các dữ kiện suy dẫn – Các tiến trình mô hình• KDL miêu tả khung nhìn của một tiến trình kinh doanh• Sự quyết định mô hình tiến trình kinh doanh nào có tác động quan trọng – Nhằm vào các vấn đề gì ? – Các câu hỏi được đặt ra ? – Các thông tin cần thiết – KDL trung tâm hay các chợ dữ liệu Tiến trình kinh doanh Ti• Dữ liệu OLTP Point of sales (POS) data: Dữ liệu bán hàng – Dữ liệu nhà cung cấp – Dữ liệu kế toán – Dữ liệu khách hàng – Sự quảng cáo – Mục đích: Xây dựng một CSDL hoạt động hàng ng ...

Tài liệu được xem nhiều: