Danh mục

Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 4: Xử lý truy vấn và hiệu năng hệ CSDL

Số trang: 16      Loại file: pdf      Dung lượng: 686.21 KB      Lượt xem: 18      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Nội dung cơ bản được trình bày trong chương này gồm có: Xử lý câu hỏi truy vấn, cây toán tử, các phép toán vật lý (thuật toán), truy nhập bảng, phép toán nhiều pha, mô hình giá, bộ tối ưu, các lý do dẫn đến hiệu năng thực thi truy vấn chậm, các kỹ thuật viết lại truy vấn, sử dụng index,...Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 4: Xử lý truy vấn và hiệu năng hệ CSDL Thiết kế và quản trị cơ sở dữ liệu Xử lý truy vấn và hiệu năng hệ CSDL Vũ Tuyết Trinh trinhvt-fit@mail.hut.edu.vn Bộ môn Hệ thống thông tin, Viện CNTT&TT Đại học Bách Khoa Hà Nội Xử lý câu hỏi truy vấn Câu lệnh SQL Phân tích cú pháp (parser) Biểu thức ĐSQH Bộ tối ưu (optimizer) Biểu thức ĐSQH tối ưu Bộ sinh mã (code generator) Chương trình tối ưu Vũ Tuyết Trinh 1 Thiết kế và quản trị cơ sở dữ liệu Cây toán tử TYPE WAGON (NW, TYPE, COND, STATION, CAPACITY, WEIGHT) TRAIN (NT, NW)  Cây toán tử logic   Thứ tự các phép toán NW Cây toán tử vật lý  Các thuật toán thực thi phép toán WAGON (NW, TYPE...) NT = 4002 TRAIN (NT, NW) Các phép toán vật lý (thuật toán)  Query Blocks     SELECT-FROMWHERE-GROUPBYORDERBY VIEW được coi là 1 block riêng rẽ Dạng cây thực thi (right-deep, bushy, …) Thứ tự kết nối  Thuật toán      Sort Aggregates Select Project Join    Vũ Tuyết Trinh Nested Loop Sort-Merge Hash-Join 2 Thiết kế và quản trị cơ sở dữ liệu Truy nhập bảng    Truy nhập tuần tự (Sequential scan): đọc theo khối Truy nhập theo địa chỉ (index scan): truy nhập vào bản ghi dựa trên chỉ mục Chi phí truy nhập ? S Phép toán nhiều pha: Nested-Loops Join  Nguyên tắc   Matching Tuple R Đặc điểm   Đọc từng bản ghi của quan hệ R (external relation) & lặp trên quan hệ S (internal relation) one-and-haft pass, nonblocking Tuple R Tuple S SOURCE R SOURCE S Chi phí ? Tuple-based NLJ, block-based NLJ, index-based NLJ Vũ Tuyết Trinh 3 Thiết kế và quản trị cơ sở dữ liệu Sort Merge Join  Nguyên tắc    Đặc điểm   Merge Sắp xếp dữ liệu đầu vào trộn dữ liệu two-pass, blocking algorithm Sort Chi phí? Sort SOURCE R SOURCE S Hash Join (HJ)  Nguyên tắc    Đặc điểm   Tạo bảng băm trên R Đọc S và đối sánh với dữ liệu trên bảng băm Matching Hash Table R 1 … n two-pass, blocking algorithm probe Chi phí ? build Tuple R Tuple S hash(Tuple R)hash(Tuple S) SOURCE R Vũ Tuyết Trinh SOURCE S 4 Thiết kế và quản trị cơ sở dữ liệu Mô hình giá  Chí phí thực hiện câu hỏi phụ thuộc: đọc/ghi bộ nhớ ngoài (số trang nhớ) Kích thước dữ liệu phải xử lý  Chi phí truy nhập dữ liệu Đọc ghi dữ liệu xử lý Truyền thông giữa các trạm làm việc CTA = s * NBPAGES + t * NBNUPLETS (+ m * NBMESSAGES) Trọng số s = trọng số đọc/ghi dữ liệu (ví dụ = 1) t = trọng số xử lý của CPU (ví dụ = 1/3) m = trọng số truyền dữ liệu   Thông tin về các quan hệ  Kích thước của các quan hệ và bản ghi Relation WAGON TRAIN TRAFFIC Thông Cardinality 200000 200 5 400 2000 800 Size 20 5 15 15 10 6 min -max 5-45 tin về các chỉ số Relation WAGON WAGON WAGON WAGON TRAIN TRAFFIC TRAFFIC Vũ Tuyết Trinh Record size 60 30 20 tin về các thuộc tính Attribute NW TYPE COND CAPACITY NT DATE Thông Cardinality 200000 60000 80000 Attributes NW TYPE COND CAPACITY NT NT DATE Relation Cardinality WAGON TRAIN TRAFFIC 200000 60000 80000 Unique Yes No No No No No no Type Principal Secondary Secondary Secondary Principal Principal Principal Record size (num of rec./page) 60(100) 30 (200) 20 (300) Num of pages 45 25 30 25 18 20 40 Num. of pages (NP’) 1500(375) 225(60) 200(60) 5

Tài liệu được xem nhiều: