Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 4: Xử lý truy vấn và hiệu năng hệ CSDL
Số trang: 16
Loại file: pdf
Dung lượng: 686.21 KB
Lượt xem: 18
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Nội dung cơ bản được trình bày trong chương này gồm có: Xử lý câu hỏi truy vấn, cây toán tử, các phép toán vật lý (thuật toán), truy nhập bảng, phép toán nhiều pha, mô hình giá, bộ tối ưu, các lý do dẫn đến hiệu năng thực thi truy vấn chậm, các kỹ thuật viết lại truy vấn, sử dụng index,...Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 4: Xử lý truy vấn và hiệu năng hệ CSDL Thiết kế và quản trị cơ sở dữ liệu Xử lý truy vấn và hiệu năng hệ CSDL Vũ Tuyết Trinh trinhvt-fit@mail.hut.edu.vn Bộ môn Hệ thống thông tin, Viện CNTT&TT Đại học Bách Khoa Hà Nội Xử lý câu hỏi truy vấn Câu lệnh SQL Phân tích cú pháp (parser) Biểu thức ĐSQH Bộ tối ưu (optimizer) Biểu thức ĐSQH tối ưu Bộ sinh mã (code generator) Chương trình tối ưu Vũ Tuyết Trinh 1 Thiết kế và quản trị cơ sở dữ liệu Cây toán tử TYPE WAGON (NW, TYPE, COND, STATION, CAPACITY, WEIGHT) TRAIN (NT, NW) Cây toán tử logic Thứ tự các phép toán NW Cây toán tử vật lý Các thuật toán thực thi phép toán WAGON (NW, TYPE...) NT = 4002 TRAIN (NT, NW) Các phép toán vật lý (thuật toán) Query Blocks SELECT-FROMWHERE-GROUPBYORDERBY VIEW được coi là 1 block riêng rẽ Dạng cây thực thi (right-deep, bushy, …) Thứ tự kết nối Thuật toán Sort Aggregates Select Project Join Vũ Tuyết Trinh Nested Loop Sort-Merge Hash-Join 2 Thiết kế và quản trị cơ sở dữ liệu Truy nhập bảng Truy nhập tuần tự (Sequential scan): đọc theo khối Truy nhập theo địa chỉ (index scan): truy nhập vào bản ghi dựa trên chỉ mục Chi phí truy nhập ? S Phép toán nhiều pha: Nested-Loops Join Nguyên tắc Matching Tuple R Đặc điểm Đọc từng bản ghi của quan hệ R (external relation) & lặp trên quan hệ S (internal relation) one-and-haft pass, nonblocking Tuple R Tuple S SOURCE R SOURCE S Chi phí ? Tuple-based NLJ, block-based NLJ, index-based NLJ Vũ Tuyết Trinh 3 Thiết kế và quản trị cơ sở dữ liệu Sort Merge Join Nguyên tắc Đặc điểm Merge Sắp xếp dữ liệu đầu vào trộn dữ liệu two-pass, blocking algorithm Sort Chi phí? Sort SOURCE R SOURCE S Hash Join (HJ) Nguyên tắc Đặc điểm Tạo bảng băm trên R Đọc S và đối sánh với dữ liệu trên bảng băm Matching Hash Table R 1 … n two-pass, blocking algorithm probe Chi phí ? build Tuple R Tuple S hash(Tuple R)hash(Tuple S) SOURCE R Vũ Tuyết Trinh SOURCE S 4 Thiết kế và quản trị cơ sở dữ liệu Mô hình giá Chí phí thực hiện câu hỏi phụ thuộc: đọc/ghi bộ nhớ ngoài (số trang nhớ) Kích thước dữ liệu phải xử lý Chi phí truy nhập dữ liệu Đọc ghi dữ liệu xử lý Truyền thông giữa các trạm làm việc CTA = s * NBPAGES + t * NBNUPLETS (+ m * NBMESSAGES) Trọng số s = trọng số đọc/ghi dữ liệu (ví dụ = 1) t = trọng số xử lý của CPU (ví dụ = 1/3) m = trọng số truyền dữ liệu Thông tin về các quan hệ Kích thước của các quan hệ và bản ghi Relation WAGON TRAIN TRAFFIC Thông Cardinality 200000 200 5 400 2000 800 Size 20 5 15 15 10 6 min -max 5-45 tin về các chỉ số Relation WAGON WAGON WAGON WAGON TRAIN TRAFFIC TRAFFIC Vũ Tuyết Trinh Record size 60 30 20 tin về các thuộc tính Attribute NW TYPE COND CAPACITY NT DATE Thông Cardinality 200000 60000 80000 Attributes NW TYPE COND CAPACITY NT NT DATE Relation Cardinality WAGON TRAIN TRAFFIC 200000 60000 80000 Unique Yes No No No No No no Type Principal Secondary Secondary Secondary Principal Principal Principal Record size (num of rec./page) 60(100) 30 (200) 20 (300) Num of pages 45 25 30 25 18 20 40 Num. of pages (NP’) 1500(375) 225(60) 200(60) 5
Nội dung trích xuất từ tài liệu:
Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 4: Xử lý truy vấn và hiệu năng hệ CSDL Thiết kế và quản trị cơ sở dữ liệu Xử lý truy vấn và hiệu năng hệ CSDL Vũ Tuyết Trinh trinhvt-fit@mail.hut.edu.vn Bộ môn Hệ thống thông tin, Viện CNTT&TT Đại học Bách Khoa Hà Nội Xử lý câu hỏi truy vấn Câu lệnh SQL Phân tích cú pháp (parser) Biểu thức ĐSQH Bộ tối ưu (optimizer) Biểu thức ĐSQH tối ưu Bộ sinh mã (code generator) Chương trình tối ưu Vũ Tuyết Trinh 1 Thiết kế và quản trị cơ sở dữ liệu Cây toán tử TYPE WAGON (NW, TYPE, COND, STATION, CAPACITY, WEIGHT) TRAIN (NT, NW) Cây toán tử logic Thứ tự các phép toán NW Cây toán tử vật lý Các thuật toán thực thi phép toán WAGON (NW, TYPE...) NT = 4002 TRAIN (NT, NW) Các phép toán vật lý (thuật toán) Query Blocks SELECT-FROMWHERE-GROUPBYORDERBY VIEW được coi là 1 block riêng rẽ Dạng cây thực thi (right-deep, bushy, …) Thứ tự kết nối Thuật toán Sort Aggregates Select Project Join Vũ Tuyết Trinh Nested Loop Sort-Merge Hash-Join 2 Thiết kế và quản trị cơ sở dữ liệu Truy nhập bảng Truy nhập tuần tự (Sequential scan): đọc theo khối Truy nhập theo địa chỉ (index scan): truy nhập vào bản ghi dựa trên chỉ mục Chi phí truy nhập ? S Phép toán nhiều pha: Nested-Loops Join Nguyên tắc Matching Tuple R Đặc điểm Đọc từng bản ghi của quan hệ R (external relation) & lặp trên quan hệ S (internal relation) one-and-haft pass, nonblocking Tuple R Tuple S SOURCE R SOURCE S Chi phí ? Tuple-based NLJ, block-based NLJ, index-based NLJ Vũ Tuyết Trinh 3 Thiết kế và quản trị cơ sở dữ liệu Sort Merge Join Nguyên tắc Đặc điểm Merge Sắp xếp dữ liệu đầu vào trộn dữ liệu two-pass, blocking algorithm Sort Chi phí? Sort SOURCE R SOURCE S Hash Join (HJ) Nguyên tắc Đặc điểm Tạo bảng băm trên R Đọc S và đối sánh với dữ liệu trên bảng băm Matching Hash Table R 1 … n two-pass, blocking algorithm probe Chi phí ? build Tuple R Tuple S hash(Tuple R)hash(Tuple S) SOURCE R Vũ Tuyết Trinh SOURCE S 4 Thiết kế và quản trị cơ sở dữ liệu Mô hình giá Chí phí thực hiện câu hỏi phụ thuộc: đọc/ghi bộ nhớ ngoài (số trang nhớ) Kích thước dữ liệu phải xử lý Chi phí truy nhập dữ liệu Đọc ghi dữ liệu xử lý Truyền thông giữa các trạm làm việc CTA = s * NBPAGES + t * NBNUPLETS (+ m * NBMESSAGES) Trọng số s = trọng số đọc/ghi dữ liệu (ví dụ = 1) t = trọng số xử lý của CPU (ví dụ = 1/3) m = trọng số truyền dữ liệu Thông tin về các quan hệ Kích thước của các quan hệ và bản ghi Relation WAGON TRAIN TRAFFIC Thông Cardinality 200000 200 5 400 2000 800 Size 20 5 15 15 10 6 min -max 5-45 tin về các chỉ số Relation WAGON WAGON WAGON WAGON TRAIN TRAFFIC TRAFFIC Vũ Tuyết Trinh Record size 60 30 20 tin về các thuộc tính Attribute NW TYPE COND CAPACITY NT DATE Thông Cardinality 200000 60000 80000 Attributes NW TYPE COND CAPACITY NT NT DATE Relation Cardinality WAGON TRAIN TRAFFIC 200000 60000 80000 Unique Yes No No No No No no Type Principal Secondary Secondary Secondary Principal Principal Principal Record size (num of rec./page) 60(100) 30 (200) 20 (300) Num of pages 45 25 30 25 18 20 40 Num. of pages (NP’) 1500(375) 225(60) 200(60) 5
Tìm kiếm theo từ khóa liên quan:
Quản trị cơ sở dữ liệu Thiết kế cơ sở dữ liệu Xử lý truy vấn Hiệu năng hệ cơ sở dữ liệu Hệ cơ sở dữ liệu Truy nhập bảngGợi ý tài liệu liên quan:
-
Đề cương chi tiết học phần Quản trị cơ sở dữ liệu (Database Management Systems - DBMS)
14 trang 237 0 0 -
Giáo trình Cơ sở dữ liệu: Phần 1 - Sở Bưu chính Viễn Thông TP Hà Nội
48 trang 166 1 0 -
Báo cáo Thực tập chuyên môn Thiết kế cơ sở dữ liệu: Xây dựng Website studio
26 trang 147 0 0 -
54 trang 143 0 0
-
Tiểu luận Phân tích và thiết kế hệ thống quản lý kết quả học tập sinh viên
32 trang 137 0 0 -
Giáo trình Nhập môn Cơ sở dữ liệu - GV. Nguyễn Thế Dũng
280 trang 135 0 0 -
Đề tài: Phân tích thiết kế hệ thống quản lý Quán Game GameTV Net 192 Trần Đại Nghĩa
18 trang 131 0 0 -
Bài giảng Cơ sở dữ liệu (Database) - Chương 2: Mô hình thực thể - liên kết
120 trang 129 0 0 -
Luận văn tốt nghiệp: Thiết kế cơ sở dữ liệu cho bài toán quản lý cán bộ
27 trang 126 0 0 -
Bài tập thiết kế cơ sở dữ liệu
9 trang 123 0 0