Bài giảng Cơ sở dữ liệu phân tán: Chương 4 - Nguyễn Mậu Hân
Số trang: 76
Loại file: ppt
Dung lượng: 1.35 MB
Lượt xem: 9
Lượt tải: 0
Xem trước 8 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Chương 4 Xử lý truy vấn phân tán thuộc bài giảng Cơ sở dữ liệu phân tán. Nội dung chương này trình bày: giới thiệu về xử lý truy vấn, xử lý truy vấn trong môi trường tập trung, xử lý truy vấn trong môi trường phân tán, tối ưu hoá truy vấn trong CSDL phân tán.
Nội dung trích xuất từ tài liệu:
Bài giảng Cơ sở dữ liệu phân tán: Chương 4 - Nguyễn Mậu HânCHƯƠNG 4:XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN NGUYỄNMẬUHÂN,PhD. HUECOLLEGEOFSCIENCESCHƯƠNG 4: XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN NỘIDUNG 4.1 Giới thiệu về xử lý truy vấn 4.2 Xử lý truy vấn trong môi trường tập trung 4.3 Xử lý truy vấn trong môi trường phân tán 4.4 Tối ưu hoá truy vấn trong CSDL phân tán MỤCĐÍCH •Giới thiệu một bức tranh tổng quát của bộ tối ưu hóa truy vấn trong môi trường tập trung và phân tán •Trình bày các quy trình xử lý truy vấn trong hệ thống phân tán 2 4.1 GIỚI THIỆU VỀ XỬ LÝ TRUY VẤNMục đích của xử lý truy vấn:• Giảm thiểu thời gian xử lý• Giảm vùng nhớ trung gian• Giảm chi phí truyền thông giữa các trạm.• Sử dụng ít tài nguyênChức năng của xử lý truy vấn:• Biến đổi một truy vấn phức tạp thành một truy vấn t ương đương đơn giản hơn.• Phép biến đổi này phải đạt được cả về tính đúng đắn và hiệu quả• Mỗi cách biến đổi dẫn đến việc sử dụng tài nguyên máy tính khác nhau, nên vấn đề đặt ra là lựa ch ọn ph ương án nào dùng tài nguyên ít nhất. 3 4.1 GIỚI THIỆU VỀ XỬ LÝ TRUY VẤNCác phương pháp xử lý truy vấn cơ bản• Phương pháp biến đổi đại số: Đơn giản hóa câu truy vấn nhờ các phép biến đổi đại số tương đương nhằm giảm thiểu thời gian thực hiện các phép toán. Phương pháp này không quan tâm đến kích th ước và c ấu trúc dữ liệu.• Phương pháp ước lượng chi phí: Xác định kích thước dữ liệu, thời gian thực hiện m ỗi phép toán trong câu truy vấn. Phương pháp này quan tâm đến kích thước dữ liệu và ph ải tính toán chi phí thời gian thực hiện mỗi phép toán. 44.2 XỬ LÝ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNG4.2.1 So sánh xử lý truy vấn tập trung và phân tán• Tập trung: Chọn một truy vấn đại số quan hệ tốt nhất trong số t ất cả các truy vấn đại số tương đương. Các chiến lược xử lý truy vấn có thể biểu diễn trong sự mở rộng của đại số quan hệ.• Phân tán Kế thừa chiến lược xử lý truy vấn như môi trường tập trung Còn phải quan tâm thêm Các phép toán truyền dữ liệu giữa các trạm Chọn các trạm tốt nhất để xử lý dữ liệu Cách truyền dữ liệu 5 TỐI ƯU HOÁ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNGSơ đồ chung Câu truy v ấn S QL Kiểm tra ngữ pháp Tối ưu hoá đại số quan hệ Truy vấn đúng ngữ pháp Truy vấn đại số quan hệ đã tối ưu Kiểm tra sự hợp lệ Chọn chiến lược tối ưu Truy vấn SQL hợp lệ Kế hoạch thực hiện Dịch truy vấn Tạo sinh mã Truy vấn đại số quan hệ Mã của truy vấn 6 Tối ưu hoá truy vấn Trong môi trường phõn tỏn Câu truy vấn phân tán Lược đồ tổng Phân rã truy vấn thể Truy vấn đại số trên các quan hệ phân tán Trạm Lược đồ điều Định vị dữ liệu phân mảnh khiển Truy vấn mảnh Các thống kê Tối ưu hoá toàn cục trên các mảnh Truy vấn mảnh được tối ưu với các phép toán truyền thôngCác trạm Tối ưu hoá cục bộ Lược đồ địa phươngđịa phương Các truy vấn cục bộ đã tối ưu 7 Sơ đồ phân lớp chung cho xử lý truy vấn phân tán4.2 XỬ LÝ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNG4.4.2 Chiến lược tối ưu trong CSDL tập trungTại sao phải nghiên cứu xử lý truy vấn tập trung?Để hiểu được các kỹ thuật tối ưu phân tán vì ba lí do:• Thứ nhất, câu truy vấn phân tán phải được dịch thành cáccâu truy vấn cục bộ, và được xử lí theo ph ương pháp t ậptrung.• Thứ hai, các kỹ thuật tối ưu hoá phân tán thường là cácmở rộng của kỹ thuật tập trung.• Thứ ba, tối ưu hoá tập trung thường đơn giản. 8 4.2 XỬ LÝ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNGThuật toán INGRESÝ tưởng thuật toán: Thuật toán tổ hợp hai giai đoạn phân rãvà tối ưu hoá.• Đầu tiên phân rã câu truy vấn dạng phép toán quan h ệ thànhcác phần nhỏ hơn.• Câu ...
Nội dung trích xuất từ tài liệu:
Bài giảng Cơ sở dữ liệu phân tán: Chương 4 - Nguyễn Mậu HânCHƯƠNG 4:XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN NGUYỄNMẬUHÂN,PhD. HUECOLLEGEOFSCIENCESCHƯƠNG 4: XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN NỘIDUNG 4.1 Giới thiệu về xử lý truy vấn 4.2 Xử lý truy vấn trong môi trường tập trung 4.3 Xử lý truy vấn trong môi trường phân tán 4.4 Tối ưu hoá truy vấn trong CSDL phân tán MỤCĐÍCH •Giới thiệu một bức tranh tổng quát của bộ tối ưu hóa truy vấn trong môi trường tập trung và phân tán •Trình bày các quy trình xử lý truy vấn trong hệ thống phân tán 2 4.1 GIỚI THIỆU VỀ XỬ LÝ TRUY VẤNMục đích của xử lý truy vấn:• Giảm thiểu thời gian xử lý• Giảm vùng nhớ trung gian• Giảm chi phí truyền thông giữa các trạm.• Sử dụng ít tài nguyênChức năng của xử lý truy vấn:• Biến đổi một truy vấn phức tạp thành một truy vấn t ương đương đơn giản hơn.• Phép biến đổi này phải đạt được cả về tính đúng đắn và hiệu quả• Mỗi cách biến đổi dẫn đến việc sử dụng tài nguyên máy tính khác nhau, nên vấn đề đặt ra là lựa ch ọn ph ương án nào dùng tài nguyên ít nhất. 3 4.1 GIỚI THIỆU VỀ XỬ LÝ TRUY VẤNCác phương pháp xử lý truy vấn cơ bản• Phương pháp biến đổi đại số: Đơn giản hóa câu truy vấn nhờ các phép biến đổi đại số tương đương nhằm giảm thiểu thời gian thực hiện các phép toán. Phương pháp này không quan tâm đến kích th ước và c ấu trúc dữ liệu.• Phương pháp ước lượng chi phí: Xác định kích thước dữ liệu, thời gian thực hiện m ỗi phép toán trong câu truy vấn. Phương pháp này quan tâm đến kích thước dữ liệu và ph ải tính toán chi phí thời gian thực hiện mỗi phép toán. 44.2 XỬ LÝ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNG4.2.1 So sánh xử lý truy vấn tập trung và phân tán• Tập trung: Chọn một truy vấn đại số quan hệ tốt nhất trong số t ất cả các truy vấn đại số tương đương. Các chiến lược xử lý truy vấn có thể biểu diễn trong sự mở rộng của đại số quan hệ.• Phân tán Kế thừa chiến lược xử lý truy vấn như môi trường tập trung Còn phải quan tâm thêm Các phép toán truyền dữ liệu giữa các trạm Chọn các trạm tốt nhất để xử lý dữ liệu Cách truyền dữ liệu 5 TỐI ƯU HOÁ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNGSơ đồ chung Câu truy v ấn S QL Kiểm tra ngữ pháp Tối ưu hoá đại số quan hệ Truy vấn đúng ngữ pháp Truy vấn đại số quan hệ đã tối ưu Kiểm tra sự hợp lệ Chọn chiến lược tối ưu Truy vấn SQL hợp lệ Kế hoạch thực hiện Dịch truy vấn Tạo sinh mã Truy vấn đại số quan hệ Mã của truy vấn 6 Tối ưu hoá truy vấn Trong môi trường phõn tỏn Câu truy vấn phân tán Lược đồ tổng Phân rã truy vấn thể Truy vấn đại số trên các quan hệ phân tán Trạm Lược đồ điều Định vị dữ liệu phân mảnh khiển Truy vấn mảnh Các thống kê Tối ưu hoá toàn cục trên các mảnh Truy vấn mảnh được tối ưu với các phép toán truyền thôngCác trạm Tối ưu hoá cục bộ Lược đồ địa phươngđịa phương Các truy vấn cục bộ đã tối ưu 7 Sơ đồ phân lớp chung cho xử lý truy vấn phân tán4.2 XỬ LÝ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNG4.4.2 Chiến lược tối ưu trong CSDL tập trungTại sao phải nghiên cứu xử lý truy vấn tập trung?Để hiểu được các kỹ thuật tối ưu phân tán vì ba lí do:• Thứ nhất, câu truy vấn phân tán phải được dịch thành cáccâu truy vấn cục bộ, và được xử lí theo ph ương pháp t ậptrung.• Thứ hai, các kỹ thuật tối ưu hoá phân tán thường là cácmở rộng của kỹ thuật tập trung.• Thứ ba, tối ưu hoá tập trung thường đơn giản. 8 4.2 XỬ LÝ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNGThuật toán INGRESÝ tưởng thuật toán: Thuật toán tổ hợp hai giai đoạn phân rãvà tối ưu hoá.• Đầu tiên phân rã câu truy vấn dạng phép toán quan h ệ thànhcác phần nhỏ hơn.• Câu ...
Tìm kiếm theo từ khóa liên quan:
Xử lý truy vấn phân tán Hệ quản trị cơ sở dữ liệu Quản trị cơ sở dữ liệu Thiết kế cơ sở dữ liệu Cơ sở dữ liệu phân tánGợi ý tài liệu liên quan:
-
Giáo án Tin học lớp 12 (Trọn bộ cả năm)
180 trang 267 0 0 -
Thực hiện truy vấn không gian với WebGIS
8 trang 246 0 0 -
Đề cương chi tiết học phần Quản trị cơ sở dữ liệu (Database Management Systems - DBMS)
14 trang 244 0 0 -
Báo cáo bài tập lớn môn Cơ sở dữ liệu phân tán: Hệ thống quản lý vật tư
61 trang 228 1 0 -
Đề cương môn học: Cơ sở dữ liệu phân tán
8 trang 187 0 0 -
Giáo trình Cơ sở dữ liệu: Phần 1 - Sở Bưu chính Viễn Thông TP Hà Nội
48 trang 169 1 0 -
Báo cáo Thực tập chuyên môn Thiết kế cơ sở dữ liệu: Xây dựng Website studio
26 trang 155 0 0 -
54 trang 147 0 0
-
69 trang 144 0 0
-
Bài tập thiết kế cơ sở dữ liệu
9 trang 142 0 0