Bài giảng Cơ sở dữ liệu nâng cao - PGS.TS. Nguyễn Văn Định
Số trang: 152
Loại file: pdf
Dung lượng: 3.66 MB
Lượt xem: 9
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Cơ sở dữ liệu nâng cao cung cấp cho người học các kiến thức: Tổng quan về cơ sở dữ liệu phân tán; Tối ưu hóa câu hổi và quản lý các giao dịch phân tán; Tổng quan về cơ sở dữ liệu suy diễn;...Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Cơ sở dữ liệu nâng cao - PGS.TS. Nguyễn Văn Định BỘ NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN HỌC VIỆN NÔNG NGHIỆP VIỆT NAM KHOA CÔNG NGHỆ THÔNG TIN PGS.TS. NGUYỄN VĂN ĐỊNH BÀI GIẢNG CƠ SỞ DỮ LIỆU NÂNG CAO CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN HÀ NỘI 2015Bài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 0 Chương 1 TỔNG QUAN VỀ CSDL PHÂN TÁN Chương này, đề cập đến một số khái niệm và kết quả cơ bản liên quan đến việc thiết kếmột CSDL phân tán.1.1. CẤU TRÚC CỦA HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN Dữ liệu là một thành phần không thể thiếu trong các ứng dụng công nghệthông tin. Quá trình phát triển của CNTT cũng kéo theo quá trình phát triển của công nghệCSDL.1.1.1. Sự phát triển của công nghệ CSDL Công nghệ lưu trữ và xử lý dữ liệu cho đến nay đã trải qua các giai đoạn phát triển chínhnhư sau: - Xử lý tệp truyền thống: Trong mô hình này, dữ liệu lưu trữ thành các tệp riêng rẽ, đượcmô tả và gắn kết với từng chương trình ứng dụng. Hình 1.1. Sơ đồ xử lý tệp truyền thống Cách xử lý này sẽ phát sinh vấn đề dư thừa dữ liệu và các dị thường trong cập nhật. Chẳnghạn, có thể có 2 chương trình ứng dụng với 2 tệp dữ liệu riêng, nhưng mỗi tệp dữ liệu này lại cónhững thông tin giống nhau, vì vậy tạo nên sự dư thừa dữ liệu, gây lãng phí cho lưu trữ và quản lý.Nguy hại hơn là khi cập nhật thay đổi thông tin về một thực thể trong tệp dữ liệu này thì cũng phảithay đổi trong tệp kia với đối tượng đó. Điều này rất khó thực hiện triệt để khi có nhiều tệp dữ liệucó chứa các thông tin trùng lặp, và sẽ gây ra các dị thường trong cập nhật (thông tin không nhấtquán, thông tin mâu thuẫn...). - Xử lý CSDL (Database-DB): Để khắc phục các nhược điểm của mô hình xử lý tệp, dữliệu của các ứng dụng được lưu trữ tập trung, được mô tả và xử lý thống nhất cho mọi chươngtrình ứng dụng. Các dữ liệu tập trung lại thành một CSDL, được xử lý theo cách thống nhất chotất cả các ứng dụng có liên quan. Như vậy vấn đề tập trung dữ liệu là mấu chốt của xử lý CSDL. Công nghệ CSDL là mộtbước tiến lớn của công nghệ xử lý dữ liệu. Rõ ràng là nhờ sự tập trung dữ liệu, CSDL đã khắcphục được sự dư thừa dữ liệu, hạn chế các dị thường trong cập nhật.Bài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 1 Hình 1.2. Sơ đồ xử lý CSDL Các hệ CSDL đầu tiên đã xuất hiện từ những năm 1960, từ đó đến nay chúng ta đã chứngkiến nhiều hệ quản trị CSDL ra đời như FoxBase, FoxPro, MS Access, MySQL, SQL Server,Firebird, Oracle. Hình 1.3. Sơ đồ hình thành CSDL phân tán - Công nghệ CSDL phân tán (Distributed Database-DDB): Khi công nghệ mạng máytính ra đời, người ta phân chia CSDL tập trung thành các CSDL cục bộ đặt trên các máy tínhkhác nhau (các trạm/ sites) và được kết nối bởi mạng truyền thông. Các CSDL cục bộ này tíchhợp được với nhau qua mạng máy tính mà không cần có sự tập trung dữ liệu. Do đó có thể xâydựng được một hệ thống CSDL, trong đó dữ liệu phân tán trên một mạng máy tính. Đó là cáchtiếp cận của CSDL phân tán. Có thể nhận thấy một điều thú vị là: Công nghệ mạng máy tính xúc tiến một kiểu làm việcđi ngược lại nỗ lực tập trung hóa của công nghệ CSDL, tuy vậy hai xu hướng trái ngược nhauBài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 2này lại có thể được tổng hợp lại để cho ra đời một công nghệ mạnh mẽ hơn nhiều so với từngcông nghệ riêng lẻ: đó là công nghệ CSDL phân tán. Do đó có thể thấy rằng mục tiêu quan trọng nhất của công nghệ CSDL là sự tích hợp dữ liệuchứ không phải là sự tập trung hóa, có nghĩa là có thể tích hợp dữ liệu để quản lý và sử dụngchung mà không cần tập trung hóa và đó là bản chất của CSDL phân tán. Một số ứng dụng của CSDL phân tán. Có rất nhiều lý do để cần phải có nhiều CSDL trongmột hệ thống phân tán như: + Nhiều database có thể gắn với nhiều chức năng của một hệ thống như: Bộ phận sản xuất,bộ phận quản lý nhân sự, bộ phận bán hàng… và các chức năng này lại là những hệ thống độclập có nhu cầu lấy thông tin lẫn nhau. + Đơn vị sử dụng hệ thống database có nhiều trụ sở đặt ở nhiều vị trí địa lý khác nhau vàcách xa nhau, Thí dụ như hệ thống quản lý tài khoản của mạng điện thoại di động, các servergame… + Những ứng dụng đòi hỏi dữ liệu có tốc độ truy xuất rất cao được đặt các bản copy ởnhiều server, việc truy xuất được phân tải cho các server này để đảm bảo hiệu năng, nhưng dữliệu trên các phần copy này phải đảm bảo đồng bộ tuyệt đối với nhau. + Nhiều ứng dụng khác nhau có thể đòi hỏi phải truy xuất vào cùng một dữ liệu theo cáchkhác nhau, khi đó đòi hỏi phải có cơ chế truy xuất khác nhau. Hình. 1.4. Một ứng dụng của CSDL phân tán Hình 1.4 mô tả một ứng dụng điển hình của CSDL phân tán trong doanh nghiệp gồm có 3bộ phận chính: Trụ sở chính là nơi điều hành mọi hoạt động của doanh nghiệp, cân đối dự báo tàichính…, Bộ phận sản xuất là nơi sản xuất, lập kế hoạch SX và kế hoạch nguyên liệu… và Bộphận bán hàng nhận các đơn đặt hàng, phân phối hàng hóa, dịch vụ sau bán hàng…Bài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 3 Các bộ phận này của doanh nghiệp đặt ở 3 vị trí địa lý khác nhau, CSDL của doanh nghiệpđược kết nối theo mô hình CSDL phân tán.1.1.2. Cấu trúc của hệ CSDL phân tán Có thể đưa ra định nghĩa cho CSDL phân tán theo cách mô tả như sau: Định nghĩa 1.1: CSDL phân tán là một tập hợp các CSDL cùng hợp tác hoạt động, đượclưu trữ trên các máy tính khác nhau (gọi là các trạm/s ...
Nội dung trích xuất từ tài liệu:
Bài giảng Cơ sở dữ liệu nâng cao - PGS.TS. Nguyễn Văn Định BỘ NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN HỌC VIỆN NÔNG NGHIỆP VIỆT NAM KHOA CÔNG NGHỆ THÔNG TIN PGS.TS. NGUYỄN VĂN ĐỊNH BÀI GIẢNG CƠ SỞ DỮ LIỆU NÂNG CAO CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN HÀ NỘI 2015Bài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 0 Chương 1 TỔNG QUAN VỀ CSDL PHÂN TÁN Chương này, đề cập đến một số khái niệm và kết quả cơ bản liên quan đến việc thiết kếmột CSDL phân tán.1.1. CẤU TRÚC CỦA HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN Dữ liệu là một thành phần không thể thiếu trong các ứng dụng công nghệthông tin. Quá trình phát triển của CNTT cũng kéo theo quá trình phát triển của công nghệCSDL.1.1.1. Sự phát triển của công nghệ CSDL Công nghệ lưu trữ và xử lý dữ liệu cho đến nay đã trải qua các giai đoạn phát triển chínhnhư sau: - Xử lý tệp truyền thống: Trong mô hình này, dữ liệu lưu trữ thành các tệp riêng rẽ, đượcmô tả và gắn kết với từng chương trình ứng dụng. Hình 1.1. Sơ đồ xử lý tệp truyền thống Cách xử lý này sẽ phát sinh vấn đề dư thừa dữ liệu và các dị thường trong cập nhật. Chẳnghạn, có thể có 2 chương trình ứng dụng với 2 tệp dữ liệu riêng, nhưng mỗi tệp dữ liệu này lại cónhững thông tin giống nhau, vì vậy tạo nên sự dư thừa dữ liệu, gây lãng phí cho lưu trữ và quản lý.Nguy hại hơn là khi cập nhật thay đổi thông tin về một thực thể trong tệp dữ liệu này thì cũng phảithay đổi trong tệp kia với đối tượng đó. Điều này rất khó thực hiện triệt để khi có nhiều tệp dữ liệucó chứa các thông tin trùng lặp, và sẽ gây ra các dị thường trong cập nhật (thông tin không nhấtquán, thông tin mâu thuẫn...). - Xử lý CSDL (Database-DB): Để khắc phục các nhược điểm của mô hình xử lý tệp, dữliệu của các ứng dụng được lưu trữ tập trung, được mô tả và xử lý thống nhất cho mọi chươngtrình ứng dụng. Các dữ liệu tập trung lại thành một CSDL, được xử lý theo cách thống nhất chotất cả các ứng dụng có liên quan. Như vậy vấn đề tập trung dữ liệu là mấu chốt của xử lý CSDL. Công nghệ CSDL là mộtbước tiến lớn của công nghệ xử lý dữ liệu. Rõ ràng là nhờ sự tập trung dữ liệu, CSDL đã khắcphục được sự dư thừa dữ liệu, hạn chế các dị thường trong cập nhật.Bài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 1 Hình 1.2. Sơ đồ xử lý CSDL Các hệ CSDL đầu tiên đã xuất hiện từ những năm 1960, từ đó đến nay chúng ta đã chứngkiến nhiều hệ quản trị CSDL ra đời như FoxBase, FoxPro, MS Access, MySQL, SQL Server,Firebird, Oracle. Hình 1.3. Sơ đồ hình thành CSDL phân tán - Công nghệ CSDL phân tán (Distributed Database-DDB): Khi công nghệ mạng máytính ra đời, người ta phân chia CSDL tập trung thành các CSDL cục bộ đặt trên các máy tínhkhác nhau (các trạm/ sites) và được kết nối bởi mạng truyền thông. Các CSDL cục bộ này tíchhợp được với nhau qua mạng máy tính mà không cần có sự tập trung dữ liệu. Do đó có thể xâydựng được một hệ thống CSDL, trong đó dữ liệu phân tán trên một mạng máy tính. Đó là cáchtiếp cận của CSDL phân tán. Có thể nhận thấy một điều thú vị là: Công nghệ mạng máy tính xúc tiến một kiểu làm việcđi ngược lại nỗ lực tập trung hóa của công nghệ CSDL, tuy vậy hai xu hướng trái ngược nhauBài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 2này lại có thể được tổng hợp lại để cho ra đời một công nghệ mạnh mẽ hơn nhiều so với từngcông nghệ riêng lẻ: đó là công nghệ CSDL phân tán. Do đó có thể thấy rằng mục tiêu quan trọng nhất của công nghệ CSDL là sự tích hợp dữ liệuchứ không phải là sự tập trung hóa, có nghĩa là có thể tích hợp dữ liệu để quản lý và sử dụngchung mà không cần tập trung hóa và đó là bản chất của CSDL phân tán. Một số ứng dụng của CSDL phân tán. Có rất nhiều lý do để cần phải có nhiều CSDL trongmột hệ thống phân tán như: + Nhiều database có thể gắn với nhiều chức năng của một hệ thống như: Bộ phận sản xuất,bộ phận quản lý nhân sự, bộ phận bán hàng… và các chức năng này lại là những hệ thống độclập có nhu cầu lấy thông tin lẫn nhau. + Đơn vị sử dụng hệ thống database có nhiều trụ sở đặt ở nhiều vị trí địa lý khác nhau vàcách xa nhau, Thí dụ như hệ thống quản lý tài khoản của mạng điện thoại di động, các servergame… + Những ứng dụng đòi hỏi dữ liệu có tốc độ truy xuất rất cao được đặt các bản copy ởnhiều server, việc truy xuất được phân tải cho các server này để đảm bảo hiệu năng, nhưng dữliệu trên các phần copy này phải đảm bảo đồng bộ tuyệt đối với nhau. + Nhiều ứng dụng khác nhau có thể đòi hỏi phải truy xuất vào cùng một dữ liệu theo cáchkhác nhau, khi đó đòi hỏi phải có cơ chế truy xuất khác nhau. Hình. 1.4. Một ứng dụng của CSDL phân tán Hình 1.4 mô tả một ứng dụng điển hình của CSDL phân tán trong doanh nghiệp gồm có 3bộ phận chính: Trụ sở chính là nơi điều hành mọi hoạt động của doanh nghiệp, cân đối dự báo tàichính…, Bộ phận sản xuất là nơi sản xuất, lập kế hoạch SX và kế hoạch nguyên liệu… và Bộphận bán hàng nhận các đơn đặt hàng, phân phối hàng hóa, dịch vụ sau bán hàng…Bài giảng “Cơ sở dữ liệu nâng cao” | nvdinh@vnua.edu.vn 3 Các bộ phận này của doanh nghiệp đặt ở 3 vị trí địa lý khác nhau, CSDL của doanh nghiệpđược kết nối theo mô hình CSDL phân tán.1.1.2. Cấu trúc của hệ CSDL phân tán Có thể đưa ra định nghĩa cho CSDL phân tán theo cách mô tả như sau: Định nghĩa 1.1: CSDL phân tán là một tập hợp các CSDL cùng hợp tác hoạt động, đượclưu trữ trên các máy tính khác nhau (gọi là các trạm/s ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Cơ sở dữ liệu nâng cao Cơ sở dữ liệu nâng cao Mô hình phân tán dữ liệu Các kiểu phân đoạn dữ liệu Cơ sở dữ liệu suy diễn Mô hình cơ sở dữ liệu mờGợi ý tài liệu liên quan:
-
Tiểu luận môn Cơ sở dữ liệu nâng cao: Mã hóa cơ sở dữ liệu Database Encryption
16 trang 122 0 0 -
Phát triển Java 2.0: Phân tích dữ liệu lớn bằng MapReduce của Hadoop
12 trang 73 0 0 -
Sử dụng các công cụ IBM Cognos với DB2 để phát triển các báo cáo Kinh doanh thông minh
35 trang 50 0 0 -
Di chuyển ứng dụng PHP từ MySQL sang DB2 Phần 4: Triển khai ứng dụng của bạn
20 trang 43 0 0 -
Giáo trình Excel nâng cao - Trường CĐN Đà Lạt
89 trang 36 1 0 -
Tạo động các tài liệu PDF từ ứng dụng Java
11 trang 32 0 0 -
Bài giảng Cơ sở dữ liệu nâng cao: Chương 7 - Nguyễn Thị Mỹ Dung
10 trang 31 0 0 -
5 trang 29 0 0
-
Giáo trình Cơ sở dữ liệu 2: Phần 1 - ĐH Thái Nguyên
75 trang 29 0 0 -
8 trang 27 0 0