"Bài giảng "Các vấn đề cơ sở của khoa học máy tính - Chương 6: Cơ sở dữ liệu" cung cấp các kiến thức: Giới thiệu về cơ sở dữ liệu. các loại cơ sở dữ liệu, các ưu điểm khi sử dụng cơ sở dữ liệu, mô hình hóa miền dữ liệu, xây dựng CSDL quan hệ từ mô hình dữ liệu, chuẩn hóa dữ liệu, ngôn ngữ SQL, ngôn ngữ định nghĩa dữ liệu (DDL), ngôn ngữ thao tác dữ liệu (DML). Mời các bạn cùng tham khảo nội dung chi tiết.
Nội dung trích xuất từ tài liệu:
Bài giảng Các vấn đề cơ sở của khoa học máy tính: Chương 6 - Tô Oai HùngChương 6: CƠ SỞ DỮ LIỆU Nội Dung1. Giới thiệu.2. Các loại cơ sở dữ liệu.3. Các ưu điểm khi sử dụng CSDL.4. Mô hình hóa miền dữ liệu.5. Xây dựng CSDL quan hệ từ mô hình dữ liệu6. Chuẩn hóa dữ liệu.7. Ngôn ngữ SQL.8. Ngôn ngữ định nghĩa dữ liệu (DDL).9. Ngôn ngữ thao tác dữ liệu (DML). 2Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Giới Thiệu• Ngày nay, CSDL có mặt ở khắp nơi. Hầu hết trong các ứng dụng, chúng ta đều gặp CSDL. CSDL tạo hiệu quả, an toàn và linh động trong việc lưu trữ dữ liệu.• Ngay sau khi máy tính thế hệ thứ hai ra đời (sau thập niên 1950), sự có mặt của các ngôn ngữ lập trình cấp cao đòi hỏi dung lượng lưu trữ lớn. Dữ liệu được chứa trong các tập tin (tập các mẫu tin) trên băng từ. Cách lưu trữ này sớm bộc lộ những trở ngại nhất định.• Đầu tiên là những tập tin lớn, cần thời gian tìm kiếm lâu hơn. Chúng ta hãy xem lại các giải thuật đã thảo luận trước đây, thời gian 3Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Giới Thiệu của giải thuật tìm kiếm tuần tự là O(n). Vì thế, những tập tin lớn, cần nhiều thời gian hơn để tìm phần tử nào đó. Chẳng hạn, chúng ta cần tìm một khách hàng trong hàng triệu khách hàng là điều không thể.• Một vấn đề khác trong việc tổ chức dữ liệu không hợp lý, chẳng hạn cùng một thông tin của khách hàng nhưng được lưu lại nhiều lần sẽ dẫn đến việc sử dụng bộ nhớ lưu trữ không hiệu quả. 4Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Các Loại Cơ Sở Dữ Liệu• Bắt đầu từ sau thập niên 1960, các hệ CSDL (database system) đã được phát triển. Hai loại CSDL đầu tiên là loại phân cấp (hierarchy) và mạng (network). IBM đưa ra DL/1 là mô hình CSDL phân cấp và hàng loạt phần cứng và phần mềm khác cùng với mô hình CSDL mạng.• Các cấu trúc CSDL phân cấp và mạng được tổ chức thành nhiều tập tin quan hệ với nhau để truy cập thông tin nhanh hơn, bảo mật tốt hơn và dễ dàng cập nhật hơn. Tuy nhiên, các cấu trúc này khá phức tạp và không linh động. 5Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Các Loại Cơ Sở Dữ Liệu• Vào năm 1970, E. F. Codd của IBM đưa ra mô hình CSDL quan hệ (relational database). Mô hình quan hệ dựa nhiều vào lý thuyết toán.• Theo mô hình này, dữ liệu được chứa trong các bảng, gọi là các “quan hệ”. Mỗi quan hệ/bảng lưu giữ thông tin về một kiểu thực thể (entity type) và các thực thể quan hệ nhau bởi thông tin đã lưu trong các bảng đó.• Codd cũng đưa ra một ngôn ngữ để truy vấn dữ liệu dựa vào lý thuyết tập hợp. Vào thập niên 1980, ngôn ngữ truy vấn có cấu trúc (Structured Query Language - SQL) được thế giới biết đến. Sau đó, IBM bắt đầu bán CSDL 6Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Các Loại Cơ Sở Dữ Liệu quan hệ có tên là DB2.• Ngày nay, mô hình dữ liệu quan hệ được sử dụng rộng rãi và là mô hình mà chúng ta sẽ thảo luận. 7Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Các Ưu Điểm Khi Sử Dụng CSDL• Động cơ chính của việc sử dụng CSDL là tốc độ truy xuất. Một CSDL được thiết kế đúng cách, sự truy xuất các phần thông tin riêng biệt có thể thực hiện ngay tức thời, bất kể số mẫu tin hay kích thước của CSDL. Tốc độ truy xuất có thể biểu diễn là O(k), trong đó k là hằng số có giá trị bé.• Việc sử dụng CSDL làm cho các chương trình truy xuất dữ liệu mà không cần biết nó như thế nào. Nếu một chương trình đọc tập tin thông thường, nó phải biết kiểu dữ liệu, các định dạng và thứ tự các trường (field) của tập tin đó. 8Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Các Ưu Điểm Khi Sử Dụng CSDL• Tuy nhiên, khi chương trình đọc từ tập tin CSDL, nó thường chỉ cần xác định rõ thông tin gì mà nó muốn.• CSDL cũng cho phép tận dụng hiệu quả không gian lưu trữ, giảm dư thừa dữ liệu đến mức tối tiểu.• Các hệ quản trị CSDL (Database management system - DBMS) cũng tăng tính bảo mật CSDL thông qua một số cách. Cho ví dụ, các tiện ích sao lưu và khôi phục dữ luôn có sẵn trong các DBMS và dữ liệu có thể được sao lưu cả khi nó đang được sử dụng.• Các hệ CSDL cũng hỗ trợ cho khái niệm về 9Các Vấn Đề Cơ Sở của KHMT ThS. GVC Tô Oai Hùng Các Ưu Điểm Khi Sử Dụng CSDL giao tác (transaction). Một giao tác là một nhóm các thay đổi có quan hệ ...