Danh mục

Cơ sở dữ liệu phi quan hệ - NoSQL

Số trang: 10      Loại file: pdf      Dung lượng: 382.58 KB      Lượt xem: 28      Lượt tải: 0    
tailieu_vip

Hỗ trợ phí lưu trữ khi tải xuống: 1,000 VND Tải xuống file đầy đủ (10 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết "Cơ sở dữ liệu phi quan hệ - NoSQL" giới thiệu cơ sở dữ liệu NoSQL được công nhận rộng rãi vì khả năng dễ phát triển chức năng cũng như hiệu năng ở quy mô lớn. Các cơ sở dữ liệu này sử dụng mô hình dữ liệu đa dạng như tài liệu (document), đồ thị (graph), khóa – giá trị (key-value), cột (wide-column). Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Cơ sở dữ liệu phi quan hệ - NoSQL CƠ SỞ DỮ LIỆU PHI QUAN HỆ - NOSQL Đinh Nguyễn Thúy Nguyệt Khoa Công nghệ Thông tin, Trường Đại học Tài chính –Marketing Email: dntnguyet@ufm.edu.vn Tóm tắt: Cơ sở dữ liệu (CSDL) quan hệ truyền thống cấu trúc dữ liệu được xác định trước, trong khi thế giới đang hướng đến dữ liệu không cấu trúc, khối lượng dữ liệu và sự kiện mà các hệ thống cần phải xử lý cũng tăng nhanh một cách đáng kể thì CSDL quan hệ trong trường hợp này gây ra một số cản trở như lược đồ (schema) cứng nhắc, thiếu linh hoạt khiến chúng trở nên ít phù hợp hơn với một số loại ứng dụng. Cơ sở dữ liệu NoSQL được công nhận rộng rãi vì khả năng dễ phát triển chức năng cũng như hiệu năng ở quy mô lớn. Các cơ sở dữ liệu này sử dụng mô hình dữ liệu đa dạng như tài liệu (document), đồ thị (graph), khóa – giá trị (key-value), cột (wide-column). Từ khoá: cơ sở dữ liệu phi quan hệ, cơ sở dữ liệu NoSQL, NoSQL 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU NOSQL Cơ sở dữ liệu NoSQL hay “Non-Relational” (phi quan hệ) là một thuật ngữ chung cho các hệ cơ sở dữ liệu không sử dụng mô hình dữ liệu quan hệ. Dữ liệu được mô hình hóa bằng các phương tiện khác với các quan hệ dạng bảng được sử dụng trong cơ sở dữ liệu quan hệ. Cơ sở dữ liệu quan hệ hữu dụng trong việc xử lí các dữ liệu được cấu trúc kỹ càng và hỗ trợ tính ACID (Atomicity: tính nguyên tố). Một giao dịch có nhiều thao tác khác biệt thì hoặc là toàn bộ các thao tác hoặc là không một thao tác nào được hoàn thành. Consistency: tính nhất quán. Một giao dịch hoặc là sẽ tạo ra một trạng thái mới và hợp lệ cho dữ liệu, hoặc trong trường hợp có lỗi sẽ chuyển toàn bộ dữ liệu về trạng thái trước khi thực thi giao dịch., Isolation: tính độc lập. Một giao dịch đang thực thi và chưa được xác nhận phải bảo đảm tách biệt khỏi các giao dịch khác. Durability: tính bền vững. Dữ liệu được xác nhận sẽ được hệ thống lưu lại sao cho ngay cả trong trường hợp hỏng hóc hoặc có lỗi hệ thống, dữ liệu vẫn đảm bảo trong trạng thái chuẩn xác). Ngoài ra, nó còn có một cộng đồng hỗ trợ vô cùng mạnh mẽ. Tuy nhiên, cơ sở dữ liệu quan hệ vẫn còn tồn tại những hạn chế như:  Nếu đúng chuẩn, hiệu năng có thể sẽ bị chậm nếu phải join nhiều bảng để lấy dữ liệu. Đó là lý do ta sử dụng “giảm chuẩn” để tăng hiệu suất cho hệ quản trị cơ sở dữ liệu quan hệ (RDBMS). 264  Khó mở rộng hoặc thay đổi cấu trúc bảng: việc thêm/xóa bảng hoặc thêm/xóa một field... có thể kéo theo vô số source code thay đổi.  Không làm việc được với dữ liệu không có cấu trúc (unstructure).  RDBMS được thiết kế để chạy trên một máy chủ. Khi muốn mở rộng, nó khó chạy trên nhiều máy (clustering). Thuật ngữ NoSQL được giới thiệu lần đầu vào năm 1998 bởi Carlo Strozzi khi ông lập mới một hệ cơ sở dữ liệu mở nhanh và nhẹ nhưng không sử dụng SQL cho truy vấn. Cho tới năm 2009, Eric Evans giới thiệu lại thuật ngữ NoSQL trong một hội thảo về cơ sở dữ liệu mã nguồn mở phân tán. Thuật ngữ NoSQL đánh dấu bước phát triển của thế hệ database mới: distributed (phân tán) + non-relational (không ràng buộc). NoSQL được phát triển xuất phát từ yêu cầu cần những CSDL có khả năng lưu trữ dữ liệu với lượng cực lớn, truy vấn dữ liệu với tốc độ cao mà không đòi hỏi quá nhiều về năng lực phần cứng cũng như tài nguyên hệ thống và tăng khả năng chịu lỗi. NoSQL bao gồm một loạt các công nghệ cơ sở dữ liệu khác nhau được phát triển để đáp ứng các yêu cầu lưu trữ dữ liệu có cấu trúc, bán cấu trúc, không cấu trúc hay đa hình của các ứng dụng hiện đại. Các đặc điểm của cơ sở dữ liệu NoSQL: - Phi quan hệ: không có ràng buộc nào cho việc nhất quán dữ liệu; - Mô hình lưu trữ phân tán các tập tin hoặc dữ liệu ra nhiều máy khác nhau trong mạng LAN hoặc Internet dưới sự kiểm soát của phần mềm; - NoSQL lưu trữ dữ liệu của mình theo dạng cặp giá trị “key – value”. Sử dụng số lượng lớn các node để lưu trữ thông tin; - Tính nhất quán không theo thời gian thực: sau mỗi thay đổi cơ sở dữ liệu, không cần tác động ngay đến tất cả các cơ sở dữ liệu liên quan mà được lan truyền theo thời gian; - Mô hình dữ liệu và truy vấn linh hoạt; - Triển khai đơn giản, dễ nâng cấp và mở rộng. Một số khái niệm mới trong NoSQL: - Fields – tương đương với khái niệm Columns trong SQL 265 - Document – thay thế khái niệm row trong SQL. Đây cũng chính là khái niệm làm nên sự khác biệt giữa NoSQL và SQL, 1 document chứa số cột (fields) không cố định trong khi 1 row thì số cột(columns) là định sẵn trước. - Collection – tương đương với khái niệm table trong SQL. Một collection là tập hợp các document. Điều đặc biệt là một collection có thể chứa các document hoàn toàn khác nhau. - Key-value – cặp từ khóa – giá trị được dùng để lưu trữ dữ liệu trong NoSQL - Cursor – tạm dịch là con trỏ. Chúng ta sẽ sử dụng cursor để lấy dữ liệu từ database. - Indexes ~ counterparts: Trong các hệ cơ sở dữ liệu quan hệ, các cột được định nghĩa theo bảng còn với hệ cơ sở dữ liệu không ràng buộc, các cột được định nghĩa ở mỗi document. Bởi thế, các document quản lí gần như tất cả, các collection không cần quản lí chặt chẽ những gì đang xảy ra trong nó nữa . So sánh giữa NoSQL và cơ sở dữ liệu quan hệ: Cơ sở dữ liệu quan hệ Cơ sở dữ liệu phi quan hệ NoSQL Sử dụng ngôn ngữ truy vấn SQL Không sử dụng SQL, không khai báo ngôn ngữ truy vấn Dữ liệu có cấu trúc, có tổ chức Dữ liệu đa dạng, có thể có cấu trúc, bán cấu trúc, không c ...

Tài liệu được xem nhiều:

Tài liệu liên quan: