Danh mục

Báo cáo nghiên cứu khoa học TÍCH HỢP CÁC CƠ SỞ DỮ LIỆU XML

Số trang: 12      Loại file: pdf      Dung lượng: 189.41 KB      Lượt xem: 10      Lượt tải: 0    
Thu Hiền

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Nguồn thông tin phong phú và hữu ích hiện đang được lưu trữ trên hàng tỷ web site trên mạng. Trong khi một website truyền thống chỉ hỗ trợ cho biểu diễn thông tin, thì việc tìm kiếm một ngôn ngữ có cấu trúc để biểu diễn các thông tin trên trang Web đang được đầu tư nghiên cứu. XML1 (eXtensible Markup Language) xuất hiện và nhanh chóng trở thành chuẩn cho các thế hệ web trong tương lai. Nó cũng là nền tảng để hình thành một lớp cơ sở dữ liệu (CSDL) mới: CSDL XML [3,8]. ...
Nội dung trích xuất từ tài liệu:
Báo cáo nghiên cứu khoa học " TÍCH HỢP CÁC CƠ SỞ DỮ LIỆU XML " TÍCH HỢP CÁC CƠ SỞ DỮ LIỆU XML Lê Thị Thu Thủy Trổồỡng Đại học Khoa học, Đại học Huế Đoàn Đại Dương Trổồỡng Đại học Sư phạm, Đại học Huế 1. GIỚI THIỆU Nguồn thông tin phong phú và hữu ích hiện đang được lưu trữ trên hàng tỷweb site trên mạng. Trong khi một website truyền thống chỉ hỗ trợ cho biểu diễnthông tin, thì việc tìm kiếm một ngôn ngữ có cấu trúc để biểu diễn các thông tintrên trang Web đang được đầu tư nghiên cứu. XML1 (eXtensible MarkupLanguage) xuất hiện và nhanh chóng trở thành chuẩn cho các thế hệ web trongtương lai. Nó cũng là nền tảng để hình thành một lớp cơ sở dữ liệu (CSDL) mới:CSDL XML [3,8]. Để hỗ trợ người sử dụng trong việc tìm và sử dụng thông tin, các CSDLXML phân tán được tích hợp, cung cấp một sự biểu diễn duy nhất từ các CSDLXML khác nhau tham gia vào hệ thống. Một hệ thống CSDL XML tích hợp sinhra một lược đồ toàn cục (global schema) cho hệ thống. Lược đồ này là sự thốngnhất và hòa hợp các lược đồ cục bộ (local schema) của các nguồn dữ liệu thamgia vào hệ thống. Nó là chìa khóa hỗ trợ cho tất cả các tiến trình của hệ thống saunày. Trên cơ sở của lược đồ tích hợp, một tập các ánh xạ đến các nguồn cục bộđược tạo ra hỗ trợ cho việc xử lý câu truy vấn của người sử dụng như: tách câutruy vấn, tích hợp các dữ liệu thô từ các nguồn..., giúp người sử dụng lấy được1 http://www.w3.org/TR/REC-xml 45thông tin tích hợp cần thiết từ hệ thống, tiết kiệm thời gian và công sức của ngườisử dụng. Nhiều hệ thống tích hợp đã và đang được xây dựng [2,4,6], tuy nhiên các hệthống này vẫn còn nhiều hạn chế trong giải quyết xung đột giữa các lược đồ [5]và tích hợp dữ liệu [3,7]. Để khắc phục những hạn chế của những nghiên cứutrên, chúng tôi đưa ra một khung làm việc (framework) mới về tích hợp cácCSDL XML [3,7]. Hệ thống mới này vừa có khả năng tích hợp các lược đồ vừacó thể đưa ra các quyết định xử lý câu truy vấn của người sử dụng. Đây là mộttrong số ít hệ thống có chiến lược tích hợp n lược đồ cục bộ một lần (one shotstrategy) [2]. Nó có thể giải quyết các xung đột chính bên trong các lược đồ theohướng thống nhất. Ngoài ra, hệ thống có thể tách câu truy vấn của người sử dụngtrên lược đồ toàn cục thành các truy vấn con của từng nguồn cục bộ đồng thời.Đây là một điểm mới so với các hệ thống đã được xây dựng [2,4,6]. Một ưu điểmnữa của hệ thống là dữ liệu từ các nguồn cục bộ được tích hợp và trả về cácthông tin thân thiện với người sử dụng. Ngôn ngữ XDD (XML DeclarativeDescription) [9] - ngôn ngữ mô tả khai báo XML - được sử dụng làm nền tảngcho tất cả các thành phần của hệ thống. Phần 2 trình bày ngắn gọn tổng quan về ngôn ngữ XDD. Phần 3 mô tả kiếntrúc và các thành phần tạo nên hệ thống tích hợp các CSDL XML. Cuối cùng,phần 4 kết luận của bài viết. 2. TỔNG QUAN NGÔN NGỮ XDD XDD (XML Declarative Description) một ngôn ngữ biểu diễn thông tin dựavào khuôn dạng tài liệu XML. Nó thực chất là sự mở rộng khả năng biểu diễncủa các phần tử XML bằng cách sử dụng kết hợp với các biến nhằm mô tả mộttập các thông tin có liên quan với nhau. Một phần tử XML mở rộng như vậy gọilà biểu thức XML (XML expresion). Bảng 1 liệt kê các loại biến sử dụng trong 46XDD. Với quan điểm này thì một phần tử XML bình thường - không chứa biến -được gọi là biểu thức XML nền tảng (ground XML expresion). Một mô tả XDDlà một tập các mệnh đề XML với khuôn dạng như sau: H  B1, ... , Bm, 1, ..., ntrong đó m, n  0; H và Bi (i=1,.., m) là các biểu thức XML trong khi  j (j=1,..,n) là ràng buộc XML (XML constraint) sử dụng để định nghĩa các ràng buộc trêncác biểu thức XML. Với khuôn dạng mệnh đề XML như trên, H còn gọi là phầnđầu của mệnh đề (Head); tập hợp {B1, ..., Bm, 1, ..., n} gọi là phần thân củamệnh đề (Body). Bảng 1: Kiểu của các biến trong XDD Ký Tên biến Biểu diễn hiệu kiểuName-variables: biến tên Tên phần tử hoặc tên các thuộc $N tínhString-variables: biến chuỗi Chuỗi dữ liệu $SPair-variables: biến cặp thuộc tính- Dãy 0 hoặc nhiều cặp thuộc $Pgiá trị ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: