Danh mục

CHUYỂN ĐỔI DỮ LIỆU TỪ XML SANG CƠ SỞ DỮ LIỆU QUAN HỆ

Số trang: 5      Loại file: pdf      Dung lượng: 145.30 KB      Lượt xem: 15      Lượt tải: 0    
10.10.2023

Phí lưu trữ: miễn phí Tải xuống file đầy đủ (5 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

CHUYỂN ĐỔI DỮ LIỆU TỪ XML SANG CƠ SỞ DỮ LIỆU QUAN HỆ Ths. Nguyễn Thị Mỹ Truyền TÓM TẮT Quá trình chuyển đổi từ XML sang CSDL quan hệ có tính phức tạp bởi đặc tính phân cấp của tài liệu XML và tính chặt chẽ về cấu trúc của DTD. Do đó với mong muốn quá trình chuyển đổi có thể thực hiện tự động và đạt hiệu quả cao, ta có thể dùng hai thuật toán New Inlining và XInsert để thực hiện quá trình chuyển đổi này. Thuật toán New Inlining chuyển từ lược đồ XML sang...
Nội dung trích xuất từ tài liệu:
CHUYỂN ĐỔI DỮ LIỆU TỪ XML SANG CƠ SỞ DỮ LIỆU QUAN HỆ CHUYỂN ĐỔI DỮ LIỆU TỪ XML SANG CƠ SỞ DỮ LIỆU QUAN HỆ Ths. Nguyễn Thị Mỹ Truyền TÓM TẮT Quá trình chuyển đổi từ XML sang CSDL quan hệ có tính phức tạp bởi đặc tính phân cấp của tài liệu XML và tính chặt chẽ về cấu trúc của DTD. Do đó với mong muốn quá trình chuyển đổi có thể thực hiện tự động và đạt hiệu quả cao, ta có thể dùng hai thuật toán New Inlining và XInsert để thực hiện quá trình chuyển đổi này. Thuật toán New Inlining chuyển từ lược đồ XML sang lược đồ CSDL quan hệ và thuật toán XInsert chuyển dữ liệu của tài liệu XML sang dữ liệu quan hệ. ABSTRACT Converting XML into Relational database is sophisticated because of strict and hierarchic characteristics of XML structure.Two following algorithms may give you a good translating method. The main purpose of New Inlining and XInsert algorithms help this process become more automaticaly and effectively. The New Inlining algorithm converts XML Schema into relational database schema. Then, the XInsert algorithm maps data of XML document to relational database. 1. ĐẶT VẤN ĐỀ Với mục đích phát huy tối đa tiềm năng và sức mạnh của Internet, W3C cho ra đời một ngôn ngữ mới, ngôn ngữ đánh dấu mở rộng XML. XML được kết hợp bởi tính mềm dẻo của SGML và tính đơn giản của HTML. Điểm nổi bậc của XML là nó được xây dựng theo cấu trúc phân cấp bằng các thẻ tự định nghĩa bởi người dùng theo đúng định chuẩn của W3C. Ngày nay, XML đã trở thành chuẩn chính thức trên Internet và là công nghệ mới cho việc hiển thị, trao đổi, lưu trữ và truy xuất dữ liệu của World Wide Web. Mặc dù XML rất hiệu quả trong quá trình trao đổi, truy xuất trên Internet nhưng nó không thể có được những tính năng tuyệt vời của CSDL quan hệ như lưu trữ hiệu quả với dung lượng cực lớn, sao chép dự phòng, phục hồi dữ liệu, tối ưu hệ thống,…. Do đó, nhu cầu chuyển đổi dữ liệu từ XML sang CSDL quan hệ là rất cần thiết khi lượng tài liệu XML ngày càng tăng. 2. NỘI DUNG NGHIÊN CỨU Theo chuẩn W3C, tài liệu XML (hình 2) phải được định nghĩa bởi DTD (hình 1). DTD mô tả cấu trúc các phần tử, thuộc tính XML thông qua các phần tử con, toán tử và các ràng buộc về dữ liệu. Vì vậy, quá trình chuyển đổi bao gồm hai tiến trình con (hình 3): Chuyển lược đồ DTD sang lược đồ quan hệ (thuật toán New Inlining) và chuyển dữ liệu XML sang dữ liệu quan hệ (thuật toán XInsert). www.cs.wayne.edu 313-5773920 ]> Hình 1: Định nghĩa kiểu tài liệu DTD Hình 2: Tài liệu XML Các hàm ánh xạ lược đồ DTD Chuyển Chuyển lược đồ dữ liệu Dữ liệu quan hệ Lược đồ quan hệ Dữ liệu XML Hình 3: Quá trình chuyển đổi XML sang RDB 2.1 Chuyển đổi lược đồ Thuật toán New Inlining ánh xạ dữ liệu DTD sang lược đồ quan hệ gồm 3 bước: Đơn giản hóa DTD, tạo và giản lược đồ thị DTD, sinh lược đồ quan hệ. 2.1.1 Đơn giản hoá DTD Áp dụng các qui tắc sau đây một cách đệ qui để đơn giản hóa các toán tử +, ?, |, * trong định nghĩa DTD. 1. e+ → e* 2. e? → e 3. (e1| e2 |…| en) →(e1, e2 ,…, en) 4. (a) (e1, e2 ,…, en)* → (e1*, e2* ,…, en*) (b) e** →e* 5. (a) …, e,…,e,…→ …,e*,… (b)…, e,…,e*,…→ …, e*,… (c)…, e*,…,e,…→ …, e*,… (d)…, e*,…,e*,…→ …e*,… 2.1.2 Tạo lập và giản lược đồ thị DTD bởi thuật toán Inline() - Một đỉnh có thể gộp nếu và chỉ nếu nó có đúng một cạnh đi vào - tương ứng với một toán tử bộ (đỉnh b, d hình A). - Đỉnh e và tất cả các đỉnh có thể gộp khác có thể đến được từ e bằng đúng một cạnh tạo thành cây thì cây đó là cây có thể gộp đỉnh e (hình D có a,b,c,d là cây có thể gộp đỉnh a). * * a a d g b a, b, c, d a, b c, d * c * c b g e, f A B e D d f C Hình 4: Thao tác gộp Ý tưởng của thuật toán New linining là sử dụng chiến lược tìm kiếm theo chiều sâu trên đồ thị DTD để ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: