Bài giảng Tích hợp dữ liệu và XML - Chương 9: Đối sánh lược đồ
Số trang: 8
Loại file: pdf
Dung lượng: 92.83 KB
Lượt xem: 10
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Tích hợp dữ liệu và XML - Chương 9: Đối sánh lược đồ. Chương này cung cấp cho sinh viên những nội dung gồm: giới thiệu; khái niệm lược đồ; bài toán đối sánh lược đồ; phân loại các phương pháp đối sánh; vấn đề không thống nhất ngữ nghĩa; ứng dụng của đối sánh lược đồ;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!
Nội dung trích xuất từ tài liệu:
Bài giảng Tích hợp dữ liệu và XML - Chương 9: Đối sánh lược đồ 04/04/2013 Nội dung 1. Giới thiệu Đối sánh lược ñồ 2. Khái niệm lược ñồ 3. Bài toán ñối sánh lược ñồ 4. Phân loại các phương pháp ñối Nguyễn Hồng Phương sánh Email: phuong.nguyenhong@hust.edu.vn 5. Vấn ñề không thống nhất ngữ nghĩa Site: http://is.hut.edu.vn/~phuongnh Bộ môn Hệ thống thông tin 6. Ứng dụng của ñối sánh lược ñồ Viện Công nghệ thông tin và Truyền thông Đại học Bách Khoa Hà Nội 1 21. Giới thiệu 1. Giới thiệu (tiếp) Lược ñồ là một cấu trúc siêu dữ liệu, mô tả dữ Nhiều ứng dụng, như kho dữ liệu, liệu có thể ñược lưu trữ, truy cập và thông dịch mediating giữa các website, khai phá dữ bởi người dùng và ứng dụng như thế nào. liệu, quản trị dữ liệu ngang hàng,… cần Ngoài khía cạnh kĩ thuật liên quan ñến quản trị tích hợp dữ liệu từ nhiều nguồn ñể hỗ trợ dữ liệu (như ñịnh dạng các trường, kiểu dữ liệu), các câu truy vấn và khả năng phân tích. lược ñồ cũng thể hiện khía cạnh ngữ nghĩa mở Tiến trình này, gọi là tích hợp dữ liệu, rộng (nội dung và nghĩa của dữ liệu): các giá trị nhắm ñến việc cung cấp một khung nhìn ñược phép, cardinality, ràng buộc toàn vẹn và ñồng bộ và nhất quán, gọi là sơ ñồ tổng tham chiếu. thể (global schema) Một số ngôn ngữ lược ñồ: Trên thực tế, việc tích hợp dữ liệu thường SQL (Structure Query Language) biểu diễn lược ñồ quan hệ ñược thực hiện tăng trưởng bằng cách bắt DTD (Document Type Definition) và XSD (XML Schema ñầu với một sơ ñồ tổng thể ñơn giản rồi Definition) biểu diễn lược ñồ tài liệu XML thêm các nguồn dữ liệu mới vào khi cần. OWL (Ontology Web Language) biểu diễn ontology 3 41. Giới thiệu (tiếp) Ví dụ: ñối sánh lược ñồ ñể tích hợp dữ liệu Việc tích hợp một nguồn dữ liệu mới vào sơ ñồ tổng thể hiện tại ñược thực hiện thông qua hai bước: S S Client GS (cũ) Client GS (mới) ñối sánh: lược ñồ nguồn ñược so sánh với •Id Customer •Id Customer lược ñồ tổng thể ñể xác ñịnh các phần tử •First •CID •First •CID tương ñồng và các phần tử khác biệt. •Last •Name •Last •Name •Home •Address •Home •Address chuyển ñổi dữ liệu: sinh ra các truy vấn ñề •Phone •Phone •Phone chuyển ñổi các dữ liệu thể hiện từ lược ñồ nguồn sang lược ñồ tổng thể. A) Đối sánh lược ñồ 5 6 1 04/04/2013Ví dụ: ñối sánh lược ñồ ñể tích hợp dữ liệu (tiếp) 1. Giới thiệu (tiếp) Việc nhận diện các cặp tương quan ngữId First Last Home Phone nghĩa giữa hai lược ñồ ñược biết ñến1 Kristen Smith Hurley St. 2 123… … … … … như là ñối sánh lược ñồ. CID Name Address Phone 1 Kristen Smith Hurle ...
Nội dung trích xuất từ tài liệu:
Bài giảng Tích hợp dữ liệu và XML - Chương 9: Đối sánh lược đồ 04/04/2013 Nội dung 1. Giới thiệu Đối sánh lược ñồ 2. Khái niệm lược ñồ 3. Bài toán ñối sánh lược ñồ 4. Phân loại các phương pháp ñối Nguyễn Hồng Phương sánh Email: phuong.nguyenhong@hust.edu.vn 5. Vấn ñề không thống nhất ngữ nghĩa Site: http://is.hut.edu.vn/~phuongnh Bộ môn Hệ thống thông tin 6. Ứng dụng của ñối sánh lược ñồ Viện Công nghệ thông tin và Truyền thông Đại học Bách Khoa Hà Nội 1 21. Giới thiệu 1. Giới thiệu (tiếp) Lược ñồ là một cấu trúc siêu dữ liệu, mô tả dữ Nhiều ứng dụng, như kho dữ liệu, liệu có thể ñược lưu trữ, truy cập và thông dịch mediating giữa các website, khai phá dữ bởi người dùng và ứng dụng như thế nào. liệu, quản trị dữ liệu ngang hàng,… cần Ngoài khía cạnh kĩ thuật liên quan ñến quản trị tích hợp dữ liệu từ nhiều nguồn ñể hỗ trợ dữ liệu (như ñịnh dạng các trường, kiểu dữ liệu), các câu truy vấn và khả năng phân tích. lược ñồ cũng thể hiện khía cạnh ngữ nghĩa mở Tiến trình này, gọi là tích hợp dữ liệu, rộng (nội dung và nghĩa của dữ liệu): các giá trị nhắm ñến việc cung cấp một khung nhìn ñược phép, cardinality, ràng buộc toàn vẹn và ñồng bộ và nhất quán, gọi là sơ ñồ tổng tham chiếu. thể (global schema) Một số ngôn ngữ lược ñồ: Trên thực tế, việc tích hợp dữ liệu thường SQL (Structure Query Language) biểu diễn lược ñồ quan hệ ñược thực hiện tăng trưởng bằng cách bắt DTD (Document Type Definition) và XSD (XML Schema ñầu với một sơ ñồ tổng thể ñơn giản rồi Definition) biểu diễn lược ñồ tài liệu XML thêm các nguồn dữ liệu mới vào khi cần. OWL (Ontology Web Language) biểu diễn ontology 3 41. Giới thiệu (tiếp) Ví dụ: ñối sánh lược ñồ ñể tích hợp dữ liệu Việc tích hợp một nguồn dữ liệu mới vào sơ ñồ tổng thể hiện tại ñược thực hiện thông qua hai bước: S S Client GS (cũ) Client GS (mới) ñối sánh: lược ñồ nguồn ñược so sánh với •Id Customer •Id Customer lược ñồ tổng thể ñể xác ñịnh các phần tử •First •CID •First •CID tương ñồng và các phần tử khác biệt. •Last •Name •Last •Name •Home •Address •Home •Address chuyển ñổi dữ liệu: sinh ra các truy vấn ñề •Phone •Phone •Phone chuyển ñổi các dữ liệu thể hiện từ lược ñồ nguồn sang lược ñồ tổng thể. A) Đối sánh lược ñồ 5 6 1 04/04/2013Ví dụ: ñối sánh lược ñồ ñể tích hợp dữ liệu (tiếp) 1. Giới thiệu (tiếp) Việc nhận diện các cặp tương quan ngữId First Last Home Phone nghĩa giữa hai lược ñồ ñược biết ñến1 Kristen Smith Hurley St. 2 123… … … … … như là ñối sánh lược ñồ. CID Name Address Phone 1 Kristen Smith Hurle ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Tích hợp dữ liệu và XML Tích hợp dữ liệu và XML Tích hợp dữ liệu Đối sánh lược đồ Bài toán đối sánh lược đồ Phương pháp đối sánh Ngôn ngữ lược đồGợi ý tài liệu liên quan:
-
Tích hợp dữ liệu và nhiệm vụ xây dựng hệ thống cơ sở dữ liệu quốc gia về biến đổi khí hậu
4 trang 49 0 0 -
Bài giảng Tích hợp dữ liệu và XML - Chương 3: XML DOM
19 trang 25 0 0 -
111 trang 24 0 0
-
9 trang 19 0 0
-
Bài giảng Khai phá dữ liệu (Data mining): Chương 2 - Lê Tiến
56 trang 18 0 0 -
Bài giảng Tích hợp dữ liệu và XML - Chương 4: XML Schema
20 trang 13 0 0 -
Bài giảng Tích hợp dữ liệu và XML - Chương 10: Đối sánh chuỗi
5 trang 13 0 0 -
120 trang 12 0 0
-
Bài giảng Tích hợp dữ liệu và XML - Chương 8: DTD
7 trang 12 0 0 -
Đề Tài: Phân biệt tiếp thị sản phẩm đa phương tiện với sản phẩm tin học thông thường
10 trang 12 0 0