Thông tin tài liệu:
Chương 4 XML thuộc bài giảng cơ sở dữ liệu Web và XML, cùng nắm kiến thức trong chương này thông qua việc tìm hiểu các kiến thức sau: tổng quan về XML, định nghĩa kiểu dữ liệu - DTD, ngôn ngữ định dạng, liên kết.
Nội dung trích xuất từ tài liệu:
Bài giảng Cơ sở dữ liệu Web và XML: Chương 4 - GV. Hồ Văn Phi
CƠ SỞ DỮ LIỆU WEB & XML
CHƯƠNG 4
XML
Chương 4. XML 4 - 1/
Chương 4: XML
4.1 Tổng quan về XML
4.2 Định nghĩa kiểu dữ liệu - DTD
4.3 Ngôn ngữ định dạng
4.4 Liên kết
Chương 4. XML 4 - 2/
Chương 4: XML
MỤC TIÊU
- Trình bày được:
+ Các khái niệm trong XML
+ Định nghĩa kiểu tư liệu - DTD
+ Ngôn ngữ định dạng dữ liệu
+ Ngôn ngữ tạo liên kết
- Tạo được tài liệu XML hợp lệ, hợp khuôn dạng
- Áp dụng để tạo cấu trúc tài liệu
Chương 4. XML 4 - 3/
4.1 Tổng quan về XML
4.1.1 Giới thiệu
XML - eXtensible Markup Language
là ngôn ngữ xây dựng cấu trúc tài liệu văn bản
dựa theo chuẩn SGML (Standard Generalized Markup
Language)
W3C phát triển
tương tự như cơ sở dữ liệu
dùng văn bản (text) để mô tả thông tin
Chương 4. XML 4 - 4/
4.1 Tổng quan về XML
4.1.1 Giới thiệu
Đơn vị cơ sở của XML là các ký tự
Tài liệu xml gồm một hoặc nhiều thực thể (mỗi thực thể
thường là một phần)
XML có thể dùng cho nhiều loại dữ liệu
Chương 4. XML 4 - 5/
4.1 Tổng quan về XML
4.1.1 Giới thiệu
Có ba loại văn bản XML:
Văn bản không hợp lệ: không theo nguyên tắc cú pháp
được quy định bởi đặc tính kỹ thuật XML
Văn bản hợp lệ: tuân theo nguyên tắc cú pháp XML và quy
định trong DTD hoặc lược đồ.
Văn bản chuẩn: tuân theo quy tắc cú pháp XML nhưng
không có DTD hoặc lược đồ.
Chương 4. XML 4 - 6/
4.1 Tổng quan về XML
4.1.1 Giới thiệu
ví dụ:
A Thousand Splendid Suns
Khaled Hosseini
Riverhead Hardcover
14.27
Chương 4. XML 4 - 7/
4.1 Tổng quan về XML
4.1.1 Giới thiệu
Các đặc điểm của XML:
Dễ dàng viết được các chương trình xử lý dữ liệu
Tài liệu XML dễ đọc và có tính hợp lý cao
XML dễ dàng được sử dụng trên Internet
XML hỗ trợ nhiều ứng dụng
Không đặt nặng tính hình thức trong nội dung thẻ
Chương 4. XML 4 - 8/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
Một tài liệu XML được chia thành hai phần chính:
- Phần khai báo: khai báo cho tài liệu XML
khai báo phiên bản, bảng mã ký tự sử dụng trong tài liệu
định nghĩa kiểu cho tài liệu
Khai báo có thể có hoặc không. Nếu có, nó phải là ở dòng
đầu tiên trong văn bản.
Ví dụ:
Chương 4. XML 4 - 9/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
Một tài liệu XML được chia thành hai phần chính:
- Phần thân: chứa nội dung dữ liệu
gồm một hay nhiều phần tử,
mỗi phần tử được chứa trong một cặp thẻ
phần tử đầu tiên là phần tử gốc (root element).
Chương 4. XML 4 - 10/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
Ví dụ:
Peter@gmail.com
Jhon@gmail.com
Invitation
marry@yahoo.com
Chương 4. XML 4 - 11/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
Một tài liệu XML được coi là hợp khuôn dạng (well-form) nếu:
các khai báo đặt tại dòng đầu tiên của tài liệu
chỉ có một thành phần gốc (root)
mỗi phần tử của tài liệu phải được nằm trong một cặp thẻ
Các thành phần đều nằm giữa cặp thẻ gốc và phải lồng
nhau một cách hợp lý
các cặp thẻ phải được viết chính xác như nhau
giá trị của thuộc tính phải nằm giữa ngoặc kép hoặc đơn
Chương 4. XML 4 - 12/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
- Phần tử gốc
chứa tất cả các phần tử trong văn bản:
Hello, World!
Hello, World!
Hello XML!
Hello XML!
Chương 4. XML 4 - 13/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
- Phần tử
là mẩu thông tin được đánh dấu bằng một cặp thẻ, thẻ mở và thẻ
đóng
thẻ mở của phần tử đánh dấu nơi bắt đầu
thẻ đóng đánh dấu nơi kết thúc
phần tử chỉ có một thẻ gọi là phần tử đóng hay còn gọi là
phần tử rỗng; dấu kết thúc thẻ là “/>”. ví dụ
nội dung của phần tử bao gồm văn bản và các phần tử
(con) khác.
Chương 4. XML 4 - 14/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
- Phần tử
Thuộc tính cho phép xác định thêm thông tin và ý nghĩa của thẻ
một phần tử có thể chứa các thuộc tính được đặt trong thẻ
bắt đầu, ngay sau tên phần tử
Giá trị của thuộc tính phải được đặt trong cặp nháy đơn
hoặc nháy kép
mỗi tên thuộc tính chỉ được xuất hiện một lần trong mỗi
phần tử.
Chương 4. XML 4 - 15/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
- Phần tử
Để gán giá trị cho thuộc tính, thường dùng dấu “=”. Ví dụ
city = Bedford.
Ví dụ:
A Thousand Splendid Suns
Khaled Hosseini
Chương 4. XML 4 - 16/
4.1 Tổng quan về XML
4.1.2 Cấu trúc một tài liệu XML
- Phần tử rỗng
là phần tử không kèm theo dữ liệu
chỉ có duy nhất một thẻ.
chỉ cần thẻ bắt đầu, không c ...