Danh mục

XML, Metadata và Dublin Core Metadata 1. XML 1.1

Số trang: 19      Loại file: pdf      Dung lượng: 213.77 KB      Lượt xem: 19      Lượt tải: 0    
10.10.2023

Hỗ trợ phí lưu trữ khi tải xuống: 12,000 VND Tải xuống file đầy đủ (19 trang) 0

Báo xấu

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Khái quát sự ra đời và phát triển của XML (Tham khảo: http://www.w3.org/TR/REC-xml/ XML (eXtensible Markup Language): là ngôn ngữ tạo cấu trúc dữ liệu văn bản được phát triển từ đầu năm 1996 dựa theo và tận dụng những điểm mạnh của chuẩn SGML (Standard Generalized Markup Language: được coi như là siêu ngôn ngữ có khả năng sinh ngôn ngữ khác), cùng những kinh nghiệm có được từ ngôn ngữ HTML (HyperText Markup Language). SGML phát triển cho việc định cấu trúc và nội dung tài liệu điện tử do tổ chức ISO (International Organization for Standardization) chuẩn...
Nội dung trích xuất từ tài liệu:
XML, Metadata và Dublin Core Metadata 1. XML 1.1 XML, Metadata và Dublin Core Metadata1. XML1.1 Khái quát sự ra đời và phát triển của XML(Tham khảo: http://www.w3.org/TR/REC-xml/ XML (eXtensible Markup Language): là ngôn ngữ tạo cấu trúc dữ liệuvăn bản được phát triển từ đầu năm 1996 dựa theo và tận dụng những điểmmạnh của chuẩn SGML (Standard Generalized Markup Language: được coinhư là siêu ngôn ngữ có khả năng sinh ngôn ngữ khác), cùng những kinhnghiệm có được từ ngôn ngữ HTML (HyperText Markup Language). SGMLphát triển cho việc định cấu trúc và nội dung tài liệu điện tử do tổ chức ISO(International Organization for Standardization) chuẩn hóa năm 1986. SGML là do IBM đưa ra nhưng được phát triển bởi W3C (World WideWeb Consortium: tổ chức độc lập định ra tiêu chuẩn cho định dạng Web,máy chủ và ngôn ngữ), nhưng đặc tả XML lại do Netscape, Microsoft và cácthành viên dự án Text Encoding Intiative (TEI) xây dựng. Tổ chức W3CXML Special Interest Group có đại diện từ hơn 100 công ty cùng nhiềuchuyên gia được mời khác. W3C chính thức thông qua chuẩn XML vào tháng2/1998. XML là một hệ thống có luật dùng cho việc thiết kế các khổ mẫu(format) cho văn bản giúp tạo cấu trúc cho dữ liệu. Trong thực tế XMLkhông phải là một ngôn ngữ lập trình, XML giúp máy tính dễ dàng tạo dữliệu, đọc dữ liệu, trao đổi dữ liệu và làm cho cấu trúc dữ liệu trở nên rõ ràngvà dễ hiểu hơn, ngoài ra XML còn có thể mở rộng, có nền tảng hoàn toàn độclập và hỗ trợ tính quốc tế hóa, nội địa hóa. XML hỗ trợ hoàn toàn unicode.1.2. XML và HTML Trong thực tế bản thân ngôn ngữ XML có nguồn gốc giống như ngônngữ định dạng siêu văn bản HTML (HyperText Markup Language) từ chuẩnngôn ngữ định dạng văn bản tổng quát có cấu trúc SGML. Mỗi văn bản XMLcũng sử các thẻ (tags), các từ được đặt trong ngoặc với ‘’ (mở và đóng) vàdùng thuộc tính tên gọi của các phần tử (element) với mẫu name= “value”. Trong khi HTML đặc biệt chú ý tới từng thẻ (tag) và thuộc tính(attribute) có ý nghĩa gì và phần văn bản giữa các thẻ đó hiển thị như thế nàotrên trình duyệt thì XML sử dụng các thẻ chỉ để phân định ranh giới giữa cácđoạn dữ liệu và coi việc đọc và xử lý dữ liệu hoàn toàn là nhiệm vụ của cácứng dụng. Nhưng khác với ngôn ngữ HTML, số lượng và tên gọi các phần tửtrong XML là không hạn chế. XML là một văn bản nhưng không giống với những loại văn bản thôngthường mà ta có thể đọc được. Các chương trình dùng để tạo các dữ liệu đượccấu trúc hóa thông thường được lưu dữ liệu trên đĩa cứng, sử dụng khuôndạng text hay nhị phân. Một thuận lợi của khuôn dạng văn bản là cho phépngười đọc có thể đọc nó với bất kỳ bộ soạn thảo văn bản nào tùy thích. Cáckhuôn dạng văn bản cũng cho phép tìm lỗi dễ dàng hơn trong các ứng dụng.Giống như HTML các file XML là những file văn bản được tạo ra khôngphải với mục đích đề đọc, nhưng vẫn có thể đọc nếu thấy cần thiết. Tuy nhiênXML có điểm không bằng HTML, các luật dùng trong XML rất hạn chế, chỉcần quên một thẻ, hay một thuộc tính không đi kèm với nội dung sẽ làm chotoàn bộ file XML đó ngừng hoạt động, trong khi đó lỗi này ở file HTML cóthể được bỏ qua. XML được xem như là ngôn ngữ mạnh hơn HTML do nó mang lạithông tin đầy đủ về dữ liệu. XML cung cấp “siêu dữ liệu” metadata hay cònđược gọi là “dữ liệu về dữ liệu” (data about data). XML cho phép các nhàphát triển và quản trị công nghệ thông tin mô tả thông tin có liên quan tới cácnguồn thông tin khác. Đây là phương pháp khai thác thông tin lý tưởng trongmôi trường trao đổi thông tin từ các máy chủ ứng dụng cũng như từ các ứngdụng với nhau. Cấu trúc chặt chẽ của XML (nội dung được đặt giữa các thẻmetadata) cho phép các ứng dụng dễ dàng tìm kiếm và sử dụng nội dung đãtạo. Môi trường tài liệu XML trở thành một kho dữ liệu hỏi-đáp (query datarepository) tương tự như cơ sở dữ liệu. Ngôn ngữ XML là giải pháp tích hợpcho vấn đề trao đổi dữ liệu tự động giữa các kho thông tin trên mạng Internet. Một biểu ghi XML đơn giản có dạng như sau: encoding=utf-8 standalone=yes?> Kinh tế học vi mô Ngô Đình Giao Kinh tế vĩ mô Thống kê 2006 Chuẩn trao đổi các dữ liệu trên Internet hiện nay đã được tổ chức tiêuchuẩn quốc gia của Mỹ thông qua nhằm thay thế cho các chuẩn cũ không cònphù đó là chuẩn ANSI/NISO Z39.85-2001(tham khảo: http://www.niso.org/standards/resources/Z39-85.pdf). Nội dungchủ yếu của chuẩn mô tả dữ liệu này gồm 15 trường dữ liệu còn được gọi làchuẩn Dublin Core Metadata. Đây là các trường dữ liệu phổ biến và hữu íchnhất kèm theo một tài liệu số hóa để trao đổi trên mạng Internet. Hiện nay các thư viện và trung tâm thông tin lớn trên thế giới đang cóxu hướng sử dụng chuẩn XML thay thế cho chuẩn Marc 21 đã không còn phùhợp cho công tác biên mục và trao đổi dữ liệu như (Thư viện Y học Quốc gia ...

Tài liệu được xem nhiều:

Tài liệu liên quan: