Bài giảng Thư viện số: Chương 5 - TS. Đỗ Quang Vinh
Số trang: 132
Loại file: ppt
Dung lượng: 1.68 MB
Lượt xem: 21
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Chương 5: Các chuẩn sử dụng trong DL thuộc Bài giảng Thư viện số do TS. Đỗ Quang Vinh biên soạn có nội dung trình bày về chuẩn trình bày, chuẩn biên mục tự động, chuẩn mô tả siêu dữ liệu, giao thức tìm kiếm liên thư viện Z39.50. Bài giảng được biên soạn rõ ràng giúp người học dễ dàng nắm bắt nội dung.
Nội dung trích xuất từ tài liệu:
Bài giảng Thư viện số: Chương 5 - TS. Đỗ Quang Vinh BÀI GIẢNG THƯ VIỆN SỐCHƯƠNG 5: CÁC CHUẨN SỬ DỤNG TRONG DL TS. ĐỖ QUANG VINH HÀ NỘI - 2013 1 NỘI DUNGI. TỔNG QUAN VỀ THƯ VIỆN SỐ DLII. MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DLIII. CHỈ MỤC TÀI LIỆUIV. TÌM KIẾM THÔNG TINV. CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐVI. THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE 2V. CÁC CHUẨN SỬ DỤNG TRONG DL5.1. Chuẩn trình bày ASCII, Unicode, SGML, HTML, XML, GIF, JPG, TIF, PNPa. ASCII− American Standard Code for Information Exchange− Tiêu chuẩn Việt Nam: TCVN 5712-1993− Văn bản chỉ có ký tự, không có lệnh trình bày (plain text file). Văn bản bằng ký tự ASCII không có khả năng trình bày các công thức toán học và hoá học.− Thường phải được nhập thủ công vào CSDL 3− Ưu điểm: + Tìm kiếm được theo toàn văn + Tìm kiếm nhanh + Dữ liệu có kích thước tệp nhỏ, dễ truyền trên mạng− Nhược điểm: + Hình thức đơn giản + Không bảo toàn được nguyên dạng của trang. + Không hỗ trợ đa ngôn ngữ (255 ký tự) 4b. UNICODE− Dùng cho văn bản− Tiêu chuẩn Việt Nam: TCVN 6909-2001− Hỗ trợ đa ngôn ngữ: 16 triệu mã ký tự− Vẫn còn ít chương trình hỗ trợ UNICODE 5c. NGÔN NGỮ ĐÁNH DẤU Tài liệu số – Ngày càng nhiều – Chuẩn đa dạng: Chuẩn độc quyền: DOC của MS; PDF của Adobe Chuẩn mở: SGML Chuẩn độc quyền – Phụ thuộc phần mềm – Phụ thuộc sự phát triển của công ty – Đòi hỏi bản quyền Sự phát triển tài liệu số dẫn đến nhu cầu về chuẩn mở 6 Sự phát triển của tài liệu số đã đặt ra yêu cầu mới: chuẩn dữ liệu không độc quyền Có tính mở Không phụ thuộc phần mềm, nền tảng máy tính (Platform independent) Ngôn ngữ đánh dấu (Markup Language) Sử dụng các cặp thẻ đánh dấu: bao gồm thẻ mở và thẻ đóng: – và Hiện nay: SGML, HTML và XML 7 Ngôn ngữ đánh dấu tổng quát chuẩn SGML Standard Generalized Markup Language SGML là cách thức trình bày tài liệu số bằng các mã đánh dấu Là tiêu chuẩn ISO 8879 (Information processing--Text and office systems - Standard Generalized Markup Language) Là một chuẩn không độc quyền để soạn thảo tài liệu số có cấu trúc Sử dụng các nhãn (thẻ) để đánh dấu và gán ý nghĩa cho dữ liệu. Thí dụ: Đây là nhan đề tài liệu Có thể tự phát triển khổ mẫu riêng, chỉ cần tuân thủ nguyên tắc. 8 Cấu trúc tài liệu SGML Gồm 3 phần – Phần 1: Phần thông báo (Statement) – Phần 2: Định nghĩa phần tử tài liệu – DTD - Document Type Definition Thông báo mô hình logic của tài liệu (có các kiểu yếu tố nào, thẻ mô tả là gì,...) – Phần 3: Nội dung tài liệu Định nghĩa phần tử dữ liệu (DTD) DTD Document Type Definition DTD xác định các khối thông tin hợp lệ của một tài liệu SGML DTD xác định cấu trúc của tài liệu thông qua một danh mục các yếu tố và thuộc tính 9 Ví dụ DTD Những yếu tố này đều dạng dữ liệu Character (ký tự) ]> Tove Jani Nội dung của văn bản Reminder Dont forget me this weekend 10 #PCDATA− CDATA: cho biết đây là dữ liệu dạng ký tự (character data), sử dụng trong ngôn ngữ đánh dấu SGML and XML.− Dùng để phân biệt với dữ liệu không phải ký tự dùng cho các chức năng cấu trúc đặc thù 11 Ngôn ngữ SGML mạnh cho xây dựng tài liệu có cấu trúc Phức tạp, phát triển ứng dụng tốn kém Phải có trình duyệt riêng để đọc Điều quan trọng để ứng dụng SGML là xây dựng DTD Ví dụ về ứng dụng: TEI – Text Encoding Initiative 12 HTML HyperText Mark-up Language− Là một ứng dụng của SGML dùng cho tài liệu WEB− Đơn giản hoá SGML− Thẻ HTML là một kiểu DTD nhưng được chấp nhận bởi cộng đồng sử dụng Web− Các thẻ HTML được thống nhất toàn cầu (W3C – WWW Consortium) 13 Ưu nhược điểm của HTML Ưu điểm – Đơn giản – Có định hướng đến trình bày – Được đọc bằng những trình duyệt (Browser) – Được các công ty hỗ trợ phát triển trình duyệt: Internet Explorer, Netscape Navigator, Mosaic,... Nhược đi ...
Nội dung trích xuất từ tài liệu:
Bài giảng Thư viện số: Chương 5 - TS. Đỗ Quang Vinh BÀI GIẢNG THƯ VIỆN SỐCHƯƠNG 5: CÁC CHUẨN SỬ DỤNG TRONG DL TS. ĐỖ QUANG VINH HÀ NỘI - 2013 1 NỘI DUNGI. TỔNG QUAN VỀ THƯ VIỆN SỐ DLII. MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DLIII. CHỈ MỤC TÀI LIỆUIV. TÌM KIẾM THÔNG TINV. CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐVI. THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE 2V. CÁC CHUẨN SỬ DỤNG TRONG DL5.1. Chuẩn trình bày ASCII, Unicode, SGML, HTML, XML, GIF, JPG, TIF, PNPa. ASCII− American Standard Code for Information Exchange− Tiêu chuẩn Việt Nam: TCVN 5712-1993− Văn bản chỉ có ký tự, không có lệnh trình bày (plain text file). Văn bản bằng ký tự ASCII không có khả năng trình bày các công thức toán học và hoá học.− Thường phải được nhập thủ công vào CSDL 3− Ưu điểm: + Tìm kiếm được theo toàn văn + Tìm kiếm nhanh + Dữ liệu có kích thước tệp nhỏ, dễ truyền trên mạng− Nhược điểm: + Hình thức đơn giản + Không bảo toàn được nguyên dạng của trang. + Không hỗ trợ đa ngôn ngữ (255 ký tự) 4b. UNICODE− Dùng cho văn bản− Tiêu chuẩn Việt Nam: TCVN 6909-2001− Hỗ trợ đa ngôn ngữ: 16 triệu mã ký tự− Vẫn còn ít chương trình hỗ trợ UNICODE 5c. NGÔN NGỮ ĐÁNH DẤU Tài liệu số – Ngày càng nhiều – Chuẩn đa dạng: Chuẩn độc quyền: DOC của MS; PDF của Adobe Chuẩn mở: SGML Chuẩn độc quyền – Phụ thuộc phần mềm – Phụ thuộc sự phát triển của công ty – Đòi hỏi bản quyền Sự phát triển tài liệu số dẫn đến nhu cầu về chuẩn mở 6 Sự phát triển của tài liệu số đã đặt ra yêu cầu mới: chuẩn dữ liệu không độc quyền Có tính mở Không phụ thuộc phần mềm, nền tảng máy tính (Platform independent) Ngôn ngữ đánh dấu (Markup Language) Sử dụng các cặp thẻ đánh dấu: bao gồm thẻ mở và thẻ đóng: – và Hiện nay: SGML, HTML và XML 7 Ngôn ngữ đánh dấu tổng quát chuẩn SGML Standard Generalized Markup Language SGML là cách thức trình bày tài liệu số bằng các mã đánh dấu Là tiêu chuẩn ISO 8879 (Information processing--Text and office systems - Standard Generalized Markup Language) Là một chuẩn không độc quyền để soạn thảo tài liệu số có cấu trúc Sử dụng các nhãn (thẻ) để đánh dấu và gán ý nghĩa cho dữ liệu. Thí dụ: Đây là nhan đề tài liệu Có thể tự phát triển khổ mẫu riêng, chỉ cần tuân thủ nguyên tắc. 8 Cấu trúc tài liệu SGML Gồm 3 phần – Phần 1: Phần thông báo (Statement) – Phần 2: Định nghĩa phần tử tài liệu – DTD - Document Type Definition Thông báo mô hình logic của tài liệu (có các kiểu yếu tố nào, thẻ mô tả là gì,...) – Phần 3: Nội dung tài liệu Định nghĩa phần tử dữ liệu (DTD) DTD Document Type Definition DTD xác định các khối thông tin hợp lệ của một tài liệu SGML DTD xác định cấu trúc của tài liệu thông qua một danh mục các yếu tố và thuộc tính 9 Ví dụ DTD Những yếu tố này đều dạng dữ liệu Character (ký tự) ]> Tove Jani Nội dung của văn bản Reminder Dont forget me this weekend 10 #PCDATA− CDATA: cho biết đây là dữ liệu dạng ký tự (character data), sử dụng trong ngôn ngữ đánh dấu SGML and XML.− Dùng để phân biệt với dữ liệu không phải ký tự dùng cho các chức năng cấu trúc đặc thù 11 Ngôn ngữ SGML mạnh cho xây dựng tài liệu có cấu trúc Phức tạp, phát triển ứng dụng tốn kém Phải có trình duyệt riêng để đọc Điều quan trọng để ứng dụng SGML là xây dựng DTD Ví dụ về ứng dụng: TEI – Text Encoding Initiative 12 HTML HyperText Mark-up Language− Là một ứng dụng của SGML dùng cho tài liệu WEB− Đơn giản hoá SGML− Thẻ HTML là một kiểu DTD nhưng được chấp nhận bởi cộng đồng sử dụng Web− Các thẻ HTML được thống nhất toàn cầu (W3C – WWW Consortium) 13 Ưu nhược điểm của HTML Ưu điểm – Đơn giản – Có định hướng đến trình bày – Được đọc bằng những trình duyệt (Browser) – Được các công ty hỗ trợ phát triển trình duyệt: Internet Explorer, Netscape Navigator, Mosaic,... Nhược đi ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Thư viện số Tài liệu Thư viện Chuẩn trình bày Chuẩn biên mục tự động Chuẩn mô tả siêu dữ liệu Giao thức tìm kiếm liên thư viện Z39.50 Biên mục tài liệuGợi ý tài liệu liên quan:
-
9 trang 101 0 0
-
100 trang 43 0 0
-
Bài giảng Thư viện số: Các chuẩn sử dụng trong Digital Libraries - TS. Đỗ Quang Vinh
133 trang 27 0 0 -
Bàn về khái niệm tài liệu quý hiếm
9 trang 27 0 0 -
Giáo trình lý luận và thực tiễn công tác lưu trữ ở Liên Xô: Phần 1
206 trang 26 0 0 -
Bài giảng Thư viện số: Mô hình hình thức cho thư viện số Digital Libraries - TS. Đỗ Quang Vinh
11 trang 25 0 0 -
Bài giảng Hệ thống thông tin - TS. Đỗ Quang Vinh
88 trang 24 0 0 -
Bài giảng Thư viện số: Chương 1 - TS. Đỗ Quang Vinh
58 trang 24 0 0 -
Một số công cụ hỗ trợ tự động hóa phân loại và biên mục tài liệu
7 trang 23 0 0 -
Bài giảng Hệ thống thông tin quản lý - TS. Đỗ Quang Vinh
81 trang 23 0 0