Bài viết trình bày một số yêu cầu về phần mềm quản lý cơ sở dữ liệu số bao gồm yêu cầu các bước xây dựng cơ sở dữ liệu số, tổ chức thông tin và khai thác, tra cứu; quản trị hệ thống và bảo mật thông tin. Bên cạnh đó, bài viết còn đề cập một số vấn đề xây dựng cơ sở dữ liệu điện tử, dữ liệu số trong quân đội hiện nay; yêu cầu về các phân hệ trong phần mềm thư viện điện tử hay xây dựng cơ sở dữ liệu thư mục và toàn văn.
Nội dung trích xuất từ tài liệu:
Tổ chức và quản lý, hệ thống cơ sở dữ liệu số, bộ sưu tập tài liệu số
TỔ CHỨC VÀ QUẢN LÝ, HỆ THỐNG CƠ SỞ DỮ LIỆU SỐ,
BỘ SƯU TẬP TÀI LIỆU SỐ
1. MỘT SỐ YÊU CẦU VỀ PHẦN MỀM QUẢN LÝ CƠ SỞ DỮ LIỆU SỐ
Trong thời đại bùng nổ thông tin hiện nay, tài liệu số đang là một trong
những xu thế của hoạt động thông tin thư viện hiện đại. Để quản lý và khai
thác, sử dụng các nguồn tài liệu số, các cơ quan thông tin, thư viện nói
chung và thông tin, thư viện trong quân đội nói riêng cần chú trọng đầu tư
nghiên cứu phát triển phần mềm quản lý cơ sở dữ liệu (CSDL) số.
I
O
D
N
1.1 Yêu cầu về phần mềm quản lý CSDL số
Yêu cầu chung
- Có khả năng lưu trữ các dạng dữ liệu số hoá, bao gồm hình ảnh, âm
thanh, text, video;
A
U
- Có khả năng hỗ trợ việc tìm kiếm toàn văn đối với tất cả các loại tài liệu
điện tử, như Microsoft Word, Excel, WordPerfect, Acrobat PDF, HTML,
XML...;
Q
N
- Có khả năng tự xác định các thuộc tính của các file dữ liệu số hoá được
đưa vào để cho phép tra cứu theo các thuộc tính đó, thí dụ kích cỡ file, loại
nén (với hình ảnh, âm thanh và video), MIME type, cỡ và độ sâu (đối với hình
ảnh), độ dài (đối với âm thanh và hình ảnh video)...;
E
I
V
U
H
T
- Phần mềm phải cung cấp khả năng mô tả siêu dữ liệu cho các tư liệu
số theo DCMI (Dublin Core Meta Data Initiative), cung cấp khả năng tra
cứu và trao đổi siêu dữ liệu (metadata) bằng định dạng XML theo chuẩn
Resource Description Format (RDF) của W3C.
- Phần mềm phải cung cấp các tính năng quản lý truy cập để đảm bảo tính
bảo mật và phân quyền sử dụng các tư liệu số.
- Phần mềm có khả năng hỗ trợ thực hiện các chức năng cơ bản sau:
Thu thập và bổ sung các tư liệu;
Số hoá và xử lý các dữ liệu thu thập được;
Biên mục, nhập vào CSDL, tạo các điểm truy cập để tìm kiếm;
Tổ chức thông tin và khai thác, tra cứu các tài liệu liệu số;
Quản trị hệ thống và bảo mật thông tin.
155
Yêu cầu về kĩ thuật
Phần mềm quản lý CSDL số phải đáp ứng yêu cầu cập nhật và nâng cấp
thuận tiện, có khả năng mở rộng và là hệ thống đa người dùng, an toàn;
Hệ thống thư viện số cung cấp cho người sử dụng không chỉ khả năng truy
cập đến các dữ liệu truyền thống như text, mà còn có khả năng hỗ trợ người
sử dụng truy cập đến các nguồn dữ liệu số hoá trong hệ thống như văn bản, sơ
đồ, hình ảnh, âm thanh...;
Hệ thống được xây dựng dựa trên các tiêu chuẩn mở, do đó dễ dàng nâng
cấp, mở rộng cũng như tích hợp với các hệ thống khác.
A
U
Q
N
E
I
V
U
I
O
D
N
H
T
Sơ đồ cấu trúc hệ thống
OPAC: không chỉ cung cấp các chức năng truyền thống như khả năng tra
cứu, truy cập dữ liệu, mà còn trở thành cổng thông tin chung cho hầu hết
mọi truy cập đến hệ thống thư viện điện tử;
156
Authority Control: cung cấp các chức năng kiểm soát truy cập, ghi nhận
truy cập. Ngoài ra, Module này còn thực hiện các chức năng AAA:
authorization (cấp quyền), authentication (xác thực) và accouting (tính tiền);
Library Server: cung cấp các thông tin liên quan đến bạn đọc, tư liệu;
Object Server: lưu trữ và cung cấp nội dung các tài liệu số. Các máy chủ
có thể mở rộng theo nhu cầu (nâng cấp, thêm các máy chủ...).
Thông qua OPAC, bạn đọc tiến hành các thao tác tra cứu tư liệu. Sau khi
yêu cầu tra cứu được gửi đến Library Server, Library server trả lại kết quả,
chỉ rõ nội dung tư liệu tại địa chỉ (URL)/ đường dẫn. Bạn đọc gửi địa chỉ/
đường dẫn đến nội dung tư liệu, OPAC chuyển cho AAA Control để kiểm
tra quyền truy cập. Trong trường hợp được quyền truy cập, Object Server sẽ
trả lại nội dung và chuyển kết quả về cho bạn đọc thông qua OPAC, bao
gồm cả việc thông báo lỗi truy cập.
I
O
D
N
1.2 Các bước xây dựng CSDL số
A
U
- Thu thập, bổ sung các tư liệu cần số hoá
Đây là công đoạn chủ yếu do các cán bộ thư viện thực hiện. Các cán bộ
thư viện sẽ phải xác định ra các loại tài liệu hoặc những phần tài liệu cần
phải số hoá, sau đó tiến hành phân loại tài liệu tuỳ theo thuộc tính của
chúng để xử lý. Có rất nhiều loại tài liệu khác nhau nhưng các tài liệu có
thể được phân theo các nhóm: text, hình ảnh (images), audio, video và các
dạng tài liệu khác (chương trình máy tính...).
Q
N
E
I
V
U
- Số hoá và xử lý các tài liệu (xem bảng dưới đây)
H
T
Bản gốc
Hình ảnh số
Dạng vật Vật thể, vật
chất
chất (sách,
video...)
Định
Đa
dạng
dạng
(văn
bản
(format)
tiếng Anh,
VHS, ...)
File máy tính
Thông tin số
File máy tính
File đồ hoạ File có cấu trúc
(.BMP,
(.DOC, .MPG)
.MPG,...)
biểu ghi chỉ số
và cơ sở dữ
liệu.
Khả năng Người hoặc Các chương Các
chương
đọc
là các thiết trình đồ hoạ trình máy tính
bị
chuyên máy tính
như văn bản,
dụng
video hay cơ sở
dữ liệu.
157
Khả năng Nhân
bản Copy file và
nhân bản vật
chất in các bản sao
(photocopy) theo số lượng
mong muốn
Xử lý
Thay
đổi
bằng
tay
(viết vào lề
sách, cắt và
nối băng)
Đánh
dấu
bằng
máy
tính và xử lý
đồ hoạ (thêm
vào các ghi
chú
của
người dùng,
phóng to/thu
nhỏ, thay đổi
màu sắc, thay
bằng các hình
ảnh khác).
I
O
D
N
A
U
Q
N
E
I
V
U
Tạo các thông
tin của bản gốc
theo các định
dạng khác nhau
(in lại sách theo
chữ in nghiêng,
chơi video với
các track âm
thanh
khác
nhau).
Sửa đổi lại các
thông tin gốc,
tạo ra các tài
liệu mới từ tài
liệu gốc, copy
và phân phối.
Số hoá và xử lý tài liệu là công đoạn quan trọng nhất để tạo nên một thư
viện điện tử. Có rất nhiều dạng tài liệu gốc (sách, video, audio, hình ảnh...).
Sách có thể bao gồm cả chữ và hình ảnh, video bao gồm cả audio và hình ảnh...
Với mỗi dạng tài liệu thì có các cách xử lý khác nhau, nhưng tựu chung lại
chúng đều phải qua các giai đoạn số hoá (tạo ra các hình ảnh số) và sau đó tiến
hành xử lý để tạo ra các thông tin số - đối tượng của thư viện điện tử.
H
T
- Biên mục, nhập vào CSDL, tạo các điểm truy cập để tìm kiếm
Nguyên tắc chung của việc biên mục dữ liệu số là xây dựng các bộ nhãn
trường cá biệt cho mỗi loại tài liệu cần số hoá. Các nhãn trường này phải
tuân thủ theo các thành phần do tổ chức Sáng kiến siêu dữ liệu Dublin Core
(DCMI) qui định. DCMI qui định 15 thành tố cần mô tả cho các nguồn tư
liệu (không nhất thiết là các tư liệu điện tử). So với ...