Báo cáo đề tài "Xây dựng một số công cụ hỗ trợ tra cứu và tổng hợp thông tin trong thư viện số" có kết cấu 7 chương: Chương 1 - tổng quan; chương 2 - tổ chức khai thác thông tin thư viện; chương 3 - tiêu đề đề mục và từ khóa; chương 4 - xây dựng công cụ tìm kiếm; chương 4 - xây dựng công cụ tìm kiếm và download dựa trên tác nhân;... Mời các bạn cùng tham khảo tài liệu để nắm bắt nội dung chi tiết hơn.
Nội dung trích xuất từ tài liệu:
Báo cáo đề tài: Xây dựng một số công cụ hỗ trợ tra cứu và tổng hợp thông tin trong thư viện sốĐề tài: Xây dựng một số công cụ hổ trợ tra cứu và tổng hợp thông tin trong thư viện số CHƯƠNG 1 TỔNG QUAN1.1. Thư viện số Thư viện số là thư viện phục vụ thông tin điện tử ( được số hóa) - được đọcvới sự trợ giúp của máy vi tính. Thông tin điện tử có thể được chứa trong những Tưliệu điện tử nằm trong và ngoài thư viện. Tư liệu điện tử bao gồm: • CD-ROM và băng từ - CD-ROM thường chứa những CSDL chuyên ngành, được phục vụ riêng lẻ hay trên mạng máy tính. • Tạp chí điện tử - ấn hành trên mạng Internet. Thư viện có thể đặt mua như tạp chí in và sẽ được cấp quyền login vào để truy cập. • Cơ sở dữ liệu trực tuyến - có rất nhiều trên mạng Internet do những trường đại học, những cơ sở thông tin, và những công ty tư nhân như LEXIX- NEXIX, DIALOG, vv... - Cũng như tạp chí điện tử, thư viện có thể đặt mua quyền sử dụng. • Tài liệu khác trên Internet - tài liệu trong những web site của những cơ sở chính quyền, trường đại học, công ty, hội đoàn, vv... Việc truy cập thường là miễn phí. Thông tin điện tử đôi khi còn bao gồm tư liệu được số hóa, tập hợp dưới hìnhthức Thư viện số. Tư liệu được số hóa trước tiên là tranh ảnh, tài liệu quý hiếm,vv... Ngày nay nhiều thư viện có khuynh hướng số hóa đại bộ phận tư liệu trong thưviện để phục vụ dưới dạng điện tử.1.2. Nghiên cứu về thư viện số tại Mỹ Vấn đề nghiên cứu về thư viện số là một trong 5 hướng nghiên cứu chủ yếu vềCNTT của Mỹ hiện nay. Những tiến bộ cực kỳ nhanh chóng của kỹ thuật tính toánvà mạng máy tính làm cho một tư liệu chỉ trong nháy mắt đã có thể “nhân bản” vàchuyển tới hành trăm triệu người trên khắp thế giới. Năm 1994, người ta đưa ra một vấn đề gọi là SÁNG KIẾN THƯ VIỆN SỐ(SKTVS) mà ngày nay gọi là DLI pha 1. SKTVS pha 1 tập trung làm sáng tỏ từng 1-1bước các vấn đề về mô hình quan niệm, cấu trúc, những thách thức về tính toánnhằm tạo ra các các kho tri thức nhân loại dạng điện tử. Trong 5 năm, SKTVS pha 1đã có những thành công bước đầu mà chúng ta đang chứng kiến, chẳng hạn đó làcác công cụ tìm kiếm nổi tiếng trên Internet. SKTVS pha 2 – DLI pha 2 bắt đầu từ 1999 và đã thu hút rất nhiều nhà khoahọc và kỹ sư CNTT, các nhà nghiên cứu của nhiều ngành KHXH, nghệ thuật, sinhhọc…Mục tiêu là phát triển các nguồn tư liệu số, thử nghiệm liên kết giữa cácnguồn tư liệu phân tán, thiết lập nguyên tắc, phần mềm và cấu trúc mạng có khảnăng liên hợp các tư liệu đa phương tiện thành các bản ghi nhất thể, giải quyết vấnđề ngữ nghĩa hiện đang cản trở việc tích hợp tư liệu số từ các tư liệu từ các sưu tậpphân tán và rất khác nhau về cấu trúc. Pha 2 của SKTVS tập trung vào 3 hướngnghiên cứu lớn sau: • Human-centered research-nghiên cứu hỗ trợ việc tạo ra thông tin và sử dụng thông tin. • Content and collections-tạo lập thư viện số chứa đựng các dạng tri thức. • System-centered research-các vấn đề kỹ thuật, phần mềm, phân loại khi tổ chức và liên kết các bộ dữ liệu số dạng thức khác nhau thông qua Internet. Để hình dung rõ hơn về 3 hướng nghiên cứu trên, chúng ta sẽ lược qua các dựán chính, các vấn đề quan trọng nhất của 3 hướng nghiên cứu và triển khai này.1.2.1.Human-centered research (nghiên cứu hướng nguời dùng) Trong hướng này, có các dự án và chương trình lớn: Personalized Retrieval and Summarization of Image, Video, andLanguage Resources (PERSIVAL). Trong dự án PERSIVAL, các nhà nghiên cứuở Đại học Columbia đang thử nghiệm thiết kế hệ thống giúp cho các bệnh nhân truycập dễ dàng và nhanh chóng đến các nguồn thông tin y học trực tuyến thích hợp chotừng người bệnh. http://www.cs.columbia.edu/diglib/PERSIVAL/ Digital resource designed for children. Các nhà nghiên cứu ở Đại họcMaryland phát triển các công cụ thích hợp cho phép nghe, xem, tìm kiếm, hỏi đáp 1-2và tổ chức thông tin nghe, nhìn, văn bản…cho trẻ em.http://www.cs.umd.edu/hcil/kiddiglib/ Technologies and tools for students. Nhiều đại học và cơ quan nghiên cứunhư Đại Học Quốc Gia Georgia, Hiệp Hội Máy Tính (Association for ComputingMachinery-ACM), Ủỵ Ban Giáo Dục của SIGGRAPH (SIGGRAPH EducationCommittee) đang phát triển các kỹ thuật và công cụ cho sinh viên để việc truy cậpthông tin trực tuyến phục vụ học tập ở đại học được hiệu quả.http://econ.badm.sc.edu/beam/ Video information college. Dự án được triển khai tại Đại Học CarnegieMellon nhằm thiết lập môi trường làm việc với các tư liệu video, văn bản, ảnh vàâm thanh. http://www.informedia.cs.cmu.edu/ Alexandria Digital Earth prototype (ADEPT). Đây là một bộ phận củachương trình hợp tác về thư viện số giữa Đại học Berkeley, Đại học Santa Barbara(UCSB), Đ ...