Danh mục

Luận án: Nghiên cứu các phương pháp chỉ số hóa và tìm kiếm thông tin văn bản ứng dụng trong thư viện - Đỗ Quang Vinh

Số trang: 28      Loại file: pdf      Dung lượng: 536.26 KB      Lượt xem: 19      Lượt tải: 0    
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án: Nghiên cứu các phương pháp chỉ số hóa và tìm kiếm thông tin văn bản ứng dụng trong thư viện được nghiên cứu với nhiệm vụ nghiên cứu các phương pháp chỉ số hoá và tìm kiếm thông tin văn bản ứng dụng trong thư viện số. Với cấu trúc gồm 4 chương và phần kết luận, luận án sẽ giúp người tham khảo dễ dàng nắm bắt nội dung.
Nội dung trích xuất từ tài liệu:
Luận án: Nghiên cứu các phương pháp chỉ số hóa và tìm kiếm thông tin văn bản ứng dụng trong thư viện - Đỗ Quang Vinh 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI --------------------------------------- ĐỖ QUANG VINHNGHIÊN CỨU CÁC PHƯƠNG PHÁP CHỈ SỐ HOÁ VÀ TÌM KIẾM THÔNG TIN VĂN BẢN ỨNG DỤNG TRONG THƯ VIỆN SỐChuyên ngành: Đảm bảo toán học cho máy tính và hệ thống tính toánMã số: 1.01.10 TÓM TẮT LUẬN ÁN TIẾN SỸ TOÁN HỌC HÀ NỘI - 2006 2Công trình được hoàn thành tại: Trường Đại học Bách khoa Hà NộiNgười hướng dẫn khoa học: 1.TS. QUÁCH TUẤN NGỌC 2. PGS. PHƯƠNG XUÂN NHÀNPhản biện 1: PGS.TS. HỒ THUẦN Viện Công nghệ Thông tinPhản biện 2: PGS.TS. ĐỖ TRUNG TUẤN Đại học Quốc gia Hà NộiPhản biện 3: TSKH. NGUYỄN MINH HẢI Học viện Công nghệ Bưu chính Viễn thôngLuận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp nhànước họp tại: Trường Đại học Bách khoa Hà Nộivào hồi giờ ngày tháng năm 2006.Có thể tìm hiểu luận án tại thư viện: 1. Thư viện Quốc gia Việt Nam. 2. Thư viện Trường Đại học Bách khoa Hà Nội. 3 MỞ ĐẦU 1. NHIỆM VỤ VÀ PHƯƠNG PHÁP NGHIÊN CỨU ♦ Tính cấp thiết, ý nghĩa lý thuyết và thực tiễn của đề tài Ngày nay, World Wide Web đã xâm nhập vào cuộc sốnghàng ngày, đồng thời, qua một số năm giao diện cho Web tiếntriển từ duyệt đến tìm kiếm. Hàng triệu người trên thế giới thựchiện tìm kiếm Web hàng ngày, nhưng công nghệ tìm kiếm cơ sởdữ liệu tài liệu lớn ít thay đổi từ những năm 1980. Sự nhận thứcchung về Net tạo ra một cuộc cách mạng mới về công nghệ tìmkiếm thông tin trong thư viện số (DL), diễn ra theo cuộc cáchmạng phần cứng ở máy tính cá nhân. Hiện nay, DL là một trong những hướng nghiên cứu chínhvề công nghệ thông tin trên thế giới. ♦ Nhiệm vụ của luận án: Nghiên cứu các phương pháp chỉsố hoá và tìm kiếm thông tin văn bản ứng dụng trong thư việnsố. ♦ Các phương pháp nghiên cứu: Hệ cơ sở dữ liệuMultimedia; các phương pháp chỉ mục; các phương pháp mãhoá; các phương pháp nén dữ liệu; các phương pháp tìm kiếmthông tin; các phương pháp xác suất và thống kê toán học. 2. CẤU TRÚC LUẬN ÁN Phần mở đầu: trình bày nhiệm vụ, đối tượng, phươngpháp nghiên cứu và tóm tắt các đóng góp chính của luận án. Chương 1 trình bày tổng quan về thư viện số, đề xuất mộtmô hình hình thức cho thư viện số dựa vào đại số hiện đại. Chương 2 trình bày hai phương pháp chính chỉ mục tàiliệu văn bản trong thư viện số, phân tích chi tiết phương phápchỉ mục tệp đảo IFID, các mô hình nén toàn cục và mô hình nén 4cục bộ hyperbol IFID, đề xuất mô hình nén cục bộ Bernoulli vànén nội suy IFID. Chương 3 trình bày mô hình tìm kiếm thông tin kinh điển:mô hình truy vấn Boole BQ, đề xuất một mô hình truy vấn xếphạng tài liệu RQ trong thư viện số, đánh giá hiệu suất tìm kiếmdựa vào hai tham số: độ chính xác P và độ phục hồi R. Chương 4 trình bày các giải thuật kinh điển: đảo dựa vàobộ nhớ, đảo dựa vào sắp xếp, đề xuất các giải thuật trộn nhiềuđường tại chỗ dựa vào sắp xếp và giải thuật phân chia dựa vàovăn bản, so sánh các giải thuật đảo, trình bày bài toán chỉ mụcCSDL động. Phần kết luận: trình bày các kết luận của luận án và cáchướng nghiên cứu tiếp theo. CHƯƠNG 1 - TỔNG QUAN VỀ THƯ VIỆN SỐ1.1 MỞ ĐẦU Định nghĩa 1.1 (Arms W.Y.) [31]: Thư viện số là một khothông tin có tổ chức với các dịch vụ liên kết, trong đó thông tinđược lưu trữ ở dạng số và có thể truy cập qua một mạng. Định nghĩa 1.2 (Chen H., Houston A.L.) [43]: Thư viện số làmột thực thể liên quan tới sự tạo ra các nguồn tin và sự hoạtđộng thông tin qua các mạng toàn cầu. DL là một kho thông tinsố có tổ chức. Định nghĩa 1.3 (Reddy R., Wladawsky-Berger I.) [121]: Thưviện số là các kho dữ liệu mạng về tài liệu văn bản số, ảnh, âmthanh, dữ liệu khoa học và phần mềm là lõi của Internet hiệnnay và các kho dữ liệu số có thể truy cập phổ biến về tất cả trithức của loài người trong tương lai. 5 Định nghĩa 1.4 (Sun Microsystems) [135]: Thư viện số là sựmở rộng điện tử về các chức năng điển hình NSD thực hiện vàcác tài nguyên NSD truy cập trong thư viện truyền thống. Cáctài nguyên thông tin được chuyển thành dạng số, lưu trữ trongcác kho multimedia và làm cho sẵn có thông qua các dịch vụWeb. Định nghĩa 1.5 (Witten I.H., Bainbridge D.) [154]: Thư việnsố là các kho đối tượng số, bao gồm văn bản, video và audiocùng với các phương pháp truy cập và tìm kiếm, lựa chọn, tổchức và bảo trì. Tóm lại, thư viện số là một kho thông tin số khổng lồ có tổchức với các dịch vụ liên k ...

Tài liệu được xem nhiều:

Tài liệu liên quan: