![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Luận án: Nghiên cứu các phương pháp chỉ số hóa và tìm kiếm thông tin văn bản ứng dụng trong thư viện - Đỗ Quang Vinh
Số trang: 28
Loại file: pdf
Dung lượng: 536.26 KB
Lượt xem: 19
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận án: Nghiên cứu các phương pháp chỉ số hóa và tìm kiếm thông tin văn bản ứng dụng trong thư viện được nghiên cứu với nhiệm vụ nghiên cứu các phương pháp chỉ số hoá và tìm kiếm thông tin văn bản ứng dụng trong thư viện số. Với cấu trúc gồm 4 chương và phần kết luận, luận án sẽ giúp người tham khảo dễ dàng nắm bắt nội dung.
Nội dung trích xuất từ tài liệu:
Luận án: Nghiên cứu các phương pháp chỉ số hóa và tìm kiếm thông tin văn bản ứng dụng trong thư viện - Đỗ Quang Vinh 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI --------------------------------------- ĐỖ QUANG VINHNGHIÊN CỨU CÁC PHƯƠNG PHÁP CHỈ SỐ HOÁ VÀ TÌM KIẾM THÔNG TIN VĂN BẢN ỨNG DỤNG TRONG THƯ VIỆN SỐChuyên ngành: Đảm bảo toán học cho máy tính và hệ thống tính toánMã số: 1.01.10 TÓM TẮT LUẬN ÁN TIẾN SỸ TOÁN HỌC HÀ NỘI - 2006 2Công trình được hoàn thành tại: Trường Đại học Bách khoa Hà NộiNgười hướng dẫn khoa học: 1.TS. QUÁCH TUẤN NGỌC 2. PGS. PHƯƠNG XUÂN NHÀNPhản biện 1: PGS.TS. HỒ THUẦN Viện Công nghệ Thông tinPhản biện 2: PGS.TS. ĐỖ TRUNG TUẤN Đại học Quốc gia Hà NộiPhản biện 3: TSKH. NGUYỄN MINH HẢI Học viện Công nghệ Bưu chính Viễn thôngLuận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp nhànước họp tại: Trường Đại học Bách khoa Hà Nộivào hồi giờ ngày tháng năm 2006.Có thể tìm hiểu luận án tại thư viện: 1. Thư viện Quốc gia Việt Nam. 2. Thư viện Trường Đại học Bách khoa Hà Nội. 3 MỞ ĐẦU 1. NHIỆM VỤ VÀ PHƯƠNG PHÁP NGHIÊN CỨU ♦ Tính cấp thiết, ý nghĩa lý thuyết và thực tiễn của đề tài Ngày nay, World Wide Web đã xâm nhập vào cuộc sốnghàng ngày, đồng thời, qua một số năm giao diện cho Web tiếntriển từ duyệt đến tìm kiếm. Hàng triệu người trên thế giới thựchiện tìm kiếm Web hàng ngày, nhưng công nghệ tìm kiếm cơ sởdữ liệu tài liệu lớn ít thay đổi từ những năm 1980. Sự nhận thứcchung về Net tạo ra một cuộc cách mạng mới về công nghệ tìmkiếm thông tin trong thư viện số (DL), diễn ra theo cuộc cáchmạng phần cứng ở máy tính cá nhân. Hiện nay, DL là một trong những hướng nghiên cứu chínhvề công nghệ thông tin trên thế giới. ♦ Nhiệm vụ của luận án: Nghiên cứu các phương pháp chỉsố hoá và tìm kiếm thông tin văn bản ứng dụng trong thư việnsố. ♦ Các phương pháp nghiên cứu: Hệ cơ sở dữ liệuMultimedia; các phương pháp chỉ mục; các phương pháp mãhoá; các phương pháp nén dữ liệu; các phương pháp tìm kiếmthông tin; các phương pháp xác suất và thống kê toán học. 2. CẤU TRÚC LUẬN ÁN Phần mở đầu: trình bày nhiệm vụ, đối tượng, phươngpháp nghiên cứu và tóm tắt các đóng góp chính của luận án. Chương 1 trình bày tổng quan về thư viện số, đề xuất mộtmô hình hình thức cho thư viện số dựa vào đại số hiện đại. Chương 2 trình bày hai phương pháp chính chỉ mục tàiliệu văn bản trong thư viện số, phân tích chi tiết phương phápchỉ mục tệp đảo IFID, các mô hình nén toàn cục và mô hình nén 4cục bộ hyperbol IFID, đề xuất mô hình nén cục bộ Bernoulli vànén nội suy IFID. Chương 3 trình bày mô hình tìm kiếm thông tin kinh điển:mô hình truy vấn Boole BQ, đề xuất một mô hình truy vấn xếphạng tài liệu RQ trong thư viện số, đánh giá hiệu suất tìm kiếmdựa vào hai tham số: độ chính xác P và độ phục hồi R. Chương 4 trình bày các giải thuật kinh điển: đảo dựa vàobộ nhớ, đảo dựa vào sắp xếp, đề xuất các giải thuật trộn nhiềuđường tại chỗ dựa vào sắp xếp và giải thuật phân chia dựa vàovăn bản, so sánh các giải thuật đảo, trình bày bài toán chỉ mụcCSDL động. Phần kết luận: trình bày các kết luận của luận án và cáchướng nghiên cứu tiếp theo. CHƯƠNG 1 - TỔNG QUAN VỀ THƯ VIỆN SỐ1.1 MỞ ĐẦU Định nghĩa 1.1 (Arms W.Y.) [31]: Thư viện số là một khothông tin có tổ chức với các dịch vụ liên kết, trong đó thông tinđược lưu trữ ở dạng số và có thể truy cập qua một mạng. Định nghĩa 1.2 (Chen H., Houston A.L.) [43]: Thư viện số làmột thực thể liên quan tới sự tạo ra các nguồn tin và sự hoạtđộng thông tin qua các mạng toàn cầu. DL là một kho thông tinsố có tổ chức. Định nghĩa 1.3 (Reddy R., Wladawsky-Berger I.) [121]: Thưviện số là các kho dữ liệu mạng về tài liệu văn bản số, ảnh, âmthanh, dữ liệu khoa học và phần mềm là lõi của Internet hiệnnay và các kho dữ liệu số có thể truy cập phổ biến về tất cả trithức của loài người trong tương lai. 5 Định nghĩa 1.4 (Sun Microsystems) [135]: Thư viện số là sựmở rộng điện tử về các chức năng điển hình NSD thực hiện vàcác tài nguyên NSD truy cập trong thư viện truyền thống. Cáctài nguyên thông tin được chuyển thành dạng số, lưu trữ trongcác kho multimedia và làm cho sẵn có thông qua các dịch vụWeb. Định nghĩa 1.5 (Witten I.H., Bainbridge D.) [154]: Thư việnsố là các kho đối tượng số, bao gồm văn bản, video và audiocùng với các phương pháp truy cập và tìm kiếm, lựa chọn, tổchức và bảo trì. Tóm lại, thư viện số là một kho thông tin số khổng lồ có tổchức với các dịch vụ liên k ...
Nội dung trích xuất từ tài liệu:
Luận án: Nghiên cứu các phương pháp chỉ số hóa và tìm kiếm thông tin văn bản ứng dụng trong thư viện - Đỗ Quang Vinh 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI --------------------------------------- ĐỖ QUANG VINHNGHIÊN CỨU CÁC PHƯƠNG PHÁP CHỈ SỐ HOÁ VÀ TÌM KIẾM THÔNG TIN VĂN BẢN ỨNG DỤNG TRONG THƯ VIỆN SỐChuyên ngành: Đảm bảo toán học cho máy tính và hệ thống tính toánMã số: 1.01.10 TÓM TẮT LUẬN ÁN TIẾN SỸ TOÁN HỌC HÀ NỘI - 2006 2Công trình được hoàn thành tại: Trường Đại học Bách khoa Hà NộiNgười hướng dẫn khoa học: 1.TS. QUÁCH TUẤN NGỌC 2. PGS. PHƯƠNG XUÂN NHÀNPhản biện 1: PGS.TS. HỒ THUẦN Viện Công nghệ Thông tinPhản biện 2: PGS.TS. ĐỖ TRUNG TUẤN Đại học Quốc gia Hà NộiPhản biện 3: TSKH. NGUYỄN MINH HẢI Học viện Công nghệ Bưu chính Viễn thôngLuận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp nhànước họp tại: Trường Đại học Bách khoa Hà Nộivào hồi giờ ngày tháng năm 2006.Có thể tìm hiểu luận án tại thư viện: 1. Thư viện Quốc gia Việt Nam. 2. Thư viện Trường Đại học Bách khoa Hà Nội. 3 MỞ ĐẦU 1. NHIỆM VỤ VÀ PHƯƠNG PHÁP NGHIÊN CỨU ♦ Tính cấp thiết, ý nghĩa lý thuyết và thực tiễn của đề tài Ngày nay, World Wide Web đã xâm nhập vào cuộc sốnghàng ngày, đồng thời, qua một số năm giao diện cho Web tiếntriển từ duyệt đến tìm kiếm. Hàng triệu người trên thế giới thựchiện tìm kiếm Web hàng ngày, nhưng công nghệ tìm kiếm cơ sởdữ liệu tài liệu lớn ít thay đổi từ những năm 1980. Sự nhận thứcchung về Net tạo ra một cuộc cách mạng mới về công nghệ tìmkiếm thông tin trong thư viện số (DL), diễn ra theo cuộc cáchmạng phần cứng ở máy tính cá nhân. Hiện nay, DL là một trong những hướng nghiên cứu chínhvề công nghệ thông tin trên thế giới. ♦ Nhiệm vụ của luận án: Nghiên cứu các phương pháp chỉsố hoá và tìm kiếm thông tin văn bản ứng dụng trong thư việnsố. ♦ Các phương pháp nghiên cứu: Hệ cơ sở dữ liệuMultimedia; các phương pháp chỉ mục; các phương pháp mãhoá; các phương pháp nén dữ liệu; các phương pháp tìm kiếmthông tin; các phương pháp xác suất và thống kê toán học. 2. CẤU TRÚC LUẬN ÁN Phần mở đầu: trình bày nhiệm vụ, đối tượng, phươngpháp nghiên cứu và tóm tắt các đóng góp chính của luận án. Chương 1 trình bày tổng quan về thư viện số, đề xuất mộtmô hình hình thức cho thư viện số dựa vào đại số hiện đại. Chương 2 trình bày hai phương pháp chính chỉ mục tàiliệu văn bản trong thư viện số, phân tích chi tiết phương phápchỉ mục tệp đảo IFID, các mô hình nén toàn cục và mô hình nén 4cục bộ hyperbol IFID, đề xuất mô hình nén cục bộ Bernoulli vànén nội suy IFID. Chương 3 trình bày mô hình tìm kiếm thông tin kinh điển:mô hình truy vấn Boole BQ, đề xuất một mô hình truy vấn xếphạng tài liệu RQ trong thư viện số, đánh giá hiệu suất tìm kiếmdựa vào hai tham số: độ chính xác P và độ phục hồi R. Chương 4 trình bày các giải thuật kinh điển: đảo dựa vàobộ nhớ, đảo dựa vào sắp xếp, đề xuất các giải thuật trộn nhiềuđường tại chỗ dựa vào sắp xếp và giải thuật phân chia dựa vàovăn bản, so sánh các giải thuật đảo, trình bày bài toán chỉ mụcCSDL động. Phần kết luận: trình bày các kết luận của luận án và cáchướng nghiên cứu tiếp theo. CHƯƠNG 1 - TỔNG QUAN VỀ THƯ VIỆN SỐ1.1 MỞ ĐẦU Định nghĩa 1.1 (Arms W.Y.) [31]: Thư viện số là một khothông tin có tổ chức với các dịch vụ liên kết, trong đó thông tinđược lưu trữ ở dạng số và có thể truy cập qua một mạng. Định nghĩa 1.2 (Chen H., Houston A.L.) [43]: Thư viện số làmột thực thể liên quan tới sự tạo ra các nguồn tin và sự hoạtđộng thông tin qua các mạng toàn cầu. DL là một kho thông tinsố có tổ chức. Định nghĩa 1.3 (Reddy R., Wladawsky-Berger I.) [121]: Thưviện số là các kho dữ liệu mạng về tài liệu văn bản số, ảnh, âmthanh, dữ liệu khoa học và phần mềm là lõi của Internet hiệnnay và các kho dữ liệu số có thể truy cập phổ biến về tất cả trithức của loài người trong tương lai. 5 Định nghĩa 1.4 (Sun Microsystems) [135]: Thư viện số là sựmở rộng điện tử về các chức năng điển hình NSD thực hiện vàcác tài nguyên NSD truy cập trong thư viện truyền thống. Cáctài nguyên thông tin được chuyển thành dạng số, lưu trữ trongcác kho multimedia và làm cho sẵn có thông qua các dịch vụWeb. Định nghĩa 1.5 (Witten I.H., Bainbridge D.) [154]: Thư việnsố là các kho đối tượng số, bao gồm văn bản, video và audiocùng với các phương pháp truy cập và tìm kiếm, lựa chọn, tổchức và bảo trì. Tóm lại, thư viện số là một kho thông tin số khổng lồ có tổchức với các dịch vụ liên k ...
Tìm kiếm theo từ khóa liên quan:
Luận án Toán học Phương pháp chỉ số hoá Tìm kiếm thông tin văn bản ứng dụng Tm kiếm thông tin trong thư viện Luận án Tiến Sĩ Tài liệu văn bản sốTài liệu liên quan:
-
205 trang 447 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 393 1 0 -
174 trang 358 0 0
-
206 trang 310 2 0
-
228 trang 276 0 0
-
32 trang 247 0 0
-
Luận án tiến sĩ Ngữ văn: Dấu ấn tư duy đồng dao trong thơ thiếu nhi Việt Nam từ 1945 đến nay
193 trang 241 0 0 -
208 trang 230 0 0
-
27 trang 209 0 0
-
27 trang 201 0 0