Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc
Số trang: 36
Loại file: pdf
Dung lượng: 1,023.04 KB
Lượt xem: 11
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc tập trung trình bày các vấn đề về tiến trình tìm kiếm và phù hợp phản hồi; mô hình Berry-picking; phương pháp phù hợp phản hồi; các bước tìm kiếm cơ bản với phù hợp phản hồi;...
Nội dung trích xuất từ tài liệu:
Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc(IT4853) Tìm kiếm và trình diễn thông tin Tiến trình tìm kiếm và phù hợp phản hồi Giảng viên TS. Nguyễn Bá Ngọc Địa chỉ: Viện CNTT & TT/BM HTTT/B1-603 Email: ngocnb@soict.hust.edu.vn Website: http://is.hust.edu.vn/~ngocnb Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 3Tiến trình tìm kiếm thông tin 4 Tiến trình tìm kiếm thông tin Người dùng tiếp nhận thông tin mới trong quá trình tìm kiếm: Kéo theo sự thay đổi nhu cầu thông tin; Kéo theo những hiệu chỉnh truy vấn; Nảy sinh những nhu cầu thông tin mới. Thông thường nhu cầu thông tin không được thỏa mãn bởi một văn bản đơn lẻ: Trong thực tế nhu cầu thông tin thường được thỏa mãn bởi nhiều đoạn thông tin thấy được trong quá trình tìm kiếm 5Mô hình “Berry-picking” 6 Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 7 Các bước tìm kiếm cơ bản với phù hợp phản hồi1. Người dùng cung cấp một truy vấn ban đầu;2. Công cụ tìm kiếm trả về tập kết quả tương ứng.3. Người dùng phản hồi thông tin về những văn bản phù hợpvà những văn bản không phù hợp.4. Công cụ tìm kiếm sinh câu truy vấn mới: Hy vọng sẽ tốt hơn truy vấn hiện tại.5. Thực hiện truy vấn mới và cập nhật lại kết quả: Hy vọng sẽ đầy đủ hơn. Có thể lặp nhiều vòng phản hồi (Các bước 3, 4, 5). 8 Giả thuyết phù hợp phản hồi Mục đích: Tăng tính đầy đủ của kết quả tìm kiếm. Điều kiện 1: Truy vấn ban đầu thể hiện đúng nhu cầu thông tin của người dùng. Điều kiện 2: Những văn bản phù hợp chứa những thuật ngữ tương tự Giải quyết vấn đề từ đồng nghĩa, vd: Ô tô / xe máy Nhờ đó có thể thu được những văn bản phù hợp khác khi sử dụng thông tin phản hồi. Tuy nhiên có thể làm giảm tính chính xác vì các văn bản phù hợp chứa từ không liên quan đến chủ đề. 9 Ví dụ tập kết quả tìm kiếmTruy vấn: “xe máy” 10Thông tin phản hồi 11Tập kết quả mới 12 Ví dụ phù hợp phản hồi trong không gian vec-tơ truy vấn “canine”Fernando Díaz 13 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 14 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 15 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 16 Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 17 Giải thuật Rocchio Rocchio lựa chọn truy vấn để cực đại hóa hàm qopt arg max [ sim(q , ( Dr )) sim(q , ( Dnr ))] q Dr tập văn bản phù hợp; Dnr tập văn bản không phù hợp. xu hướng: ~qopt là vec-tơ tách biệt tối đa văn bản phù hợp và không phù hợp. 1 1 qopt Dr d j Dnr d j d j Dr d j Dr Vấn đề: Không biết được tập văn bản phù hợp thực tế 18 Truy vấn tối ưu trên lý thuyết x x x x o x x x x x x x x o x o o x x x o o x x x Văn bản không phù hợpTruy vấntối ưu o Văn bản phù hợp 19 Trọng tâm của bộ văn bản Trong mô hình không gian vec-tơ, mỗi văn bản được biểu diễn như một điểm trong không gian đa chiều: Trọng tâm của một bộ văn bản D được định nghĩa như sau: 1 ( D) | D | dD d Trọng tâm của một tập điểm được xác định tươ ...
Nội dung trích xuất từ tài liệu:
Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc(IT4853) Tìm kiếm và trình diễn thông tin Tiến trình tìm kiếm và phù hợp phản hồi Giảng viên TS. Nguyễn Bá Ngọc Địa chỉ: Viện CNTT & TT/BM HTTT/B1-603 Email: ngocnb@soict.hust.edu.vn Website: http://is.hust.edu.vn/~ngocnb Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 3Tiến trình tìm kiếm thông tin 4 Tiến trình tìm kiếm thông tin Người dùng tiếp nhận thông tin mới trong quá trình tìm kiếm: Kéo theo sự thay đổi nhu cầu thông tin; Kéo theo những hiệu chỉnh truy vấn; Nảy sinh những nhu cầu thông tin mới. Thông thường nhu cầu thông tin không được thỏa mãn bởi một văn bản đơn lẻ: Trong thực tế nhu cầu thông tin thường được thỏa mãn bởi nhiều đoạn thông tin thấy được trong quá trình tìm kiếm 5Mô hình “Berry-picking” 6 Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 7 Các bước tìm kiếm cơ bản với phù hợp phản hồi1. Người dùng cung cấp một truy vấn ban đầu;2. Công cụ tìm kiếm trả về tập kết quả tương ứng.3. Người dùng phản hồi thông tin về những văn bản phù hợpvà những văn bản không phù hợp.4. Công cụ tìm kiếm sinh câu truy vấn mới: Hy vọng sẽ tốt hơn truy vấn hiện tại.5. Thực hiện truy vấn mới và cập nhật lại kết quả: Hy vọng sẽ đầy đủ hơn. Có thể lặp nhiều vòng phản hồi (Các bước 3, 4, 5). 8 Giả thuyết phù hợp phản hồi Mục đích: Tăng tính đầy đủ của kết quả tìm kiếm. Điều kiện 1: Truy vấn ban đầu thể hiện đúng nhu cầu thông tin của người dùng. Điều kiện 2: Những văn bản phù hợp chứa những thuật ngữ tương tự Giải quyết vấn đề từ đồng nghĩa, vd: Ô tô / xe máy Nhờ đó có thể thu được những văn bản phù hợp khác khi sử dụng thông tin phản hồi. Tuy nhiên có thể làm giảm tính chính xác vì các văn bản phù hợp chứa từ không liên quan đến chủ đề. 9 Ví dụ tập kết quả tìm kiếmTruy vấn: “xe máy” 10Thông tin phản hồi 11Tập kết quả mới 12 Ví dụ phù hợp phản hồi trong không gian vec-tơ truy vấn “canine”Fernando Díaz 13 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 14 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 15 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 16 Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 17 Giải thuật Rocchio Rocchio lựa chọn truy vấn để cực đại hóa hàm qopt arg max [ sim(q , ( Dr )) sim(q , ( Dnr ))] q Dr tập văn bản phù hợp; Dnr tập văn bản không phù hợp. xu hướng: ~qopt là vec-tơ tách biệt tối đa văn bản phù hợp và không phù hợp. 1 1 qopt Dr d j Dnr d j d j Dr d j Dr Vấn đề: Không biết được tập văn bản phù hợp thực tế 18 Truy vấn tối ưu trên lý thuyết x x x x o x x x x x x x x o x o o x x x o o x x x Văn bản không phù hợpTruy vấntối ưu o Văn bản phù hợp 19 Trọng tâm của bộ văn bản Trong mô hình không gian vec-tơ, mỗi văn bản được biểu diễn như một điểm trong không gian đa chiều: Trọng tâm của một bộ văn bản D được định nghĩa như sau: 1 ( D) | D | dD d Trọng tâm của một tập điểm được xác định tươ ...
Tìm kiếm theo từ khóa liên quan:
Tìm kiếm và trình diễn thông tin Hệ thống thông tin Trình diễn thông tin Tiến trình tìm kiếm thông tin Mô hình Berry-picking Phương pháp phù hợp phản hồiTài liệu liên quan:
-
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 341 0 0 -
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 280 0 0 -
Bài giảng HỆ THỐNG THÔNG TIN KẾ TOÁN - Chương 2
31 trang 235 0 0 -
Phương pháp và và ứng dụng Phân tích thiết kế hệ thống thông tin: Phần 1 - TS. Nguyễn Hồng Phương
124 trang 232 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng quản lý kho hàng trên nền Web
61 trang 217 0 0 -
62 trang 209 2 0
-
Bài giảng Phân tích thiết kế hệ thống thông tin - Chương 9: Thiết kế giao diện
21 trang 195 0 0 -
Giáo trình Phân tích thiết kế hệ thống thông tin (chương 2-bài 2)
14 trang 185 0 0 -
65 trang 177 0 0
-
Bài thuyết trình Logistic: Thực tế hệ thống thông tin logistic của Công ty Vinamilk
15 trang 170 0 0