Danh mục

Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc

Số trang: 36      Loại file: pdf      Dung lượng: 1,023.04 KB      Lượt xem: 11      Lượt tải: 0    
Xem trước 4 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc tập trung trình bày các vấn đề về tiến trình tìm kiếm và phù hợp phản hồi; mô hình Berry-picking; phương pháp phù hợp phản hồi; các bước tìm kiếm cơ bản với phù hợp phản hồi;...
Nội dung trích xuất từ tài liệu:
Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc(IT4853) Tìm kiếm và trình diễn thông tin Tiến trình tìm kiếm và phù hợp phản hồi Giảng viên TS. Nguyễn Bá Ngọc Địa chỉ: Viện CNTT & TT/BM HTTT/B1-603 Email: ngocnb@soict.hust.edu.vn Website: http://is.hust.edu.vn/~ngocnb Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 3Tiến trình tìm kiếm thông tin 4 Tiến trình tìm kiếm thông tin Người dùng tiếp nhận thông tin mới trong quá trình tìm kiếm:  Kéo theo sự thay đổi nhu cầu thông tin;  Kéo theo những hiệu chỉnh truy vấn;  Nảy sinh những nhu cầu thông tin mới. Thông thường nhu cầu thông tin không được thỏa mãn bởi một văn bản đơn lẻ:  Trong thực tế nhu cầu thông tin thường được thỏa mãn bởi nhiều đoạn thông tin thấy được trong quá trình tìm kiếm 5Mô hình “Berry-picking” 6 Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 7 Các bước tìm kiếm cơ bản với phù hợp phản hồi1. Người dùng cung cấp một truy vấn ban đầu;2. Công cụ tìm kiếm trả về tập kết quả tương ứng.3. Người dùng phản hồi thông tin về những văn bản phù hợpvà những văn bản không phù hợp.4. Công cụ tìm kiếm sinh câu truy vấn mới:  Hy vọng sẽ tốt hơn truy vấn hiện tại.5. Thực hiện truy vấn mới và cập nhật lại kết quả:  Hy vọng sẽ đầy đủ hơn. Có thể lặp nhiều vòng phản hồi (Các bước 3, 4, 5). 8 Giả thuyết phù hợp phản hồi Mục đích: Tăng tính đầy đủ của kết quả tìm kiếm. Điều kiện 1: Truy vấn ban đầu thể hiện đúng nhu cầu thông tin của người dùng. Điều kiện 2: Những văn bản phù hợp chứa những thuật ngữ tương tự  Giải quyết vấn đề từ đồng nghĩa, vd: Ô tô / xe máy  Nhờ đó có thể thu được những văn bản phù hợp khác khi sử dụng thông tin phản hồi.  Tuy nhiên có thể làm giảm tính chính xác vì các văn bản phù hợp chứa từ không liên quan đến chủ đề. 9 Ví dụ tập kết quả tìm kiếmTruy vấn: “xe máy” 10Thông tin phản hồi 11Tập kết quả mới 12 Ví dụ phù hợp phản hồi trong không gian vec-tơ truy vấn “canine”Fernando Díaz 13 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 14 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 15 Ví dụ phù hợp phản hồi trong không gian vec-tơFernando Díaz 16 Nội dung chính Tiến trình tìm kiếm thông tin Phương pháp phù hợp phản hồi Giải thuật Rocchio 17 Giải thuật Rocchio Rocchio lựa chọn truy vấn để cực đại hóa hàm      qopt  arg max [ sim(q ,  ( Dr ))  sim(q ,  ( Dnr ))]  q Dr tập văn bản phù hợp; Dnr tập văn bản không phù hợp. xu hướng: ~qopt là vec-tơ tách biệt tối đa văn bản phù hợp và không phù hợp.  1  1  qopt  Dr  d j  Dnr  d j d j Dr d j Dr Vấn đề: Không biết được tập văn bản phù hợp thực tế 18 Truy vấn tối ưu trên lý thuyết x x x x o x x x x x x x x o x o o x x x  o o x x x Văn bản không phù hợpTruy vấntối ưu o Văn bản phù hợp 19 Trọng tâm của bộ văn bản Trong mô hình không gian vec-tơ, mỗi văn bản được biểu diễn như một điểm trong không gian đa chiều: Trọng tâm của một bộ văn bản D được định nghĩa như sau:  1   ( D)   | D | dD d Trọng tâm của một tập điểm được xác định tươ ...

Tài liệu được xem nhiều: