Danh mục

Tóm tắt Luận án Tiến sĩ Kỹ thuật: Xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản

Số trang: 22      Loại file: pdf      Dung lượng: 538.14 KB      Lượt xem: 16      Lượt tải: 0    
tailieu_vip

Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án Tiến sĩ Kỹ thuật: Xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản đề xuất một số phương pháp mở rộng truy vấn ban đầu của người dùng. Đây là vấn đề cốt lõi và đồng thời là mục tiêu nghiên cứu của luận án.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Tiến sĩ Kỹ thuật: Xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản Đ I H C QU C GIA TP. HCM TRƯ NG Đ I H C BÁCH KHOA TP. H CHÍ MINH NGUY N CHÁNH THÀNH XÂY D NG MÔ HÌNH M R NG TRUY V N TRONG TRUY XU T THÔNG TIN VĂN B N Chuyên ngành: Khoa h c Máy tính Mã s : 62.48.01.01 TÓM T T LU N ÁN TI N SĨ K THU T TP. H CHÍ MINH – 2010 -1- Chương 11.1. Đ ng cơ nghiên c u M Đ U Đ ph c v cho nh ng nhu c u tìm ki m thông tin c a ngư i s d ng, các h th ng truy xu t thông tin (IR) ñã ñư c nghiên c u và phát tri n, trong ñó thành công nh t là m t s ñ ng cơ tìm ki m (search engine) n i ti ng như Google–Yahoo–Alta Vista và Bing trong th i gian g n ñây... Tuy nhiên, thông qua các h th ng ñó, vi c tìm ki m thông tin thư ng không nh n ñư c ñ y ñ k t qu c n thi t như mong mu n cũng như hi u su t c a chúng còn có m t s gi i h n nh t ñ nh. T các phân tích trên, chúng ta nh n th y nguyên nhân chính là các h th ng tìm ki m thông tin chưa ñ m nh nên k t qu ñưa ra không th h tr ngư i dùng như mong ñ i. Truy v n c a ngư i dùng cũng chưa ph n ánh ñ y ñ ng nghĩa ñ h tr cho các quá trình tìm ki m và truy xu t thông tin ñư c t t hơn. Vì v y, vi c b sung ng nghĩa vào truy v n ban ñ u c a ngư i dùng là yêu c u c n thi t. T t m quan tr ng v tính hi u qu c a quá trình truy xu t thông tin ti ng Anh (trên môi trư ng Web), cùng v i hư ng gi i quy t làm sao ñ h th ng IR có th hi u nhi u hơn và thông minh hơn khi x lý truy v n ban ñ u c a ngư i dùng, thì yêu c u v m t h th ng truy xu t thông tin có kh năng t o ra nh ng truy v n ñ ng nghĩa ho c cùng m c tiêu là bài toán quan tr ng. Do ñó, v n ñ m r ng truy v n là bài toán quan tr ng mà lu n án này nghiên c u và ñ xu t phương pháp gi i quy t. 1.2. M c tiêu và ph m vi nghiên c u T ñ ng cơ nghiên c u nêu trên, lu n án ñ xu t m t s phương pháp m r ng truy v n ban ñ u c a ngư i dùng. Đây là v n ñ c t lõi và ñ ng th i là m c tiêu nghiên c u c a lu n án. Như ñ nh hư ng nêu trên, ph m vi nghiên c u c a lu n án ñư c th hi n trong hình 1.1 (trong khung ñư ng g ch ñ t nét). -1- (A) (B) Nh p: Câu truy v n d ng c m danh t B x lý m r ng truy v n trên cơ s k th pv i ontology Xu t: Các câu truy v n: - d ng c m danh t , - ñã ñư c m r ng có d ng truy v n hoàn ch nh. Đ ng cơ tìm ki m thông tin K t qu tr v (t p tài li u) (C) Hình 1.1. M i quan h gi a mô hình c a lu n án và h th ng truy xu t thông tin(c) (A) Mô hình x lý c a lu n án (ph m vi nghiên c u c a lu n án) (B) Đ ng cơ tìm ki m thông tin (thu c h th ng truy xu t thông tin) (C) K t qu tìm ki m thông tin t yêu c u c a các câu truy v n ñã m r ng V i mô hình ñư c mô t hình 1.1, trong m c (A), câu truy v n nh p (d ng c m danh t bao g m các thành ph n là tính t hay ch có danh t ñơn) ñư c x lý ñ tr v t p các câu truy v n ñã ñư c m r ng (c m danh t có d ng truy v n hoàn ch nhd). Trong ph m vi lu n án, d a trên gi i pháp rút trích các t ñ c trưng c t lõi cho m t câu ([8] [39]), câu truy v n ban ñ u c a ngư i dùng ñư c ti n x lý ñ lo i b các thành ph n không quan tr ng nh m gi l i nh ng thành ph n chính th a ñi u ki n truy v n hoàn ch nh. Đi u ñó s giúp gi m ñư c ñ ph c t p hay d ng bi u di n ph c h p c a truy v n, ñ ng th i còn giúp ñ m b o tính duy nh t c a t ng thành ph n trong truy v n th a ñi u ki n truy v n hoàn ch nh. M c (B) c a hình trên g m ñ ng cơ tìm ki m thông tin (search engine). Đây là m t b ph n quan tr ng c a h th ng Truy xu t Thông tin. (Information Retrieval). Đ ng cơ tìm ki m thông tin gi i Trong tài li u này, ch s c a các hình, b ng bi u và tài li u tham kh o ñư c gi ñúng theo quy n lu n văn chính, không ñánh s l i. d c Tham kh o ñ nh nghĩa 3.10-Truy v n hoàn ch nh, m c 3.2.6, chương 3. -2- quy t ba v n ñ c t lõi là mô hình bi u di n văn b n, thu t toán tìm ki m so trùng t khóa - ñ i sánh ng nghĩa tương ng v i các truy v n và cơ ch l c k t qu truy xu t. Hi n t i trên th gi i có nh ng ñ ng cơ tìm ki m thông tin n i ti ng như Google, Yahoo, Microsoft Bing … Tuy nhiên, nghiên c u c a lu n án ch s d ng nh ng ñ ng cơ này như m t công c h tr vi c tìm ki m thông tin cho truy v n ñã m r ng b ng phương pháp x lý c a lu n án và không ñ t m c tiêu nghiên c u ba v n ñ nêu trên. Vì v y lu n án ñã không trình bày ba v n ñ này. Mô hình x lý c a lu n án (trong m c (A)) ch th c hi n vi c m r ng n i dung c a truy v n nh p nên hoàn toàn không làm nh hư ng ñ n ba khía c nh nêu trên trong quá trình v n hành c a ñ ng cơ tìm ki m m c (B). Đi u này còn cho th y ph m vi nghiên c u c a lu n án hư ng ñ n bài toán m r ng truy v n d a trên ontology và hoàn toàn khác bi t so v i ba khía c nh ñã nêu. T nh ng trình bày trên, các bài toán chính c n gi i quy t trong ph m vi lu n án bao g m: Bài toán 1 - Xây d ng ontology OOMP Nghiên c u và phát tri n c u trúc ontology OOMP (Ontology of Object-Member-Property) cùng cơ ch hu n luy n d li u. T ñó t o d li u ban ñ u d a trên t p tài li u ti ng Anh t ngu n TREC cũng như khai thác d li u t WordNet ñ cung c p ontology OOMP nh m ph c v yêu c u c a bài toán 2. Bài toán 2 - Xây d ng phương pháp hoàn ch nh m r ng truy v n D a trên ontology bài toán 1, nghiên c u xây d ng phương pháp ti p c n m i cho vi c m r ng truy v n nh m t o truy v n k t qu có d ng truy v n hoàn ch nh (bi u di n d ng c m danh t v m t ngôn ng h c) và xây d ng các gi i thu t h tr trong ph m vi bài toán 2. Conference on Principles and Practice of Knowledge Discovery in Databases. Dubrovnik, Croatia. 22 September 2003. [35] Sandhya Revuri, Sujatha R Upadhyaya, P Sreenivasa Kumar. Using Domain Ontologies for Efficient Information Retrieval. 13th International Conference on Management of Data (COMAD 2006), IIT, Delhi, India, 2006. [36] Tru H. Cao, Khanh C. Le, Vuong M. Ngo. Exploring Combinations of Ontological Features and Keywords for Text Retrieval. Lecture Notes In Artificial Intelligence; Vol. 5351. The 10th Pacific Rim International Conference on Artificial Intelligence: Trends in Artificial Intelligence, pp.603-613. ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: