LUẬN VĂN: Tìm hiểu Wordnet, áp dụng trong xây dựng từ điển danh từ tiếng Việt
Số trang: 57
Loại file: pdf
Dung lượng: 659.55 KB
Lượt xem: 9
Lượt tải: 0
Xem trước 6 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Trong những năm gần đây, trong lĩnh vực xử lý ngôn ngữ tự nhiên thì xửlý ngữ nghĩa chiếm vai trò quyết định tính chính xác của các mô hình xử lý ngônngữ tự nhiên. Để xử lý ngữ nghĩa chúng ta phải có cơ sở tri thức ngữ nghĩa từvựng của ngôn ngữ cần xử lý, hiện nay tiếng Anh đã có cơ sở tri thức ngữ nghĩahoàn chỉnh. Trong đó hệ thống cơ sở tri thức ngữ nghĩa từ vựng WordNet là phổbiến nhất hiện nay....
Nội dung trích xuất từ tài liệu:
LUẬN VĂN: Tìm hiểu Wordnet, áp dụng trong xây dựng từ điển danh từ tiếng Việt BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG…………….. LUẬN VĂN Tìm hiểu Wordnet, áp dụng trongxây dựng từ điển danh từ tiếng ViệtĐồ án tốt nghiệp – CNTT MỤC LỤCLỜI CẢM ƠN ........................................................................................................ 3MỞ ĐẦU ................................................................................................................ 4CHƢƠNG 1: GIỚI THIỆU .................................................................................... 5 1.1 Đặt vấn đề ..................................................................................................... 5 1.1.1 Tổ chức cơ sở ngữ nghĩa từ vựng ........................................................... 5 1.1.2 Mô hình gán nhãn ngữ nghĩa .................................................................. 6 1.2 Các hướng tiếp cận truyền thống ................................................................. 6 1.2.1 Xây dựng từ điển phân loại dựa trên từ điển MRD ............................... 7 1.2.2 Sử dụng các liên kết trong các từ điển đã có ......................................... 7 1.2.3 Sử dụng ánh xạ từ điển MRD song ngữ ................................................ 7CHƢƠNG 2: CƠ SỞ LÝ THUYẾT ...................................................................... 8 2.1 Các vấn đề về Ngôn Ngữ học ...................................................................... 8 2.1.1 Từ trong Tiếng Việt ............................................................................... 8 2.1.2 Từ trong Tiếng Anh ............................................................................. 10 2.1.3 Nghĩa của từ: ....................................................................................... 10 2.1.4 Quan hệ đồng âm, đồng nghĩa ............................................................. 17 2.1.5 So sánh từ tiếng Việt và từ tiếng Anh về hình thái ............................. 19 2.1.6 So sánh từ tiếng Việt và từ tiếng Anh về mặt ngữ pháp ..................... 20 2.1.7 So sánh từ tiếng Việt và tiếng Anh về mặt nhãn ngữ nghĩa ................ 23 2.2 WordNet..................................................................................................... 25 2.2.1 Mô hình WordNet ................................................................................ 26 2.2.2 Danh từ trong WordNet ........................................................................ 33 2.2.3 Định dạng file cơ sở dữ liệu trong WordNet ........................................ 42 2.2.4 Số lượng từ, synset trong WordNet ..................................................... 44Chương 3: XÂY DỰNG MÔ HÌNH VÀ THỰC NGHIỆM ................................ 45 3.1 Phương pháp dịch ttự động WordNet qua tiếng Việt ................................ 45 3.1.1 Dịch từ WordNet .................................................................................. 45 3.1.2 Dịch từ từ điển tiếng Việt ..................................................................... 48 3.1.3 Tổ chức dữ liệu ..................................................................................... 52Nguyễn Thị Thu Trang – Lớp CT1001 1Đồ án tốt nghiệp – CNTT 3.2 Phương pháp làm thủ công ......................................................................... 52 3.3 Chương trình thực nghiệm ......................................................................... 53KẾT LUẬN .......................................................................................................... 54 DANH SÁCH HÌNH VẼHình 1: Ánh xạ n-1 từ nghĩa của từ tiếng Việt và synset trong tiếng Anh ............. 6Hình 2: Mô hình diễn giải các kí hiệu của mô hình dịch các synset trongWordNet ............................................................................................................... 46Hình 3: Mô hình diễn giải các kí hiệu của mô hình gán nhãn synset cho các từ 49Hình 4: Mô hình diễn giải trường hợp 2 .............................................................. 50Hình 5: Mô hình quá trình tổ chức dữ liệu cho WordNet tiếng Việt ................... 52Nguyễn Thị Thu Trang – Lớp CT1001 2Đồ án tốt nghiệp – CNTT LỜI CẢM ƠN Trước hết em xin gửi lời cảm ơn đến thầy Ths. Nguyễn Trịnh Đông, ngườiđã hướng dẫn em rất nhiều trong suốt quá trình tìm hiểu nghiên cứu và hoànthành khóa luận này từ lý thuyết đến ứng dụng. Sự hướng dẫn của thầy đã giúpem có thêm được những hiểu biết về WordNet và ứng dụng của từ đ ...
Nội dung trích xuất từ tài liệu:
LUẬN VĂN: Tìm hiểu Wordnet, áp dụng trong xây dựng từ điển danh từ tiếng Việt BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG…………….. LUẬN VĂN Tìm hiểu Wordnet, áp dụng trongxây dựng từ điển danh từ tiếng ViệtĐồ án tốt nghiệp – CNTT MỤC LỤCLỜI CẢM ƠN ........................................................................................................ 3MỞ ĐẦU ................................................................................................................ 4CHƢƠNG 1: GIỚI THIỆU .................................................................................... 5 1.1 Đặt vấn đề ..................................................................................................... 5 1.1.1 Tổ chức cơ sở ngữ nghĩa từ vựng ........................................................... 5 1.1.2 Mô hình gán nhãn ngữ nghĩa .................................................................. 6 1.2 Các hướng tiếp cận truyền thống ................................................................. 6 1.2.1 Xây dựng từ điển phân loại dựa trên từ điển MRD ............................... 7 1.2.2 Sử dụng các liên kết trong các từ điển đã có ......................................... 7 1.2.3 Sử dụng ánh xạ từ điển MRD song ngữ ................................................ 7CHƢƠNG 2: CƠ SỞ LÝ THUYẾT ...................................................................... 8 2.1 Các vấn đề về Ngôn Ngữ học ...................................................................... 8 2.1.1 Từ trong Tiếng Việt ............................................................................... 8 2.1.2 Từ trong Tiếng Anh ............................................................................. 10 2.1.3 Nghĩa của từ: ....................................................................................... 10 2.1.4 Quan hệ đồng âm, đồng nghĩa ............................................................. 17 2.1.5 So sánh từ tiếng Việt và từ tiếng Anh về hình thái ............................. 19 2.1.6 So sánh từ tiếng Việt và từ tiếng Anh về mặt ngữ pháp ..................... 20 2.1.7 So sánh từ tiếng Việt và tiếng Anh về mặt nhãn ngữ nghĩa ................ 23 2.2 WordNet..................................................................................................... 25 2.2.1 Mô hình WordNet ................................................................................ 26 2.2.2 Danh từ trong WordNet ........................................................................ 33 2.2.3 Định dạng file cơ sở dữ liệu trong WordNet ........................................ 42 2.2.4 Số lượng từ, synset trong WordNet ..................................................... 44Chương 3: XÂY DỰNG MÔ HÌNH VÀ THỰC NGHIỆM ................................ 45 3.1 Phương pháp dịch ttự động WordNet qua tiếng Việt ................................ 45 3.1.1 Dịch từ WordNet .................................................................................. 45 3.1.2 Dịch từ từ điển tiếng Việt ..................................................................... 48 3.1.3 Tổ chức dữ liệu ..................................................................................... 52Nguyễn Thị Thu Trang – Lớp CT1001 1Đồ án tốt nghiệp – CNTT 3.2 Phương pháp làm thủ công ......................................................................... 52 3.3 Chương trình thực nghiệm ......................................................................... 53KẾT LUẬN .......................................................................................................... 54 DANH SÁCH HÌNH VẼHình 1: Ánh xạ n-1 từ nghĩa của từ tiếng Việt và synset trong tiếng Anh ............. 6Hình 2: Mô hình diễn giải các kí hiệu của mô hình dịch các synset trongWordNet ............................................................................................................... 46Hình 3: Mô hình diễn giải các kí hiệu của mô hình gán nhãn synset cho các từ 49Hình 4: Mô hình diễn giải trường hợp 2 .............................................................. 50Hình 5: Mô hình quá trình tổ chức dữ liệu cho WordNet tiếng Việt ................... 52Nguyễn Thị Thu Trang – Lớp CT1001 2Đồ án tốt nghiệp – CNTT LỜI CẢM ƠN Trước hết em xin gửi lời cảm ơn đến thầy Ths. Nguyễn Trịnh Đông, ngườiđã hướng dẫn em rất nhiều trong suốt quá trình tìm hiểu nghiên cứu và hoànthành khóa luận này từ lý thuyết đến ứng dụng. Sự hướng dẫn của thầy đã giúpem có thêm được những hiểu biết về WordNet và ứng dụng của từ đ ...
Tìm kiếm theo từ khóa liên quan:
từ điển danh từ tiếng Việt Tìm hiểu Wordnet luận văn thiết kế hệ thống hệ thống thông tin kỹ thuật lập trình lập trình ứng dụngGợi ý tài liệu liên quan:
-
Thảo luận đề tài: Mối quan hệ giữa đầu tư theo chiều rộng và đầu tư theo chiều sâu
98 trang 286 0 0 -
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 279 0 0 -
Phân tích thiết kế hệ thống - Biểu đồ trạng thái
20 trang 266 0 0 -
Kỹ thuật lập trình trên Visual Basic 2005
148 trang 244 0 0 -
Luận văn: Thiết kế xây dựng bộ đếm xung, ứng dụng đo tốc độ động cơ trong hệ thống truyền động điện
63 trang 227 0 0 -
Bài giảng HỆ THỐNG THÔNG TIN KẾ TOÁN - Chương 2
31 trang 224 0 0 -
Đề tài nguyên lý hệ điều hành: Nghiên cứu tìm hiểu về bộ nhớ ngoài trong hệ điều hành Linux
19 trang 220 0 0 -
Đồ án: Kỹ thuật xử lý ảnh sử dụng biến đổi Wavelet
41 trang 212 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng quản lý kho hàng trên nền Web
61 trang 210 0 0 -
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 210 0 0