Danh mục

Báo cáo nghiên cứu khoa học: NGHIÊN CỨU XÂY DỰNG TỪ ĐIỂN CHO HỆ THỐNG DỊCH TỰ ĐỘNG UNL – TIẾNG VIỆT

Số trang: 9      Loại file: pdf      Dung lượng: 727.92 KB      Lượt xem: 10      Lượt tải: 0    
Thư viện của tui

Hỗ trợ phí lưu trữ khi tải xuống: 4,500 VND Tải xuống file đầy đủ (9 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong bài báo này chúng tôi giới thiệu những thông tin tổng quát về hệ thống UNL và đề xuất giải pháp xây dựng từ điển UNL – tiếng Việt phục vụ cho hệ thống dịch đa ngữ UNL. UNL (Universal Networking Language) là ngôn ngữ máy tính nhằm mục đích xử lý thông tin và tri thức mà không bị cản trở bởi rào cản ngôn ngữ. Đây là ngôn ngữ nhân tạo cho phép đặc tả ngôn ngữ...
Nội dung trích xuất từ tài liệu:
Báo cáo nghiên cứu khoa học: " NGHIÊN CỨU XÂY DỰNG TỪ ĐIỂN CHO HỆ THỐNG DỊCH TỰ ĐỘNG UNL – TIẾNG VIỆT" TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010 NGHIÊN CỨU XÂY DỰNG TỪ ĐIỂN CHO HỆ THỐNG DỊCH TỰ ĐỘNG UNL – TIẾNG VIỆT A CASE STUDY ON THE BUILDING OF A DICTIONARY FOR MACHINE TRANSLATION USING UNL - VIETNAMESE Nguyễn Hữu Siêu Lâm Tùng Giang Võ Trung Hùng Trường THPT chuyên Trung tâm Tin học – Trường Đại học Bách khoa, Lê Quý Đôn – Đà Nẵng Văn phòng UBND Đại học Đà Nẵng Thành phố Đà Nẵng TÓM TẮT Trong bài báo này chúng tôi giới thiệu những thông tin tổng quát về hệ thống UNL vàđề xuất giải pháp xây dựng từ điển UNL – tiếng Việt phục vụ cho hệ thống dịch đa ngữ UNL.UNL (Universal Networking Language) là ngôn ngữ máy tính nhằm mục đích xử lý thông tin vàtri thức mà không bị cản trở bởi rào cản ngôn ngữ. Đây là ngôn ngữ nhân tạo cho phép đặc tảngôn ngữ tự nhiên theo cách truyền thông của con người. Mục đích cuối cùng là cho phép conngười diễn đạt ngôn ngữ tự nhiên thông qua ngôn ngữ này. Nó cũng cho phép các máy tínhliên lạc được với nhau nhờ các tính năng gửi, nhận và hiểu được thông tin đa ngữ. Chúng tôisẽ tập trung trình bày những nghiên cứu về cấu trúc từ điển UNL, từ điển UNL- Tiếng Pháp, từđiển Anh - Việt và trên cơ sở đó đề xuất giải pháp xây dựng từ điển UNL – tiếng Việt. ABSTRACT In this paper, we introduce general information about Universal Networking Language(UNL) and propose solution to build the UNL – Vietnamese dictionary for the UNL multilingualtranslation system. UNL is a computer language that enables computers to process informationand knowledge across language barriers. It is an artificial language that replicates, in the cyberworld, the functions of natural languages in human communication. As a result, it enablespeople to express their ideas through natural languages. It also enables computers tointercommunicate; thus, providing people with a linguistic infrastructure for distributing, receivingand understanding multilingual information. Here, we focus on our research on structure of theUNL dictionary, the UNL-French dictionary, English – Vietnamese dictionary and our suggestiontowards building the UNL – Vietnamese dictionary.1. Giới thiệu Thế giới bước vào thế kỷ 21 với sự phát triển nhanh và đạt được nhiều thành tựulớn trong tất cả các lĩnh vực kinh tế, kỹ thuật, văn hóa, xã hội... Cùng với sự phát triểnnày, nhân loại đã tạo ra lượng thông tin khổng lồ và phần lớn những thông tin đó chúngta có thể tìm thấy thông qua hệ thống mạng Internet. Tuy nhiên, lượng thông tin trênmạng Internet vẫn chưa được khai thác hết bởi nhiều lý do và một trong những lý do quantrọng nhất là rào cản về ngôn ngữ. Giải pháp quan trọng nhằm phá bỏ rào cản ngôn ngữ làphát triển các hệ thống dịch tự động. Đến nay, nhiều hệ thống dịch tự động đã được pháttriển và đưa vào sử dụng rộng rãi như Systran, IBM Translator, Reverso,…208 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010 Tuy nhiên, những hệ thống này đang phải đối mặt với rất nhiều vấn đề như sự đanghĩa của từ, sự nhập nhằng về ngữ nghĩa, sự phụ thuộc vào ngữ cảnh và sự khác biệtvề giải thích các khái niệm. UNL đề xuất một cách tiếp cận mới về dịch tự động thôngqua ngôn ngữ trung gian (ví dụ, thay vì dịch trực tiếp từ tiếng Anh sang tiếng Pháp, tadịch từ tiếng Anh sang UNL và sau đó từ UNL sang tiếng Pháp). Ngôn ngữ trung giannày được xem như một ngôn ngữ “nhân tạo” và có thể biểu đạt được ý nghĩa của mộtnội dung bất kỳ nào trên máy tính dưới dạng ngôn ngữ. UNL có ý nghĩa quan trọngtrong việc đơn giản hóa việc phát triển các hệ thống dịch tự động. Ví dụ cho trường hợptiếng Việt, thay vì phải phát triển các hệ thống dịch tự động cho các cặp tiếng Việt –Nga, Việt – Anh, Việt – Pháp,… ta chỉ cần phát triển một cặp Việt – UNL để có thểdịch sang tất cả các ngôn ngữ khác đã được hỗ trợ bởi UNL (Nga, Anh, Pháp,…).Trong bài báo này, chúng tôi sẽ giới thiệu kiến trúc hệ thống và cấu trúc từ điển củaUNL, sau đó đề xuất giải pháp tự động xây dựng từ điển UNL – tiếng Việt dựa trên từđiển UNL – Pháp và từ điển Anh – Việt theo Dict Format (tiêu chuẩn định dạng từ điểnđề xuất bởi DICT Development Group và được sử dụng rộng rãi cho các từ điển mãnguồn mở).2. Giới thiệu về hệ thống UNL UNL là ngôn ngữ nhân tạo nhằm mục đích mô tả ý nghĩa của các câu thông quakhái niệm lược đồ của mạng ngữ nghĩa. Nó cho phép biểu diễn tất cả các câu viết trongcác ngôn ngữ tự nhiên theo cùng cách thức thông qua việc sử dụng một đồ thị ngữ nghĩađơn. Khi một đồ thị kiểu này được xây dựng, nó có thể được chuyển đến bất kỳ ...

Tài liệu được xem nhiều:

Tài liệu liên quan: