Thông tin tài liệu:
Cho đến nay, sau hơn 50 năm phát triển, dịch máy chứng tỏ là một ứng dụng vô cùng thiết thực, đồng thời cũng là một bài toán khá hóc búa đặt ra cho các nhà khoa học trên toàn thế giới. Từ đầu thập niên 1960, các nhà khoa học đã đúc kết lại ba chiến lược dịch máy cơ bản, đó là dịch trực tiếp, dịch thông qua ngôn ngữ trung gian và dịch dựa trên chuyển đổi. Và qua thực tế, chiến lược dịch dựa trên chuyển đổi đã khẳng định được tính hiệu quả và tiềm...
Nội dung trích xuất từ tài liệu:
Luận văn:Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịch tự động Anh-Việt TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ TRI THỨC NGUYỄN LƯU THÙY NGÂN - 9912621 ĐỖ XUÂN QUANG - 9912652 XÂY DỰNG CHƯƠNG TRÌNHCHUYỂN ĐỔI CÂY CÚ PHÁP TRONG HỆ DỊCH TỰ ĐỘNG ANH - VIỆT LUẬN VĂN CỬ NHÂN TIN HỌC GIÁO VIÊN HƯỚNG DẪN TS. ĐINH ĐIỀN NIÊN KHÓA 1999-2003Luận văn tốt nghiệp Lời cảm tạ Lời đầu tiên chúng em xin chân thành cảm ơn thầy Đinh Điền, người đã trực tiếp hướng dẫn chúng em hoàn thành luận văn này. Thầy là người đã truyền thụ cho chúng em rất nhiều kiến thức về tin học và ngôn ngữ học, giúp chúng em có được hiểu biết sâu hơn về một trong các ứng dụng có ý nghĩa vô cùng to lớn trong cuộc sống của tin học – vấn đề dịch máy. Chúng em cũng xin chân thành cảm ơn các thầy cô trong khoa Công nghệ thông tin đã tận tình chỉ bảo và giúp đỡ cho chúng em trong suốt thời gian chúng em học đại học và trong quá trình chúng em thực hiện luận văn. Chúng con xin chân thành cảm ơn ba mẹ, các anh và những người thân trong gia đình đã nuôi dạy, tạo mọi điều kiện tốt nhất cho chúng con học tập và động viên chúng con trong thời gian thực hiện luận văn. Và cuối cùng, chúng tôi xin gởi lời cảm ơn đến tất cả bạn bè và nhất là các bạn trong nhóm VCL (Vietnamese Computational Linguistics), những người đã hỗ trợ chúng tôi trong quá trình chúng tôi hoàn thiện luận văn này. Tp. Hồ Chí Minh, tháng 07 năm 2003 Nguyễn Lưu Thùy Ngân - 9912621 Đỗ Xuân Quang - 9912652 Trang 2Luận văn tốt nghiệp NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... Tp. Hồ Chí Minh, tháng 07 năm 2003 TS. Đinh Điền Trang 3Luận văn tốt nghiệp NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... ............................................................... Tp. Hồ Chí Minh, tháng 07 năm 2003 Giáo viên phản biện Trang 4Luận văn tốt nghiệp L ờ i nó i đ ầ u Cho đến nay, sau hơn 50 năm phát triển, dịch máy chứng tỏ là một ứng dụngvô cùng thiết thực, đồng thời cũng là một bài toán khá hóc búa đặt ra cho các nhàkhoa học trên toàn thế giới. Từ đầu thập niên 1960, các nhà khoa học đã đúc kết lạiba chiến lược dịch máy cơ bản, đó là dịch trực tiếp, dịch thông qua ngôn ngữ trunggian và dịch dựa trên chuyển đổi. Và qua thực tế, chiến lược dịch dựa trên chuyểnđổi đã khẳng định được tính hiệu quả và tiềm năng của nó, và đây cũng là cách tiếpcận mà chúng em đã và đang theo đuổi để xây dựng một hệ dịch tự động từ tiếngAnh sang tiếng Việt. Trong hệ dịch dựa trên sự chuyển đổi, khối chuyển đổi cây cú pháp (cấu trúc)giữ một vai trò quan trọng, quyết định chất lượng hệ dịch. Vì lý do đó, chúng em đãquyết định chọn “Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịchAnh-Việt” làm đề tài luận văn tốt nghiệp cử nhân của mình. Khối chuyển đổi cây cúpháp đảm nhiệm việc thay đổi trật tự, chèn, xoá các thành phần trong cây cú phápcủa câu tiếng Anh sao cho sau khi hoàn tất việc gắn nghĩa, ta sẽ thu được câu tiếngViệt có trật tự từ hợp lý. Luận văn được tổ chức thành các phần chính sau: Chương 1: Giới thiệu tầm quan trọng, mục tiêu, phạm vi của đề tài, cơ sở lý thuyết ngôn ngữ học, tin học và hướng tiếp cận vấn đề. Chương 2: Điểm qua các cách tiếp cận chuyển đổi cấu trúc. Chương 3: Thuật toán nền tảng, mô hình học và mô hình áp dụng chuyển đổi cây cú pháp. Chương 4: Thiết kế – Cài đặt Chương 5: Thử nghiệm – đánh giá Chương 6: Kết quả – Kết luận – Hướng phát triển Phần phụ lục. Tài liệu tham khảo. ...