Danh mục

Luận án Tiến sĩ Toán học: Nghiên cứu xây dựng tài nguyên song ngữ Việt - Anh ứng dụng cho dịch máy theo miền

Số trang: 158      Loại file: pdf      Dung lượng: 2.96 MB      Lượt xem: 8      Lượt tải: 0    
Jamona

Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Ngày nay, với sự hỗ trợ mạnh mẽ của phần cứng máy tính và Internet, dịch máy đã cho kết quả dịch có thể chấp nhận được và nhiều ứng dụng dịch đã được đưa vào sử dụng: Dịch tiếng nói; dịch tự động giữa nhiều ngôn ngữ khác nhau (Google Translate hỗ trợ dịch giữa hơn 100 thứ tiếng khác nhau); dịch các phụ đề phim; dịch các trang Web;... Chất lượng dịch máy ngày càng được cải thiện, hứa hẹn sẽ mang đến nhiều ứng dụng trong nhiều lĩnh vực khác nhau. Mời các bạn cùng tham khảo nội dung luận án.
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Toán học: Nghiên cứu xây dựng tài nguyên song ngữ Việt - Anh ứng dụng cho dịch máy theo miền ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN ——————— NGUYỄN TIẾN HÀ NGHIÊN CỨU XÂY DỰNG TÀI NGUYÊN SONG NGỮ VIỆT-ANHỨNG DỤNG CHO DỊCH MÁY THEO MIỀN LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội - 2020 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN ——————— NGUYỄN TIẾN HÀ NGHIÊN CỨU XÂY DỰNG TÀI NGUYÊN SONG NGỮ VIỆT-ANHỨNG DỤNG CHO DỊCH MÁY THEO MIỀNChuyên ngành: Cơ sở toán học cho tin họcMã số: 9460117.02 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. TS. Nguyễn Thị Minh Huyền 2. PGS.TS. Nguyễn Hữu Ngự Hà Nội - 2020 LỜI CAM ĐOAN Tôi xin cam đoan các nội dung trình bày trong luận án này là kết quả nghiêncứu của tôi, được thực hiện dưới sự hướng dẫn của TS. Nguyễn Thị Minh Huyềnvà PGS. TS. Nguyễn Hữu Ngự. Các nội dung trích dẫn từ các nghiên cứu củacác tác giả khác trình bày trong luận án này được ghi rõ nguồn trong phần tàiliệu tham khảo. Nguyễn Tiến Hà LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc đến TS. Nguyễn Thị Minh Huyền và PGS.TS.Nguyễn Hữu Ngự đã trực tiếp hướng dẫn, chỉ bảo tận tình, luôn hỗ trợ và tạonhững điều kiện tốt nhất cho tôi trong quá trình học tập và nghiên cứu. Tôi xin gửi lời cảm ơn đến các thầy/cô giáo ở Khoa Toán - Cơ - Tin học,Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, đặc biệt là cácthầy/cô giáo ở Bộ môn Tin học, những người đã trực tiếp giảng dạy và giúp đỡtôi trong quá trình học tập và nghiên cứu ở trường. Tôi xin gửi cảm ơn đến TS. Nguyễn Văn Vinh, PGS. TS. Nguyễn PhươngThái, PGS. TS Phan Xuân Hiếu Trường Đại học Công nghệ, Đại học Quốc giaHà Nội; TS. Trần Thị Oanh khoa Quốc tế, Đại học Quốc gia Hà Nội; PGS. TS.Lê Thanh Hương, TS. Đỗ Thị Ngọc Diệp Trường Đại học Bách khoa Hà Nội;PGS. TS Đỗ Trung Tuấn, TS. Đỗ Thanh Hà, TS. Lê Hồng Phương, PGS. TS.Lê Trọng Vĩnh, TS. Nguyễn Thị Bích Thủy, TS. Vũ Tiến Dũng Trường Đại họcKhoa học Tự nhiên, Đại học Quốc gia Hà Nội, các thầy/cô đã có những góp ýchỉnh sửa để tôi hoàn thiện luận án. Tôi xin gửi lời cảm ơn đến tất cả anh, chị, em ở Bộ môn Tin học, Khoa Toán-Cơ-Tin học, Trường đại học khoa học Tự nhiên, Đại học Quốc gia Hà Nội vàBộ môn Khoa học máy tính, Khoa Công nghệ thông tin, Trường Đại học Côngnghệ, Đại học Quốc gia Hà Nội đã giúp đỡ tôi trong thời gian làm nghiên cứusinh. Cuối cùng, tôi xin gửi lời cảm ơn đến tất cả các thành viên trong gia đình,các bạn bè, đồng nghiệp nơi tôi công tác đã luôn ủng hộ, chia sẻ, động viên vàkhích lệ tôi học tập, nghiên cứu.Mục lụcDanh mục các chữ viết tắt 4Mở đầu 91 Tổng quan về dịch máy và tài nguyên ngôn ngữ 15 1.1 Tổng quan về dịch máy . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.1.1 Lịch sử về dịch máy . . . . . . . . . . . . . . . . . . . . . . 16 1.1.2 Kiến trúc của hệ thống dịch máy . . . . . . . . . . . . . . . 19 1.1.3 Các phương pháp dịch máy . . . . . . . . . . . . . . . . . . 22 1.1.4 Các hệ thống dịch máy có thể sử dụng để thực nghiệm . . 30 1.1.5 Đánh giá các hệ thống dịch máy . . . . . . . . . . . . . . . 32 1.2 Tài nguyên ngôn ngữ cho hệ thống dịch máy . . . . . . . . . . . . 35 1.2.1 Tài nguyên đa ngữ cho dịch máy . . . . . . . . . . . . . . . 35 1.2.2 Tài nguyên song ngữ Việt-Anh . . . . . . . . . . . . . . . . 38 1.3 Thích ứng miền trong dịch máy . . . . . . . . . . . . . . . . . . . . 41 1.4 Các công cụ tiền xử lý văn bản . . . . . . . . . . . . . . . . . . . . 43 1.5 Kết luận chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452 Xây dựng kho ngữ liệu song ngữ Việt - Anh dóng hàng mức câu theo miền 47 2.1 Xây dựng kho ngữ liệu song ngữ Việt-Anh theo miền . . . . . . . 48 2.1.1 Phương pháp thu thập ngữ liệu song ngữ và dóng hàng câu 48 1 2.1.2 Xây dựng kho ngữ liệu song ngữ Việt - Anh miền du lịch . 49 2.2 Dóng hàng văn bản song ngữ Việt-Anh . . . . . . . . . . . . . . . 52 2.2.1 Phương pháp dóng hàng văn bản song ngữ mức câu . . . . 52 2.2.2 Cải tiến công cụ dóng hàng câu XAlign . . . . . . . . . . . 54 2.3 Ứng dụng kho ngữ liệu du lịch song ngữ Việt-Anh cho hệ thống dịch máy . . . . . . . . . . . . . . . . . . ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: