Danh mục

Luận văn: Nghiên cứu và xây dựng hệ thống dịch tự động Jrai - Việt và Việt - Jrai

Số trang: 26      Loại file: pdf      Dung lượng: 240.91 KB      Lượt xem: 6      Lượt tải: 0    
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong bài báo này chúng tôi trình bày việc nghiên cứu và xây dựng hệ thống dịch tự động tiếng Việt – Jrai và Jrai – Việt dựa theo phương pháp dịch thống kê. Trong số các phương pháp dịch hiện có, phương pháp dịch thống kê được xem là một hướng phát triển đầy tiềm năng bởi những ưu điểm vượt trội so với các phương pháp dịch khác. Về phần thực nghiệm, chúng tôi đã triển khai thành công một hệ thống dịch thống kê Việt – Jrai và Jrai – Việt dựa trên mã nguồn mở Moses....
Nội dung trích xuất từ tài liệu:
Luận văn:Nghiên cứu và xây dựng hệ thống dịch tự động Jrai - Việt và Việt - Jrai 1 B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG Đ TH THU N NGHIÊN C U VÀ XÂY D NG H TH NGD CH T Đ NG JRAI – VI T VÀ VI T – JRAI Chuyên ngành : Khoa h c máy tính Mã s : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2012 2 Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: TS. HUỲNH CÔNG PHÁPPh n bi n 1 : PGS.TS. LÊ VĂN SƠNPh n bi n 2 : TS. NGUY N M U HÂN Lu n văn ñư c b o v t i H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào ngày 16 tháng 12 năm 2012Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng; - Trung tâm H c li u, Đ i h c Đà N ng; 3 M Đ U1. Lý do ch n ñ tài C ng ñ ng các dân t c Vi t Nam có ñ n 54 dân t c anh emvà Jrai là m t dân t c có dân s khá ñông, ch ñ ng th hai (saungư i Kinh). Ngư i Jrai cư trú trên m t d i ñ t r ng l n, ch y uphân b t nh Gia Lai và ñ ng bào s d ng ti ng Jrai làm ngôn nggiao ti p chính th ng. Tuy nhiên, ti ng Vi t l i là ngôn ng chínhñư c s d ng Vi t Nam, ñi u này d n ñ n vi c chuy n t i chtrương, ñư ng l i c a Đ ng, chính sách, pháp lu t c a Nhà nư c ñ nv i các ñ ng bào dân t c Jrai g p r t nhi u khó khăn. Đ ng bàocũng g p khó khăn trong vi c h c t p và ti p thu tri th c b ng ti ngVi t. Ngày nay, vào th i ñ i công ngh thông tin bùng n , ñb o t n và phát huy ñư c b n s c các dân t c, chúng tôi nghĩ ñ ncác bi n pháp ñưa ngôn ng Jrai vào máy tính. Do ñó, vi c xây d ngm t h th ng d ch qua l i gi a ti ng Jrai và ti ng Vi t là r t c nthi t. Hi n t i, Trung tâm CNTT-TT S Thông tin và Truy nthông Gia Lai và Công ty TNHH Công ngh thông tin Tu i tr L cVi t ñã cho ra ñ i ph n m m T ñi n ñi n t phương ng Jrai -Vi t” cho phép chúng ta tra nghĩa theo t . Tuy nhiên, v i m t tàili u l n mu n d ch t ti ng Jrai sang ti ng Vi t hay ngư c l i thìvi c tra c u t ng t là r t b t c p và m t th i gian. Xu t phát t nhu c u th c t trên, chúng tôi có ý tư ngnghiên c u và xây d ng m t h th ng d ch t ñ ng gi a ti ng Jraivà ti ng Vi t. 4 Hi n nay, có r t nhi u các phương pháp d ch t ñ ng ñãñư c s d ng như d ch máy d a trên lu t, d ch máy d a trên ví dm u, d ch máy d a trên xác su t th ng kê, .... Tuy nhiên, d ch máyd a trên phương pháp th ng kê ñang là m t hư ng phát tri n ñ yti m năng b i nh ng ưu ñi m vư t tr i so v i các phương phápkhác. Thay vì xây d ng các t ñi n, các quy lu t chuy n ñ i b ngtay, h d ch này t ñ ng xây d ng các t ñi n, các quy lu t d a trênk t qu th ng kê có ñư c t các kho ng li u. Chính vì v y, d chmáy d a vào th ng kê có tính kh chuy n cao áp d ng ñư c cho b tkỳ c p ngôn ng nào. V i nh ng ñi u ki n và lý do nêu trên, chúng tôi ch như ng nghiên c u v phương pháp d ch máy d a trên xác su t th ngkê ñ xây d ng h th ng d ch t ñ ng Jrai – Vi t và Vi t – Jrai.2. M c ñích và nhi m v c a ñ tài M c ñích c a ñ tài là t p trung nghiên c u, tìm hi u cácphương pháp d ch máy và áp d ng ñ xây d ng h th ng d ch tñ ng Jrai – Vi t và Vi t – Jrai. Nhi m v c th : - Nghiên c u các văn b n ti ng Jrai. - Nghiên c u t ng quan v các phương pháp d ch máy. - Đ xu t phương pháp d ch máy hi u qu và v n d ng ñ xây d ng h th ng d ch t ñ ng Jrai – Vi t và Vi t – Jrai. - Nghiên c u các phương pháp ñánh giá h d ch t ñ ng.3. Đ i tư ng và ph m vi nghiên c u Đ i tư ng nghiên c u - Các văn b n văn hóa hóa ti ng Jrai. 5 - Các ph n m m d ch t ñ ng hi n có. - Các phương pháp d ch t ñ ng. - Các công c ñánh giá d ch t ñ ng Ph m vi nghiên c u - Đ tài t p trung vào nghiên c u v d ch các tài li u d ng văn b n văn hóa ti ng Vi t và ti ng Jrai. 4. Phương pháp nghiên c u - Tìm hi u các h d ch t ñ ng ñã có ñ tìm ra các phương pháp d ch máy mà các h d ch hi n ñang s d ng. - Nghiên c u và ñánh giá các phương pháp d ch máy, nh ng ưu ñi m và nh ng h n ch , sau ñó tìm ra m t phương pháp có hi u qu và ñ xu t áp d ng cho bài toán ñ tài ñ t ra. - Nghiên c u các phương pháp ñánh giá ch t lư ng d ch máy ñ ñánh giá hi u qu d ch cho h th ng ñ tài ñã xây d ng.5. Ý nghĩa khoa h c và th c ti n c a ñ tài Ý nghĩa khoa h c - Hi u và v n d ng ñư c phương pháp d ch máy th ng kê vào th c ti n. - Xây d ng thành công ph n m m d ch t ñ ng gi a ti ng Jrai và ti ng Vi t Ý nghĩa th c ti n - H th ng d ch máy gi ...

Tài liệu được xem nhiều:

Tài liệu liên quan: