Danh mục

Luận văn: Nghiên cứu phương pháp thu thập tập dữ liệu song song (parallel corpus)Việt-Anh, Việt-Pháp từ các nguồn tài liệu đa ngữ

Số trang: 12      Loại file: pdf      Dung lượng: 171.20 KB      Lượt xem: 6      Lượt tải: 0    
Hoai.2512

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Đa ngôn ngữ là từ để chỉ các quốc gia mà có nhiều ngôn ngữ được công nhận trong cùng một quốc gia (ví dụ Canada công nhận tiếng Anh và tiếng Pháp), có một ngôn ngữ được công nhận nhưng các ngôn ngữ khác dùng khá phổ biến (ví dụ Tây Ban Nha công nhận tiếng Tây Ban Nha là ngôn ngữ chính thức nhưng tiếng Catalan, tiếng Basque và tiếng Galica được công nhận là ngôn ngữ chính thức phụ). Cần phân biệt với những ngôn ngữ được sử dụng tại 1 quốc gia nhưng không có địa...
Nội dung trích xuất từ tài liệu:
Luận văn:Nghiên cứu phương pháp thu thập tập dữ liệu song song (parallel corpus)Việt-Anh, Việt-Pháp từ các nguồn tài liệu đa ngữ Công trình ñư c hoàn thành t i B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG Đ I H C ĐÀ N NG LÊ CÔNG VÕ Ngư i hư ng d n khoa h c: TS. Huỳnh Công PhápNGHIÊN C U PHƯƠNG PHÁP THU TH P T P Ph n bi n 1: PGS. TS. Đoàn Văn Ban D LI U SONG SONG (PARALLEL CORPUS) Ph n bi n 1: TS. Huỳnh H u HưngVI T – ANH, VI T – PHÁP T CÁC NGU N TÀI LI U ĐA NG Lu n văn s ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà Chuyên ngành: KHOA H C MÁY TÍNH N ng ngày 10 tháng 9 năm 2011. Mã s : 60.48.01 LU N VĂN TH C SĨ K THU T Có th tìm hi u lu n văn t i: – Trung tâm Thông tin – H c li u, Đ i h c Đà N ng – Trung tâm H c li u, Đ i h c Đà N ng Đà N ng - Năm 2011 -1- -2- nhân cơ b n là các h th ng này v n còn thi u t p d li u d ch t ñ ng M Đ U song song có ch t lư ng t t, ñ l n.1. Lý do ch n ñ tài Hi n nay, t n t i nhi u phương pháp ñ thu th p kho ng li u Trư c s bùng n c a thông tin như hi n nay, nhu c u d ch t song song cho nhi u ngôn ng khác trên th gi i. Tuy nhiên, ñ i v iñ ng ngày càng l n. Vi c d ch t ñ ng các văn b n, bài báo, t p ti ng Vi t g p nhi u khó khăn trong vi c xây d ng kho ng li u songchí,…(t ngôn ng A sang ngôn ng B ho c nhi u ngôn ng khác) ñ song. Ví d như: Tính nh p nh ng c a ti ng Vi t, s ph c t p c a tph c v công vi c h c t p, nghiên c u m t cách k p th i, nhanh chóng nhi u âm ti t,… Như v y, chúng tôi có th áp s d ng các phươnglà m t trong nh ng v n ñ h t s c c p bách. Chính vì v y, bài toán pháp có s n và cái ti n ñ thu th p ñư c kho ng li u song song chod ch t ñ ng song song gi a các ngôn ng càng có ý nghĩa thi t th c ti ng Vi t. Đó là ch n l a phương pháp thu th p t ngu n tài nguyênhơn bao gi h t. s n có: T các Website ña ng trên Internet. B i vì, Internet có r t Ngày nay, v i s phát tri n c a CNTT, Internet phát tri n m nh nhi u các Website ña ng ch a ti ng Vi t, ti ng Anh, ti ng Pháp,…và ñư c s d ng r ng rãi. Các d ch v d ch thu t ngày càng tr nên Và trong th i gian gi i h n ñ tài, chúng tôi ch ch n các c p ngôn ngph bi n và không th thi u c a con ngư i thì vi c xây d ng kho d Vi t – Anh, Vi t – Pháp vì ñây là hai ngôn ng ch ñ o trong c ngli u song song (Parallel Corpus) là ñi u c n làm ñ làm cơ s , n n t ng ñ ng ngư i Vi t và tính c p bách c a nó ñ i v i ngư i Vi t. Trongcho h th ng d ch t ñ ng thông minh hơn nh m ph c v cho vi c tương lai, chúng tôi s phát tri n cho các c p ngôn ng khác.d ch các ño n văn b n, các bài báo,… 2. M c ñích nghiên c u Ngoài ra kho d li u song song cũng r t quan tr ng ñ i v i m c M c tiêu mà ñ tài hư ng ñ n là nghiên c u các phương phápñích nghiên c u và h c t p như là t o h th ng m u ñ ñánh giá ch t trích l c các câu song song Vi t – Anh, Vi t – Pháp t các Website ñalư ng d ch, ph c v cho vi c h c ngo i ng ,… ng . Đ ng th i ghiên c u các phương pháp và mô hình cho phép con Ngày nay, vi c ñánh giá và phát tri n các h th ng ngôn ng khác ngư i c ng tác ñ c i ti n, s a ñ i,… kho ng li u song song.như: Ti ng Anh, ti ng Ý, ti ng Pháp,… d dàng và ñ t ñư c ch t Thu th p ñư c m t kho ng li u song song Vi t – Anh, Vi t –lư ng cao. B i vì, các ngôn ng này có h th ng kho ng li u song Pháp có ch t lư ng t t t các Website ña ng . Sau ñó xây d ng môsong l n và có ch t lư ng r t cao. Nhưng ñ i v i ti ng Vi t r t khó hình qu n lý và cho phép ngư i dùng tương tác nh m c i ti n h th ngkhăn ñ xây d ng m t h th ng kho ng li u song song ch t lư ng t t kho ng li u song song cho viêc d ch t ñ ng.và hi n nay chưa t n t i d ch t ñ ng có ch t lư ng cao. Ví d nhưGoogleTranslater có h tr ti ng Vi t nhưng có ch t lư ng cũng chkho ng 20% so v i ch t lư ng c a con ngư i d ch mà thôi. Nguyên -3- -4- trình qu n lí cho phép ngư i dùng c ng tác, s a ñ i, c i ti n,... kho3. Đ i tư ng và ph m vi nghiên c u ng li u song song ngày càng t t hơn. Hi n nay, trên th gi i có r t nhi u kho ng li u song song chocác c p ngôn ng khác nhau. Tuy nhiên, trong khuôn kh lu n văn này 5. Ý nghĩa khoa h c và th c ti n c a ñ tàichúng tôi ch nghiên c u v phương pháp thu th p kho ng li u song Ý nghĩa khoa h c:song Vi t – Anh và Vi t – Pháp và mô hình cho phép con ngư i c ng Góp ph n xây d ng h th ng d ch t ñ ng, nâng cao ch t lư ngtác ñ c i ti n, s a ñ i,… kho ng li u song song ñã thu th p ñư c. h th ng d ch t ñ ng. Có th dùng t p d li u ñó như m t t p d li u Ngày nay, Internet r t quan tr ng và và là m t ph n không th khoa h c ñáng tin c y ñ nh ng ngư i mu n ngh ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: