Building a good quality bilingual corpus for a low-resource language pair
Số trang: 14
Loại file: pdf
Dung lượng: 3.49 MB
Lượt xem: 11
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
In this paper, we presented the process of building a good quality bilingual corpus for a low-resource language pair and proposed a novel method of sentence alignment that takes advantage of pre-trained modern models for rich-resource languages. In our experiments on aligning sentences and building a bilingual corpus for the Vietnamese-Laos language pair, we achieved higher precision and recall than other good sentence alignment methods and a good quality sentence-aligned Vietnamese-Laos bilingual corpus.
Nội dung trích xuất từ tài liệu:
Building a good quality bilingual corpus for a low-resource language pair
Nội dung trích xuất từ tài liệu:
Building a good quality bilingual corpus for a low-resource language pair
Tìm kiếm theo từ khóa liên quan:
Tạp chí Khoa học Đại học Tân Trào Data mining Big data Bilingual corpus Sentence alignment Natural language processing Low-resource language pairGợi ý tài liệu liên quan:
-
Ebook Big data bootcamp: Part 1
119 trang 239 0 0 -
17 trang 186 0 0
-
9 trang 108 0 0
-
Ebook Understanding big data: Analytics for enterprise class hadoop and streaming data – Part 2
90 trang 85 0 0 -
3D human pose estimation from sport videos using mediapipe framework
11 trang 62 0 0 -
Ebook To the cloud - Big data in a turbulent world
240 trang 46 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Chương 8 - ĐH Bách khoa TP.HCM
8 trang 45 0 0 -
Vietnam sea festival in tourism development
8 trang 45 0 0 -
60 trang 41 0 0
-
Bài giảng Khai phá dữ liệu (Data mining): Clustering - Trịnh Tấn Đạt
70 trang 41 0 0