Danh mục

Building a good quality bilingual corpus for a low-resource language pair

Số trang: 14      Loại file: pdf      Dung lượng: 3.49 MB      Lượt xem: 11      Lượt tải: 0    
tailieu_vip

Phí tải xuống: 1,000 VND Tải xuống file đầy đủ (14 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

In this paper, we presented the process of building a good quality bilingual corpus for a low-resource language pair and proposed a novel method of sentence alignment that takes advantage of pre-trained modern models for rich-resource languages. In our experiments on aligning sentences and building a bilingual corpus for the Vietnamese-Laos language pair, we achieved higher precision and recall than other good sentence alignment methods and a good quality sentence-aligned Vietnamese-Laos bilingual corpus.
Nội dung trích xuất từ tài liệu:
Building a good quality bilingual corpus for a low-resource language pair

Tài liệu được xem nhiều: