Danh mục

Báo cáo khoa học: Cross-Lingual Latent Topic Extraction

Số trang: 10      Loại file: pdf      Dung lượng: 920.75 KB      Lượt xem: 7      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Probabilistic latent topic models have recently enjoyed much success in extracting and analyzing latent topics in text in an unsupervised way. One common deficiency of existing topic models, though, is that they would not work well for extracting cross-lingual latent topics simply because words in different languages generally do not co-occur with each other. In this paper, we propose a way to incorporate a bilingual dictionary into a probabilistic topic model so that we can apply topic models to extract shared latent topics in text data of different languages. ...
Nội dung trích xuất từ tài liệu:
Báo cáo khoa học: "Cross-Lingual Latent Topic Extraction"

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: