Báo cáo khoa học: Tagging Urdu Text with Parts of Speech: A Tagger Comparison
Số trang: 9
Loại file: pdf
Dung lượng: 115.65 KB
Lượt xem: 8
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
In this paper, four state-of-art probabilistic taggers i.e. TnT tagger, TreeTagger, RF tagger and SVM tool, are applied to the Urdu language. For the purpose of the experiment, a syntactic tagset is proposed. A training corpus of 100,000 tokens is used to train the models. Using the lexicon extracted from the training corpus, SVM tool shows the best accuracy of 94.15%. After providing a separate lexicon of 70,568 types, SVM tool again shows the best accuracy of 95.66%.
Nội dung trích xuất từ tài liệu:
Báo cáo khoa học: "Tagging Urdu Text with Parts of Speech: A Tagger Comparison"
Nội dung trích xuất từ tài liệu:
Báo cáo khoa học: "Tagging Urdu Text with Parts of Speech: A Tagger Comparison"
Tìm kiếm theo từ khóa liên quan:
Tagging Urdu Text Parts of Speech A Tagger Comparison scientific reports model language process natural languageGợi ý tài liệu liên quan:
-
Báo cáo khoa học: Parsing in the Ahsmmeeofa Comldete Lexicon
2 trang 22 0 0 -
9 trang 21 0 0
-
Báo cáo khóa học: The structure–function relationship in the clostripain family of peptidases
10 trang 20 0 0 -
Báo cáo khoa học: Are UV-induced nonculturable Escherichia coli K-12 cells alive or dead?
7 trang 20 0 0 -
Báo cáo khoa học: Programmed cell death Apoptosis and alternative deathstyles
13 trang 19 0 0 -
63 trang 19 0 0
-
10 trang 18 0 0
-
Báo cáo khoa học: Calcium-dependent mitochondrial function and dysfunction in neurons
15 trang 18 0 0 -
Báo cáo khoa học: Novel cathelicidin-derived antimicrobial peptides from Equus asinus
11 trang 18 0 0 -
Từ loại trong tiếng Anh (Parts of Speech)
11 trang 18 0 0