Danh mục

Báo cáo khoa học: Lexicalization in Crosslinguistic Probabilistic Parsing: The Case of French

Số trang: 8      Loại file: pdf      Dung lượng: 105.43 KB      Lượt xem: 8      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

This paper presents the first probabilistic parsing results for French, using the recently released French Treebank. We start with an unlexicalized PCFG as a baseline model, which is enriched to the level of Collins’ Model 2 by adding lexicalization and subcategorization. The lexicalized sister-head model and a bigram model are also tested, to deal with the flatness of the French Treebank. The bigram model achieves the best performance: 81% constituency F-score and 84% dependency accuracy. All lexicalized models outperform the unlexicalized baseline, consistent with probabilistic parsing results for English, but contrary to results for German, where lexicalization has only...
Nội dung trích xuất từ tài liệu:
Báo cáo khoa học: "Lexicalization in Crosslinguistic Probabilistic Parsing: The Case of French"

Tài liệu được xem nhiều:

Tài liệu cùng danh mục:

Tài liệu mới: