Báo cáo khoa học: Profiting from Mark-Up: Hyper-Text Annotations for Guided Parsing'
Số trang: 10
Loại file: pdf
Dung lượng: 199.35 KB
Lượt xem: 5
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
We show how web mark-up can be used to improve unsupervised dependency parsing. Starting from raw bracketings of four common HTML tags (anchors, bold, italics and underlines), we refine approximate partial phrase boundaries to yield accurate parsing constraints. Conversion procedures fall out of our linguistic analysis of a newly available million-word hyper-text corpus. We demonstrate that derived constraints aid grammar induction by training Klein and Manning’s Dependency Model with Valence (DMV) on this data set: parsing accuracy on Section 23 (all sentences) of the Wall Street Journal corpus jumps to 50.4%, beating previous state-of-theart by more than 5%. ...
Nội dung trích xuất từ tài liệu:
Báo cáo khoa học: "Profiting from Mark-Up: Hyper-Text Annotations for Guided Parsing
Nội dung trích xuất từ tài liệu:
Báo cáo khoa học: "Profiting from Mark-Up: Hyper-Text Annotations for Guided Parsing
Tìm kiếm theo từ khóa liên quan:
Profiting from Mark-Up Hyper-Text Annotations Guided Parsing báo cáo khoa học báo cáo ngôn ngữ ngôn ngữ tự nhiênGợi ý tài liệu liên quan:
-
63 trang 287 0 0
-
13 trang 261 0 0
-
Báo cáo khoa học Bước đầu tìm hiểu văn hóa ẩm thực Trà Vinh
61 trang 247 0 0 -
Tóm tắt luận án tiến sỹ Một số vấn đề tối ưu hóa và nâng cao hiệu quả trong xử lý thông tin hình ảnh
28 trang 217 0 0 -
Đề tài nghiên cứu khoa học và công nghệ cấp trường: Hệ thống giám sát báo trộm cho xe máy
63 trang 186 0 0 -
Đề tài nghiên cứu khoa học: Tội ác và hình phạt của Dostoevsky qua góc nhìn tâm lý học tội phạm
70 trang 185 0 0 -
NGHIÊN CỨU CHỌN TẠO CÁC GIỐNG LÚA CHẤT LƯỢNG CAO CHO VÙNG ĐỒNG BẰNG SÔNG CỬU LONG
9 trang 185 0 0 -
98 trang 170 0 0
-
96 trang 166 0 0
-
SỨC MẠNH CHÍNH TRỊ CỦA LIÊN MINH CHÂU ÂU TRÊN TRƯỜNG QUỐC TẾ
4 trang 162 0 0