Luận văn:Nghiên cứu và phát triển các công cụ xử lý tiếng Việt trên UIMA
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Luận văn:Nghiên cứu và phát triển các công cụ xử lý tiếng Việt trên UIMA ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI -------- Nguyễn Đức NamNghiên cứu và phát triển các công cụ xử lý tiếng Việt trên UIMA KHÓA LUẬN TỐT NGHIỆP HỆ CHÍNH QUY Ngành: Công Nghệ Thông Tin Hà Nội – 2010 ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI -------- Nguyễn Đức NamNghiên cứu và phát triển các công cụ xử lý tiếng Việt trên UIMA KHÓA LUẬN TỐT NGHIỆP HỆ CHÍNH QUY Công Nghệ Thông Tin Ngành: GV hướng dẫn: TS. Phạm Bảo Sơn Hà Nội – 2010Nghiên cứu, phát triển các công cụ xử lý tiếng Việt trên UIMA Nguyễn Đức NamLời cảm ơn Trước tiên, em xin gửi lời cảm ơn sâu sắc nhất đến thầy Phạm Bảo Sơn, ngườiđã không quản vất vả hướng dẫn em trong suốt thời gian làm khóa luận tốt nghiệp vừaqua. Em cũng xin chân thành cảm ơn anh Nguyễn Quốc Đại đã luôn chỉ bảo và giảiđáp vướng mắc cho em trong quá trình làm khóa luận. Em xin bày tỏ lời cảm ơn sâu sắc đến các thầy cô giáo trong Trường Đại HọcCông Nghệ đã tận tình dạy dỗ em suốt bốn năm học qua. Tôi xin cảm ơn tập thể phòng HMI những người luôn động viên và cho tôinhững lời khuyên có ích trong quá trình làm khóa luận. Xin cảm ơn những người bạn luôn ở bên cạnh quan tâm, ủng hộ và động viêntôi. Con xin cảm ơn bố, mẹ và gia đình đã luôn bên con, cho con động lực để làmviệc tốt hơn. Hà Nội, ngày 20 tháng 5 năm 2010 Nguyễn Đức Nam iNghiên cứu, phát triển các công cụ xử lý tiếng Việt trên UIMA Nguyễn Đức NamLời mở đầuKiến trúc xử lý thông tin phi cấu trúc (Unstructured Information ManagementArchitecture - UIMA) giúp phân tích nguồn thông tin không có cấu trúc thành nhữngthông tin có cấu trúc mang giá trị cao. Kiến trúc này linh hoạt và hiệu quả trong việcghép nối giải pháp nhỏ thành một công cụ lớn hơn, hoàn thiện hơn. Chúng tôi tận dụngnhững đặc điểm này để xây dựng công cụ phân tích tiếng Việt bằng cách tích hợp cáccông cụ xử lý tiếng Việt có sẵn lên UIMA và đưa ra một số phương hướng để pháttriển chúng. iiNghiên cứu, phát triển các công cụ xử lý tiếng Việt trên UIMA Nguyễn Đức NamMục lụcLời cảm ơn .............................................................................................................................................................. iLời mở đầu ............................................................................................................................................................. iiMục lục .................................................................................................................................................................. iiiDanh sách hình vẽ .................................................................................................................................................. vDanh sách thuật ngữ ............................................................................................................................................ viChương 1: Giới thiệu ............................................................................................................................................. 1Chương 2: Tổng quan kiến trúc xử lý thông tin phi cấu trúc ............................................................................ 3 2.1 Giới thiệu UIMA ........................................................................................................................................ 3 2.2 Nền tảng phân tích .................................................................................................................................... 6 2.2.1 Hệ thống kiểu và chú giải ................................................................................................................. 9 2.2.2 Máy phân tích ................................................................................................................................. 10 2.2.3 Bộ miêu tả XML .............................................................................................................................. 15 2.3 Mô tả đối tượng trong tài liệu ................................................................................................................. 17 2.4 Xây dựng ứng dụng và xử lý tập tài liệu ................................................................................................. 17 2.4.1 Tương tác giữa ứng dụng và UIMA ................................................................................................. 18 2.4.2 Giới thiệu máy xử lý tập tài liệu....................................................................................................... 20 2.4.3 Quản lý xử lý tập tài liệu .................................................................................................................. 21 2.5 Khai thác kết quả phân tích .................................................................................................................... 21 2.5.1 Tìm kiếm ngữ nghĩa ......................................................................................................................... 22 2.5.2 Cơ sở dữ liệu .................................................................................................................................... 22 2.6 Xử lý đa phương tiện........... ...
Tìm kiếm theo từ khóa liên quan:
luận văn công nghệ thông tin công cụ xử lý tiếng Việt xử lý thông tin phi cấu trúc cơ sở dữ liệu đa phương tiệnTài liệu cùng danh mục:
-
Báo cáo thực tập: Đề tài thiết kế Web
77 trang 551 2 0 -
Tóm tắt Đồ án tốt nghiệp Công nghệ thông tin: Lập trình game với ứng dụng Unity
16 trang 455 0 0 -
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 454 1 0 -
52 trang 408 1 0
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 348 1 0 -
24 trang 347 1 0
-
Chuyên đề: Nghiên cứu Ngôn ngữ hình thức, Văn phạm phi ngữ cảnh và Automata đẩy xuống
84 trang 347 0 0 -
Đồ án tốt nghiệp: Xe điều khiển từ xa thông qua Smartphone
23 trang 340 0 0 -
Tóm tắt Đồ án tốt nghiệp Công nghệ thông tin: Xây dựng game 2D trên Unity
21 trang 332 1 0 -
88 trang 314 0 0
Tài liệu mới:
-
Khảo sát tình trạng dinh dưỡng trước mổ ở người bệnh ung thư đại trực tràng
9 trang 21 0 0 -
94 trang 19 0 0
-
Tham vấn Thanh thiếu niên - ĐH Mở Bán công TP Hồ Chí Minh
276 trang 20 0 0 -
Kết hợp luân phiên sóng T và biến thiên nhịp tim trong tiên lượng bệnh nhân suy tim
10 trang 19 0 0 -
Đề thi giữa học kì 1 môn Ngữ văn lớp 9 năm 2024-2025 có đáp án - Trường THCS Nguyễn Trãi, Thanh Khê
14 trang 21 0 0 -
Đánh giá hiệu quả giải pháp phát triển thể chất cho sinh viên Trường Đại học Kiến trúc Hà Nội
8 trang 20 0 0 -
Tỉ lệ và các yếu tố liên quan đoạn chi dưới ở bệnh nhân đái tháo đường có loét chân
11 trang 20 0 0 -
39 trang 19 0 0
-
Đề thi học kì 1 môn Tiếng Anh lớp 6 năm 2024-2025 có đáp án - Trường TH&THCS Quang Trung, Hội An
6 trang 19 1 0 -
Tôm ram lá chanh vừa nhanh vừa dễRất dễ làm, nhanh gọn mà lại ngon. Nhà mình
7 trang 19 0 0