Danh mục

BÁO CÁO ĐỀ TÀI SINH NGÔN NGỮ TỰ NHIÊN

Số trang: 32      Loại file: docx      Dung lượng: 962.87 KB      Lượt xem: 11      Lượt tải: 0    
10.10.2023

Hỗ trợ phí lưu trữ khi tải xuống: 16,000 VND Tải xuống file đầy đủ (32 trang) 0
Xem trước 4 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong những năm gần đây, công nghệ thông tin phát triển như vũ bão, đóng vai trò ngày càng quan trọng trong đời sống xã hội.Trí tuệ nhân tạo và đặc biệt là xử lý ngôn ngữ tự nhiên được nghiên cứu rộng rãi mang lại nhiều ứng dụng quan trọng trong đời sống. Trong đó sinh ngôn ngữ tự nhiên là một lĩnh vực nổi bật có khả năng tạo ra những hệ thống đáp ứng người sử dụng như chính ngôn ngữ con người nó ra. Chính vì những lợi ích to lớn mà nó mang lại, trong...
Nội dung trích xuất từ tài liệu:
BÁO CÁO ĐỀ TÀI SINH NGÔN NGỮ TỰ NHIÊN Đại học Quốc gia Hà Nội Khoa Công nghệ thông tin BÁO CÁO ĐỀ TÀISINH NGÔN NGỮ TỰ NHIÊN GVHD: tiến sĩ Lê Anh CườngBÁO CÁOSINH NGÔN NGỮ TỰ NHIÊNNhóm 8:Nguyễn Trung HiếuTrương Quý QuỳnhHoàng Đình TiếnGiảng viên: Lê Anh CườngLỜI MỞ ĐẦUTrong những năm gần đây, công nghệ thông tin phát triển như vũ bão, đóng vai tròngày càng quan trọng trong đời sống xã hội.Trí tuệ nhân tạo và đặc biệt là xử lýngôn ngữ tự nhiên được nghiên cứu rộng rãi mang lại nhiều ứng dụng quan trọngtrong đời sống. Trong đó sinh ngôn ngữ tự nhiên là một lĩnh vực nổi bật có khảnăng tạo ra những hệ thống đáp ứng người sử dụng như chính ngôn ngữ con ngườinó ra. Chính vì những lợi ích to lớn mà nó mang lại, trong bài tập lớn môn xử lýngôn ngữ tự nhiên, nhóm 8 đã chọn chủ đề này nhằm làm rõ những kiến thức cơbản để xây dựng một hệ thống sinh ngôn ngữ tự nhiên và sử dụng những kiến thứcđã đạt được để xây dựng một chương trình sinh ngôn ngữ tự nhiên về tổng kết vàđánh giá của những người sử dụng điện thoại.Nhóm 8 xin gửi lời cảm ơn chân thành nhất tới thầy giáo – tiến sĩ Lê Anh Cường,thầy là giảng viên môn Xử lý ngôn ngữ tự nhiên , Khoa Công nghệ thông tin – Đạihọc Công nghệ - Đại học Quốc gia Hà Nội. Trong suốt quá trình thực hiện bài tậplớn này, thầy đã có những chỉ dẫn tận tình, hết lòng chỉ bảo để cả nhóm có thểhoàn thành được bài tập lớn này.MỤC LỤCChương I: Tổng quan về sinh ngôn ngữ tự nhiên1. Bài toán sinh ngôn ngữ tự nhiên1.1. Khái niệm1.2. Ứng dụngChương II: Cấu trúc hệ thống sinh ngôn ngữ tự nhiên2. Cấu trúc hệ thống sinh ngôn ngữ tự nhiên2.1. Document planning2.1.1. Cấu trúc của document planning2.1.1.1. Cấu trúc của document planning2.1.1.2. Nhiệm vụ của document planning2.1.1.3. Input và Output của document planning2.1.2. Biểu diễn thông tin2.1.2.1. Mô hình biểu diễn thông tin2.1.2.2. Định nghĩa các thông điệp2.1.2.3. Phương pháp mô hình hóa thông tin và định nghĩa các thông điệp2.1.2.4. Quyết định nội dung (Content Determination)2.1.2.5. Thu thập các luật để quyết định nội dung2.1.3. Cấu trúc văn bản từ các thông điệp2.1.3.1. Quan hệ diễn ngôn (Discourse Relation)2.1.3.2. Tiếp cận giản đồ (Schema)2.2. Micro Planning2.2.1. Từ vựng hóa (Lexicalisation)2.2.2. Ghép câu (Sentence Aggregation)2.3. Trình bày văn bản (Surface Realisation)Chương III: Thử nghiệm xây dựng hệ thống sinh ngôn ngữ tự nhiênChương I: Tổng quan về sinh ngôn ngữ tự nhiên1. Bài toán sinh ngôn ngữ tự nhiên1.1. Khái niệm Sinh ngôn ngữ tự nhiên (Natural Language Generation – viết tắt là NLG) làmột lĩnh vực con của trí tuệ nhân tạo và ngôn ngữ học máy tính liên quan tới việcxây dựng một hệ thống máy tính có thể sản sinh ra văn bản bằng tiếng Anh hoặcnhững ngôn ngữ loài người khác từ những biểu diễn phi ngữ nghĩa của thông tin. Mục tiêu của hệ thống sinh ngôn ngữ tự nhiên là tạo ra các văn bản có thểhiểu được bằng ngôn ngữ loài người bởi vậy, nó cần nguồn tri thức từ loại ngônngữ mà hệ thống sử dụng cũng như những kiến thức thuộc lĩnh vực mà hệ thống sẽsản sinh. Đầu vào của hệ thống sinh ngôn ngữ tự nhiên là các dạng phi ngữ nghĩacủa thông tin: mẩu tin, bảng biểu, số liệu. Đầu ra là những câu, văn bản có ý nghĩanhất định bằng ngôn ngữ con người, chứa thông tin ở đầu vào.1.2. Ứng dụngSinh ngôn ngữ tự nhiên cần thiết trong các hệ thống tương tác người máy, một vàiứng dụng quan trọng có thể kể đến:- Ứng dụng sinh ra tài liệu tự động. Ví dụ: dự báo thời tiết, báo cáo mô phỏng, thư tín,...- Ứng dụng biểu diễn thông tin tới người dùng bằng cách có thể hiểu được. Ví dụ: bản ghi y khoa, lập luận hệ thống chuyên gia….- Ứng dụng giảng dạy. Ví dụ: hệ thống cung cấp thông tin cho sinh viên.- Ứng dụng giải trí. Ví dụ: truyện cười, thơ văn,…Chương II: Cấu trúc hệ thống sinh ngôn ngữ tựnhiên2. Cấu trúc của một hệ thống sinh ngôn ngữ tự nhiênMô hình cấu trúc của một hệ thống sinh ngôn ngữ tự nhiênBa giai đoạn cần tiến hành trong hệ thống sinh ngôn ngữ tự nhiên là “DocumentPlan”, “Micro plan” và “Surface realisation”. - Quyết định nội dung Document Plan - Cấu trúc văn bản - Tập hợp câu Micro Plan - Từ vựng hóa - Sinh từ/cụm từ quy chiếu Surface Realisation - Thể hiện ngôn ngữ.2.1. Document planning2.1.1. Cấu trúc của document planning2.1.1.1. Cấu trúc của document planningCấu trúc của phần “Document Planning” bao gồm 3 công việc là: - Mô hình hóa miền phục vụ (Domain Modeling). - Quyết định nội dung (Content Determination). - Cấu trúc tài liệu (Document Structuring). Domain ModelingDocument Planning Content Determination Document Structuring2.1.1.2. Nhiệm vụ của document planning“Document planning” hay ...

Tài liệu được xem nhiều: