Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Tóm tắt văn bản sử dụng các kỹ thuật trong deep learning
Số trang: 24
Loại file: pdf
Dung lượng: 1.42 MB
Lượt xem: 25
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bố cục luận văn được chia thành 6 chương tình bày về: Giới thiệu bài toán tóm tắt văn bản. Trình bày khái niệm và các phương pháp tiếp cận cho bài toán; cơ sở lý thuyết, trình bày những khái niệm và mô hình trong học sâu; mô hình đề xuất, trình bày cơ chế attention cùng thuật toán tìm kiếm chùm và áp dụng vào mô hình đề xuất; thực nghiệm và đánh giá, trình bày quá trình thử nghiệm và đưa ra một số đánh giá, nhận xét
cùng kết quả đạt được.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Tóm tắt văn bản sử dụng các kỹ thuật trong deep learning TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI ĐOÀN XUÂN DŨNG TÓM TẮT VĂN BẢN SỬ DỤNG CÁC KỸ THUẬT TRONG DEEP LEARNING Ngành: Công Nghệ Thông Tin Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 8480101.01 TÓM TẮT LUẬN VĂN THẠC SỸ NGÀNH CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Xuân Hoài HÀ NỘI – 2018 MỤC LỤC Mở đầu .......................................................................................................................................................... 1 Chương 1: Giới thiệu tóm tắt văn bản........................................................................................................... 2 Chương 2: Cơ sở lý thuyết ............................................................................................................................ 3 2.1. Mạng nơ-ron ................................................................................................................................. 3 2.2. Mô hình RNN ............................................................................................................................... 4 2.3. Mạng LSTM, GRU ....................................................................................................................... 4 2.3.1. Mạng LSTM.......................................................................................................................... 4 2.3.2. Mạng GRU ............................................................................................................................ 5 2.4. Mạng nơ-ron tích chập .................................................................................................................. 7 Chương 3: Mô hình đề xuất .......................................................................................................................... 9 3.1. Cơ chế Attention ................................................................................................................................ 9 3.1.1. Kiến trúc RNN Encoder-Decoder ............................................................................................... 9 3.1.2. Cơ chế Attention ................................................................................................................. 10 3.1.3. BiRNN ................................................................................................................................ 11 3.2. Thuật toán tìm kiếm chùm (Beam search) .................................................................................. 12 3.3. Mô hình đề xuất .......................................................................................................................... 14 Chương 4: Thực nghiệm và đánh giá .......................................................................................................... 15 4.1. Dữ liệu thử nghiệm ..................................................................................................................... 15 4.1.1. Bộ dữ liệu Gigaword ........................................................................................................... 15 4.1.2. Bộ dữ liệu CNN/Daily Mail ................................................................................................ 16 4.2. Cài đặt ......................................................................................................................................... 16 4.3. Kết quả ........................................................................................................................................ 17 4.3.1. Bộ dữ liệu Gigaword ........................................................................................................... 17 4.3.2. Bộ dữ liệu CNN/Daily Mail ................................................................................................ 19 Kết luận ....................................................................................................................................................... 20 Tài liệu tham khảo ...................................................................................................................................... 21 1 Mở đầu Ngày nay, con người đang bước vào kỷ nguyên của cách mạng công nghiệp 4.0, chúng ta phải đối mặt với lượng thông tin khổng lồ trên mạng Internet. Do đó nhu cầu tóm tắt thông tin đối với mỗi văn bản là vô cùng cấp thiết. Tóm tắt văn bản là phương pháp rút gọn lại một lượng lớn các thông tin thành một bản tóm tắt ngắn gọn bởi sự lựa chọn những thông tin quan trọng và bỏ qua các thông tin dư thừa. Thông thường tóm tắt văn bản có thể chia thành tóm tắt trích chọn (extractive summarization) và tóm tắt tóm lược (abstractive summarization). Tóm tắt trích chọn đưa ra sự tóm tắt bằng việc chọn một tập các câu trong văn bản ban đầu. Ngược lại, tóm tắt tóm lược đưa ra thông tin được ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Tóm tắt văn bản sử dụng các kỹ thuật trong deep learning TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI ĐOÀN XUÂN DŨNG TÓM TẮT VĂN BẢN SỬ DỤNG CÁC KỸ THUẬT TRONG DEEP LEARNING Ngành: Công Nghệ Thông Tin Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 8480101.01 TÓM TẮT LUẬN VĂN THẠC SỸ NGÀNH CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Xuân Hoài HÀ NỘI – 2018 MỤC LỤC Mở đầu .......................................................................................................................................................... 1 Chương 1: Giới thiệu tóm tắt văn bản........................................................................................................... 2 Chương 2: Cơ sở lý thuyết ............................................................................................................................ 3 2.1. Mạng nơ-ron ................................................................................................................................. 3 2.2. Mô hình RNN ............................................................................................................................... 4 2.3. Mạng LSTM, GRU ....................................................................................................................... 4 2.3.1. Mạng LSTM.......................................................................................................................... 4 2.3.2. Mạng GRU ............................................................................................................................ 5 2.4. Mạng nơ-ron tích chập .................................................................................................................. 7 Chương 3: Mô hình đề xuất .......................................................................................................................... 9 3.1. Cơ chế Attention ................................................................................................................................ 9 3.1.1. Kiến trúc RNN Encoder-Decoder ............................................................................................... 9 3.1.2. Cơ chế Attention ................................................................................................................. 10 3.1.3. BiRNN ................................................................................................................................ 11 3.2. Thuật toán tìm kiếm chùm (Beam search) .................................................................................. 12 3.3. Mô hình đề xuất .......................................................................................................................... 14 Chương 4: Thực nghiệm và đánh giá .......................................................................................................... 15 4.1. Dữ liệu thử nghiệm ..................................................................................................................... 15 4.1.1. Bộ dữ liệu Gigaword ........................................................................................................... 15 4.1.2. Bộ dữ liệu CNN/Daily Mail ................................................................................................ 16 4.2. Cài đặt ......................................................................................................................................... 16 4.3. Kết quả ........................................................................................................................................ 17 4.3.1. Bộ dữ liệu Gigaword ........................................................................................................... 17 4.3.2. Bộ dữ liệu CNN/Daily Mail ................................................................................................ 19 Kết luận ....................................................................................................................................................... 20 Tài liệu tham khảo ...................................................................................................................................... 21 1 Mở đầu Ngày nay, con người đang bước vào kỷ nguyên của cách mạng công nghiệp 4.0, chúng ta phải đối mặt với lượng thông tin khổng lồ trên mạng Internet. Do đó nhu cầu tóm tắt thông tin đối với mỗi văn bản là vô cùng cấp thiết. Tóm tắt văn bản là phương pháp rút gọn lại một lượng lớn các thông tin thành một bản tóm tắt ngắn gọn bởi sự lựa chọn những thông tin quan trọng và bỏ qua các thông tin dư thừa. Thông thường tóm tắt văn bản có thể chia thành tóm tắt trích chọn (extractive summarization) và tóm tắt tóm lược (abstractive summarization). Tóm tắt trích chọn đưa ra sự tóm tắt bằng việc chọn một tập các câu trong văn bản ban đầu. Ngược lại, tóm tắt tóm lược đưa ra thông tin được ...
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Công nghệ thông tin Phương pháp tiếp cận Mô hình học sâu Mô hình đề xuấtTài liệu liên quan:
-
52 trang 432 1 0
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 365 5 0 -
97 trang 330 0 0
-
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 319 0 0 -
97 trang 313 0 0
-
74 trang 303 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 302 0 0 -
96 trang 297 0 0
-
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 291 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 284 0 0