Danh mục

Luận văn Thạc sĩ Hệ thống thông tin: Nhận diện tên riêng tiếng Việt bằng phương pháp học sâu

Số trang: 74      Loại file: pdf      Dung lượng: 2.83 MB      Lượt xem: 9      Lượt tải: 0    
tailieu_vip

Xem trước 8 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu nghiên cứu của luận văn "Nhận diện tên riêng tiếng Việt bằng phương pháp học sâu" là xây dựng một hệ thống nhận diện tên riêng tiếng Việt sử dụng phương pháp học sâu mạng nơ ron ngắn dài song song BiLSTM của kiến trúc học sâu Deeplearning với sự hỗ trợ của ma trận được huấn luyện sẵn trước của tiếng Việt và các công cụ trích xuất đặc trưng.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Hệ thống thông tin: Nhận diện tên riêng tiếng Việt bằng phương pháp học sâu UBND TỈNH BÌNH DƢƠNG TRƢỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN ANH DŨNGNHẬN DIỆN TÊN RIÊNG TIẾNG VIỆT BẰNG PHƢƠNG PHÁP HỌC SÂU LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8480104 NGƢỜI HƢỚNG DẪN KHOA HỌC TS. BÙI THANH HÙNG BÌNH DƢƠNG - 2019 LỜI CAM ĐOAN Tôi là Nguyễn Anh Dũng, học viên lớp CH16HT, ngành Hệ thống thông tin,trường Đại học Thủ Dầu Một. Tôi cam đoan, luận văn của tôi với đề tài ―Nhận diệntên riêng tiếng Việt bằng phương pháp học sâu‖ là do tôi tìm hiểu, nghiên cứu vàđược sự hướng dẫn tận tình của TS. Bùi Thanh Hùng, luận văn này của tôi có thamkhảo từ các bài báo, tài liệu, công trình nghiên cứu của người khác nhưng tôi đềughi rõ trong tài liệu tham khảo. Tôi xin chịu trách nhiệm về lời cam đoan này. Bình Dương, ngày 01 tháng 6 năm 2019 Người viết luận văn Nguyễn Anh Dũng ii LỜI CẢM ƠN Trong quá trình thực hiện luận văn ―Nhận diện tên riêng tiếng Việt bằngphương pháp học sâu‖, tôi đã được sự hướng dẫn nhiệt tình của TS. Bùi ThanhHùng. Thầy đã dành rất nhiều thời gian quý báu của mình để hướng dẫn chi tiết,nghe báo cáo thử và động viên tinh thần tôi trong những lúc khó khăn khi thực hiệnluận văn. Tôi chân thành cảm ơn thầy! Tôi cũng bày tỏ lòng biết ơn sâu sắc đến các thầy cô đã giảng dạy tôi tận tình,truyền đạt những kiến thức bổ ích cho tôi trong suốt thời gian học tại trường và cácthầy cô của trường Đại học Thủ Dầu Một đã tạo điều kiện tốt nhất để tôi hoàn thànhluận văn này. Cuối cùng, tôi cũng gửi lời cảm ơn đến gia đình, đồng nghiệp, các anh chịhọc chung lớp đã đoàn kết, giúp đỡ, động viên tôi trong suốt thời gian học vừa qua. Một lần nữa, tôi xin trân trọng cảm ơn. Bình Dương, ngày tháng năm 2019 Người viết luận văn iii MỤC LỤCMỤC LỤC ................................................................................................................ IVTÓM TẮT LUẬN VĂN .............................................................................................1DANH MỤC TỪ VIẾT TẮT ......................................................................................2DANH MỤC CÁC BẢNG..........................................................................................3DANH MỤC HÌNH VẼ, ĐỒ THỊ ..............................................................................4CHƢƠNG I. GIỚI THIỆU CHUNG ..........................................................................61.1. LÍ DO THỰC HIỆN ĐỀ TÀI .......................................................................................61.2. MỤC TIÊU NGHIÊN CỨU .........................................................................................71.3. ĐỐI TƢỢNG, PHẠM VI NGHIÊN CỨU .......................................................................71.4. PHƢƠNG PHÁP NGHIÊN CỨU ..................................................................................71.5. Ý NGHĨA KHOA HỌC VÀ Ý NGHĨA THỰC TIỄN CỦA ĐỀ TÀI .....................................7 1.5.1. Ý nghĩa khoa học...........................................................................................7 1.5.2. Ý nghĩa thực tiễn ...........................................................................................81.6. BỐ CỤC LUẬN VĂN ................................................................................................9CHƢƠNG II. CƠ SỞ LÝ THUYẾT .........................................................................112.1. XỬ LÝ NGÔN NGỮ TỰ NHIÊN ...............................................................................11 2.1.1. Tách từ (Tokenizer) .....................................................................................12 2.1.2. Xác định loại từ trong câu (Part-of-Speech tagging - POS tagging) .........14 2.1.3. Xác định cụm từ (Chunking) .......................................................................15 2.1.4. Phân tích cú pháp (Parsing) .......................................................................172.2. CÁC PHƢƠNG PHÁP BIỂU DIỄN TỪ DƢỚI DẠNG VÉC TƠ .......................................18 2.2.1. Biểu diễn túi từ - Bag of words ...................................................................18 2.2.2 Biểu diễn One-hot-vector .............................................................................19 2.2.3. Túi từ liên tục - CBO ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: