Luận án Tiến sĩ Toán học: Nghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục
Số trang: 130
Loại file: pdf
Dung lượng: 3.54 MB
Lượt xem: 14
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận án "Nghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục" với mục tiêu nghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục nghiên cứu các vấn đề trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục, và nghiên cứu các vấn đề về mô hình thanh điệu cho tiếng Việt. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Toán học: Nghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tụcBỘ GIÁO DỤC VÀO ĐÀO TẠOVIỆN HÀN LÂMKHOA HỌC VÀ CÔNG NGHỆ VNHỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆHọ và tên tác giả luận ánNGUYỄN VĂN HUYTÊN ĐỀ TÀI LUẬN ÁNNghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việttừ vựng lớn phát âm liên tụcLUẬN ÁN TIẾN SĨ: TOÁN HỌCHÀ NỘI – 2016BỘ GIÁO DỤC VÀO ĐÀO TẠOVIỆN HÀN LÂMKHOA HỌC VÀ CÔNG NGHỆ VNHỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆHọ và tên tác giả luận ánNGUYỄN VĂN HUYTÊN ĐỀ TÀI LUẬN ÁNNghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việttừ vựng lớn phát âm liên tụcChuyên ngành:Cơ sở toán học cho tin họcMã số:62460110LUẬN ÁN TIẾN SĨ: TOÁN HỌCNGƢỜI HƢỚNG DẪN KHOA HỌC:1. PGS. TS. LƢƠNG CHI MAI2. TS. VŨ TẤT THẮNGHÀ NỘI – 2016Lời nói đầuCác kỹ thuật nhận dạng tiếng nói đã đang rất phát triển, đặc biệt với một sốngôn ngữ phổ dụng như Anh, Pháp, Trung Quốc,… Những yếu tố chính ảnh hưởngđến chất lượng của một hệ thống nhận dạng tiếng nói như: Người nói, tốc độ nói, hoàncảnh nói, nhiễu, kích thước từ điển, cách thức phát âm,… tuy nhiên hiện nay vẫn chưacó một giải pháp nào hoàn thiện giải quyết tất cả các yếu tố đó. Các phương pháp cơbản thường được sử dụng cho nhận dạng tiếng nói là: Kỹ thuật so khớp mẫu, mạngnơron, phương pháp dựa trên tri thức và mô hình Markov ẩn. Trong đó phương phápsử dụng mô hình Markov ẩn (Hidden Markov Model HMM) được sử dụng phổ biếnnhất.Đối với tiếng Việt hiện nay vẫn chưa có nhiều nghiên cứu về nhận dạng. Cáccông việc nghiên cứu mới đang ở những bài toán cơ bản. Tiếng Việt là một ngôn ngữcó thanh điệu, vì thế ngoài những khó khăn gặp phải tương tự như việc nhận dạng cácngôn ngữ không có thanh điệu khác (Anh, pháp,…), nhận dạng tiếng Việt còn phảinghiên cứu vấn đề nhận dạng thanh điệu. Tiếng Việt có sáu thanh điệu, một cách tổngquát có thể coi như mỗi âm tiết sẽ có thể có sáu ý nghĩa khác nhau khi ghép tương ứngvới sáu thanh điệu đó. Việc nhận dạng thanh điệu là một công việc khó do thanh điệuchỉ tồn tại ở vùng âm hữu thanh. Vì thế đường đặc tính của nó không liên tục khichuyển tiếp giữa hai vùng hữu thanh và vô thanh. Các đặc trưng được sử dụng phổbiến trong nhận dạng tiếng nói như MFCC (Mel Frequency Cepstral Coefficient) vàPLP (Perceptual Linear Prediction) lại không mô tả được các đặc tính của thanh điệu,do vậy trước khi nhận dạng được thanh điệu ta phải áp dụng các kỹ thuật tính toán đặctrưng thanh điệu trong tín hiệu tiếng nói.Các nghiên cứu hiện nay về nhận dạng thanh điệu tiếng Việt cũng mới chỉ ởnhững bước đầu tiên và chủ yếu áp dụng cho tiếng nói rời rạc, có lượng từ vựng nhỏcỡ vài trăm từ. Các giải pháp chủ yếu là phát triển từ các nghiên cứu trên các ngôn ngữcó thanh điệu khác như Mandarin, Thái,…, vì vậy việc nghiên cứu một giải pháp nhậndạng tiếng Việt từ vựng lớn phát âm liên tục thực sự là một vấn đề cấp thiết cả về tínhkhoa học và kinh tế.Từ các lý do cấp thiết này tôi đã chọn đề tài “Nghiên cứu mô hình thanh điệutrong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục”. Với mục tiêu chính lànghiên cứu các vấn đề trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục, vànghiên cứu các vấn đề về mô hình thanh điệu cho tiếng Việt.Nội dung chính của luận án được trình bày thành 5 chương với nội dung nhưsau:1-Chương 1: Giới thiệu tổng quan về nhận dạng tiếng nói và ứng dụng. Cấutrúc tổng quan của một hệ thống nhận dạng tiếng nói cơ bản. Tình hìnhnghiên cứu tổng quan về nhận dạng tiếng nói chung và nhận dạng tiếng Việtnói riêng. Giới thiệu các mục tiêu và phạm vi nghiên cứu chính của luận án.-Chương 2: Trình bày tổng quan về cấu trúc ngữ âm tiếng Việt. Mô hìnhnhận dạng tiếng Việt từ vựng lớn phát âm liên tục có thanh điệu. Dữ liệu và-các công cụ sử dụng để cài đặt các thử nghiệm. Hệ thống nhận dạng cơ sở.Chương 3: Trình bày mô hình thanh điệu cho nhận dạng tiếng Việt từ vựnglớn phát âm liên tục sử dụng MSD-HMM. Bao gồm quy trình tính toán đặctrưng thanh điệu, cấu hình mô hình và huấn luyện.-Chương 4: Trình bày phương pháp tăng cường đặc trưng ngữ âm sử dụngmạng nơron cho nhận dạng tiếng Việt, bao gồm quy trình gán nhãn, huấnluyện mạng, tối ưu mạng, trích chọn đặc trưng Bottleneck và cài đặt thử-nghiệm.Chương 5: Trình bày phương pháp tăng cường đặc trưng thanh điệu với đặctrưng cải tiến Tonal-Bottleneck sử dụng mạng nơron. Bao gồm phương phápgán nhãn thanh điệu, tối ưu mạng, tính toán đặc trưng và cài đặt thử nghiệm.Tôi xin được gửi lời cảm ơn chân thành đến Bộ Giáo dục và Đào tạo, ViệnCông nghệ Thông tin – Viện Hàn lâm Khoa học và Công nghệ Việt Nam, trường ĐHKỹ thuật Công nghiệp Thái Nguyên – ĐH Thái Nguyên đã tạo điều kiện thuận lợi chotôi hoàn thành đề tài nghiên cứu sinh này. Xin được gửi lời cảm ơn chân thành đếnViện công nghệ Karlshuhe – Đức, Viện Công nghệ Thông tin quốc gia Nhật Bản đãtạo điều kiện và hỗ trợ cả về mặt khoa học lẫn thiết bị cho tôi để thực hiện các thửngh ...
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Toán học: Nghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tụcBỘ GIÁO DỤC VÀO ĐÀO TẠOVIỆN HÀN LÂMKHOA HỌC VÀ CÔNG NGHỆ VNHỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆHọ và tên tác giả luận ánNGUYỄN VĂN HUYTÊN ĐỀ TÀI LUẬN ÁNNghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việttừ vựng lớn phát âm liên tụcLUẬN ÁN TIẾN SĨ: TOÁN HỌCHÀ NỘI – 2016BỘ GIÁO DỤC VÀO ĐÀO TẠOVIỆN HÀN LÂMKHOA HỌC VÀ CÔNG NGHỆ VNHỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆHọ và tên tác giả luận ánNGUYỄN VĂN HUYTÊN ĐỀ TÀI LUẬN ÁNNghiên cứu mô hình thanh điệu trong nhận dạng tiếng Việttừ vựng lớn phát âm liên tụcChuyên ngành:Cơ sở toán học cho tin họcMã số:62460110LUẬN ÁN TIẾN SĨ: TOÁN HỌCNGƢỜI HƢỚNG DẪN KHOA HỌC:1. PGS. TS. LƢƠNG CHI MAI2. TS. VŨ TẤT THẮNGHÀ NỘI – 2016Lời nói đầuCác kỹ thuật nhận dạng tiếng nói đã đang rất phát triển, đặc biệt với một sốngôn ngữ phổ dụng như Anh, Pháp, Trung Quốc,… Những yếu tố chính ảnh hưởngđến chất lượng của một hệ thống nhận dạng tiếng nói như: Người nói, tốc độ nói, hoàncảnh nói, nhiễu, kích thước từ điển, cách thức phát âm,… tuy nhiên hiện nay vẫn chưacó một giải pháp nào hoàn thiện giải quyết tất cả các yếu tố đó. Các phương pháp cơbản thường được sử dụng cho nhận dạng tiếng nói là: Kỹ thuật so khớp mẫu, mạngnơron, phương pháp dựa trên tri thức và mô hình Markov ẩn. Trong đó phương phápsử dụng mô hình Markov ẩn (Hidden Markov Model HMM) được sử dụng phổ biếnnhất.Đối với tiếng Việt hiện nay vẫn chưa có nhiều nghiên cứu về nhận dạng. Cáccông việc nghiên cứu mới đang ở những bài toán cơ bản. Tiếng Việt là một ngôn ngữcó thanh điệu, vì thế ngoài những khó khăn gặp phải tương tự như việc nhận dạng cácngôn ngữ không có thanh điệu khác (Anh, pháp,…), nhận dạng tiếng Việt còn phảinghiên cứu vấn đề nhận dạng thanh điệu. Tiếng Việt có sáu thanh điệu, một cách tổngquát có thể coi như mỗi âm tiết sẽ có thể có sáu ý nghĩa khác nhau khi ghép tương ứngvới sáu thanh điệu đó. Việc nhận dạng thanh điệu là một công việc khó do thanh điệuchỉ tồn tại ở vùng âm hữu thanh. Vì thế đường đặc tính của nó không liên tục khichuyển tiếp giữa hai vùng hữu thanh và vô thanh. Các đặc trưng được sử dụng phổbiến trong nhận dạng tiếng nói như MFCC (Mel Frequency Cepstral Coefficient) vàPLP (Perceptual Linear Prediction) lại không mô tả được các đặc tính của thanh điệu,do vậy trước khi nhận dạng được thanh điệu ta phải áp dụng các kỹ thuật tính toán đặctrưng thanh điệu trong tín hiệu tiếng nói.Các nghiên cứu hiện nay về nhận dạng thanh điệu tiếng Việt cũng mới chỉ ởnhững bước đầu tiên và chủ yếu áp dụng cho tiếng nói rời rạc, có lượng từ vựng nhỏcỡ vài trăm từ. Các giải pháp chủ yếu là phát triển từ các nghiên cứu trên các ngôn ngữcó thanh điệu khác như Mandarin, Thái,…, vì vậy việc nghiên cứu một giải pháp nhậndạng tiếng Việt từ vựng lớn phát âm liên tục thực sự là một vấn đề cấp thiết cả về tínhkhoa học và kinh tế.Từ các lý do cấp thiết này tôi đã chọn đề tài “Nghiên cứu mô hình thanh điệutrong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục”. Với mục tiêu chính lànghiên cứu các vấn đề trong nhận dạng tiếng Việt từ vựng lớn phát âm liên tục, vànghiên cứu các vấn đề về mô hình thanh điệu cho tiếng Việt.Nội dung chính của luận án được trình bày thành 5 chương với nội dung nhưsau:1-Chương 1: Giới thiệu tổng quan về nhận dạng tiếng nói và ứng dụng. Cấutrúc tổng quan của một hệ thống nhận dạng tiếng nói cơ bản. Tình hìnhnghiên cứu tổng quan về nhận dạng tiếng nói chung và nhận dạng tiếng Việtnói riêng. Giới thiệu các mục tiêu và phạm vi nghiên cứu chính của luận án.-Chương 2: Trình bày tổng quan về cấu trúc ngữ âm tiếng Việt. Mô hìnhnhận dạng tiếng Việt từ vựng lớn phát âm liên tục có thanh điệu. Dữ liệu và-các công cụ sử dụng để cài đặt các thử nghiệm. Hệ thống nhận dạng cơ sở.Chương 3: Trình bày mô hình thanh điệu cho nhận dạng tiếng Việt từ vựnglớn phát âm liên tục sử dụng MSD-HMM. Bao gồm quy trình tính toán đặctrưng thanh điệu, cấu hình mô hình và huấn luyện.-Chương 4: Trình bày phương pháp tăng cường đặc trưng ngữ âm sử dụngmạng nơron cho nhận dạng tiếng Việt, bao gồm quy trình gán nhãn, huấnluyện mạng, tối ưu mạng, trích chọn đặc trưng Bottleneck và cài đặt thử-nghiệm.Chương 5: Trình bày phương pháp tăng cường đặc trưng thanh điệu với đặctrưng cải tiến Tonal-Bottleneck sử dụng mạng nơron. Bao gồm phương phápgán nhãn thanh điệu, tối ưu mạng, tính toán đặc trưng và cài đặt thử nghiệm.Tôi xin được gửi lời cảm ơn chân thành đến Bộ Giáo dục và Đào tạo, ViệnCông nghệ Thông tin – Viện Hàn lâm Khoa học và Công nghệ Việt Nam, trường ĐHKỹ thuật Công nghiệp Thái Nguyên – ĐH Thái Nguyên đã tạo điều kiện thuận lợi chotôi hoàn thành đề tài nghiên cứu sinh này. Xin được gửi lời cảm ơn chân thành đếnViện công nghệ Karlshuhe – Đức, Viện Công nghệ Thông tin quốc gia Nhật Bản đãtạo điều kiện và hỗ trợ cả về mặt khoa học lẫn thiết bị cho tôi để thực hiện các thửngh ...
Tìm kiếm theo từ khóa liên quan:
Luận án Tiến sĩ Toán học Luận án Tiến sĩ Cơ sở toán học cho tin học Nhận dạng tiếng nói tiếng Việt Mô hình thanh điệuTài liệu liên quan:
-
205 trang 433 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 387 1 0 -
174 trang 343 0 0
-
206 trang 308 2 0
-
228 trang 273 0 0
-
32 trang 232 0 0
-
Luận án tiến sĩ Ngữ văn: Dấu ấn tư duy đồng dao trong thơ thiếu nhi Việt Nam từ 1945 đến nay
193 trang 230 0 0 -
208 trang 221 0 0
-
27 trang 201 0 0
-
27 trang 191 0 0