Danh mục

Tóm tắt Luận án Toán học: Nghiên cứu các đặc trưng tín hiệu và ràng buộc ngôn điệu để nâng cao chất lượng tổng hợp và nhận dạng tiếng Việt

Số trang: 39      Loại file: pdf      Dung lượng: 1.33 MB      Lượt xem: 12      Lượt tải: 0    
tailieu_vip

Xem trước 4 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án gồm các chương sau: Chương 1 - Tổng quan về tổng hợp và nhận dạng tiếng nói, chương 2 - Xử lý tiếng nói và các mô hình học máy, chương 3 - Dự báo trường độ, âm lượng và tổng hợp thanh điệu tiếng việt, chương 4 - Kết hợp tham số cấu âm, formant và thanh điệu để nâng cao chất lượng nhận dạng tiếng Việt.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Toán học: Nghiên cứu các đặc trưng tín hiệu và ràng buộc ngôn điệu để nâng cao chất lượng tổng hợp và nhận dạng tiếng ViệtBỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Ngô Hoàng Huy NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ RÀNG BUỘC NGÔN ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT Chuyên ngành: Cơ sở Toán học cho Tin học Mã số: 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. PGS.TS. Lương Chi Mai 2. PGS.TS. Ngô Quốc Tạo Hà Nội – 2016 1 Công trình được hoàn thành tại: Viện Hàn lâm Khoa Học và Công Nghệ Việt Nam Học viện Khoa học và Công nghệ Người hướng dẫn khoa học: PGS.TS. Lương Chi Mai PGS.TS. Ngô Quốc Tạo Phản biện 1: TS. Trịnh Anh Tuấn Phản biện 2: TS. Nguyễn Phú Bình Phản biện 3: PGS.TS. Vũ Kim BảngLuận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp Học viện họp tại:…….………………………………………………………………………..Vào hồi giờ ngày tháng nămCó thể tìm hiểu luận án tại:- Thư viện Quốc gia Việt Nam.- Thư viện Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoahọc và Công nghệ Việt Nam. 2 Phạm vi, nội dung, phương pháp nghiên cứu và kết cấu luận ánCấu trúc tổng thể của luận án được chỉ ra trong Hình 1.2 và các chương còn lại của luận án đượctổ chức như sau: Chương 1. Tổng quan về tổng hợp và nhận dạng tiếng nói. Chương 2. Xử lý tiếng nói và các mô hình học máy. Chương 3. Dự báo trường độ, âm lượng và tổng hợp thanh điệu tiếng việt. Chương 4. Kết hợp tham số cấu âm, formant và thanh điệu để nâng cao chất lượng nhậndạng tiếng Việt. Phụ lục 3Luận án Tổng hợp tiếng nói Chương 1. tổng quan về Nhận dạng tiếng nói tổng hợp và nhận dạng Các công trình đã xuất bản tiếng nói. liên quan Chương 2. xử lý tiếng nói và các mô hình học máy. Xử lý tiếng nói Mô hình dự báo CART. Mô hình Markov ẩn (HMM, Hidden Markov Model) Chương 3. Dự báo trường độ, âm lượng và tổng hợp thanh điệu tiếng việt Khảo sát một số đặc tính âm học tiếng Việt Dự báo thông tin trường độ, âm lượng của âm tiết tiếng Việt trong ngữ cảnh câu, thử nghiệm đánh giá trong hệ thống tổng hợp Chương 4. kết hợp tham số tiếng Việt theo phương cấu âm, formant và thanh pháp ghép nối điệu để nâng cao chất lượng nhận dạng tiếng Việt Nhận dạng thanh điệu tiếng Việt. Đặc trưng MFCC với phép chuẩn hóa độ dài cấu âm VTLN kết hợp với F0 Hệ thống nhận dạng tiếng Việt nhúng 4 CHƯƠNG 1. TỔNG QUAN VỀ TỔNG HỢP VÀ NHẬN DẠNG TIẾNG NÓI. Chương này trình bày khái niệm tổng hợp và nhận dạng tiếng nói, khái quát về phạm viứng dụng của nhận dạng, tổng hợp tiếng nói trong cuộc sống. Trong chương này, các phươngpháp tiếp cận nhận dạng, tổng hợp tiếng nói hiện đại, so sánh những ưu, nhược điểm của từngphương pháp cũng được giới thiệu, từ đó đề xuất sử dụng các đặc trưng ngôn điệu để nâng caochất lượng nhận dạng và tổng hợp tiếng Việt. Phần tiếp theo của chương này, luận án đề cập đếnnhững kiến thức cơ bản,liên quan đến xử lý tiếng nói, trích chọn đặc trưng và các mô hình họcmáy được sử dụng trong luận án gồm HMM và CART. 1.1. Tổng hợp tiếng nói Hình 1. 1. Hệ thống TTS tổng quát. Nói chung quá trình Tổng hợp tiếng nói bao gồm các giai đoạn chính: i) Chuẩn hóa văn bản và phân tích câu - xử lý ngôn ngữ tự nhiên. ii) Chuyển văn bản sang đơn vị tiếng nói. iii) Dự báo ngôn điệu. iv) Sinh tiếng nói. Câu tổng hợp chưa thay đổi trường độ/âm lượng “Tôi đang học nói tiếng Việt” Thay đổi trường độ/âm lượng của câu tổng hợp Hình 1. 2. Xử lý ngôn điệu tiếng Việt 5 1.2. Nhận dạng tiếng nóiĐộ phức tạp của hệ thống nhận dạng tiếng nói thường phụ thuộc vào các yếu tố cơ bản sau : - Môi trường thu nhận tín hiệu. - Tập từ vựng được sử dụng. - Sự phụ t ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: