Một tiếp cận tối ưu thành phần sinh tín hiệu cho hệ tổng hợp ghép nối tiếng Việt trên hệ thống tài nguyên hạn chế

Số trang: 7 Loại file: pdf Dung lượng: 4.19 MB Lượt xem: 10 Lượt tải: 0

Thư Viện Số

Báo xấu

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Các nhà nghiên cứu trên thế giới đã đạt được những thành công ngay cả trên những hệ thống có tài nguyên rất khiêm tốn như các loại chip với khả năng lưu trữ và tính toán rất thấp. Bài báo này trình bày một tiếp cận tối ưu lưu trữ và tính toán tín hiệu tiếng nói cho hệ tổng hợp tiếng Việt dựa trên ghép nối để đáp ứng trên các thiết bị di động và các hệ thống tài nguyên hạn chế.
Nội dung trích xuất từ tài liệu:
Một tiếp cận tối ưu thành phần sinh tín hiệu cho hệ tổng hợp ghép nối tiếng Việt trên hệ thống tài nguyên hạn chế Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) Một tiếp cận tối ưu thành phần sinh tín hiệu cho hệ tổng hợp ghép nối tiếng Việt trên hệ thống tài nguyên hạn chế Nguyễn Tu Trung Ngô Hoàng huy Viện CNTT, Viện Hàn Lâm KH&CN VN Viện CNTT, Viện Hàn Lâm KH&CN VN Hà Nội, Việt Nam Hà Nội, Việt Nam nttrung@ioit.ac.vn nhhuy@ioit.ac.vn Tóm tắt— Xử lý tiếng nói nói chung và tổng hợp tiếng những hệ thống có tài nguyên rất khiêm tốn như các loại nói nói riêng ở Việt Nam và trên thế giới đã đạt được chip với khả năng lưu trữ và tính toán rất thấp. những thành tựu rất đáng khích lệ. Khi mà nhu cầu giao tiếp trên các thiết bị di động và các hệ thống tài nguyên Ở Việt Nam, nhu cầu nghiên cứu giải pháp xây dựng hạn chế tăng rất nhanh, các nhà nghiên cứu trên thế giới hệ xử lý tiếng nói trên các hệ thống tài nguyên hạn chế cũng đang tiếp tục tối ưu các thành phần để xây dựng hệ cũng đã xuất hiện trong một số năm gần đây. Các đề tài xử lý tiếng nói trên các hệ thống dạng này. Do đặc thù của nghiên cứu về việc chuyển hệ xử lý tiếng nói lên các hệ hệ thống tài nguyên hạn chế, các hệ tổng hợp chạy trên các thống di động cầm tay và hệ thống nhúng đã và đang hệ thống này cũng cần sử dung lượng bộ nhớ và chí phí triển khai đã minh chứng cho nhu cầu này. tính toán đủ nhỏ. Các nhà nghiên cứu trên thế giới đã đạt được những thành công ngay cả trên những hệ thống có Việc tích hợp hệ thống tổng hợp tiếng nói vào các hệ tài nguyên rất khiêm tốn như các loại chip với khả năng thống tài nguyên hạn chế gặp phải vấn đề về bộ nhớ và lưu trữ và tính toán rất thấp. Bài báo này trình bày một các yêu cầu tính toán. Burileanu [4] đã sử dụng mã hóa tiếp cận tối ưu lưu trữ và tính toán tín hiệu tiếng nói cho A-law để nén CSDL đơn vị tiếng nói và họ đã chỉ ra hệ tổng hợp tiếng Việt dựa trên ghép nối để đáp ứng trên rằng 80% thời gian tính toán nằm ở khâu chuẩn hóa văn các thiết bị di động và các hệ thống tài nguyên hạn chế. bản và chuyển văn bản về âm vị. Sheikhzadeh và cộng sự [9] đã thiết kế hệ thống tổng hợp tiếng nói theo Từ khóa— tổng hợp tiếng nói, tài nguyên hạn chế, phương pháp ghép nối sử dụng thuật toán cơ bản TD- ADPCM, PSOLA PSOLA trên chip DSP với DAC 16bit, tần số tối đa 4 MHz. Dey và cộng sự [6] đã đưa ra kiến trúc TTS I. GIỚI THIỆU nhúng theo phương pháp tổng hợp ghép nối cho chip Xử lý tiếng nói là sự nghiên cứu tiếng nói của con ARM. Trong nghiên cứu này, chúng tôi trình bày một người dưới dạng tín hiệu và các phương pháp xử lý tín tiếp cận tối ưu lưu trữ và tính toán tín hiệu tiếng nói cho hiệu này. Tín hiệu tiếng nói thường được thể hiện dưới hệ tổng hợp tiếng Việt dựa trên ghép nối để đáp ứng dạng số, tức là được “số hóa”. Do đó, xử lý tiếng nói có trên các thiết bị di động và các hệ thống tài nguyên hạn thể được coi là giao của xử lý tín hiệu số và xử lý ngôn chế. ngữ tự nhiên. Trên thế giới, xử lý tiếng nói đã được Các phần còn lại của bài báo này được trình bày như nghiên cứu từ rất lâu. Ở Việt Nam, khoảng hơn chục sau. Phần 2 trình bày khái quát về hệ tổng hợp tiếng nói năm trở lại đây đã có một số sản phẩm ra đời cả về tổng dựa trên ghép nối. Phần 3 trình bày vấn đề tổng hợp hợp và nhận dạng tiếng nói. tiếng nói trên hệ thống có tài nguyên hạn chế. Giải pháp Khi mà xử lý tiếng nói trên máy tính đã đạt được tối ưu lưu trữ và tính toán cho hệ tổng hợp tiếng nói dựa những thành tựu rất khả quan, người ta đã nghĩ đến việc trên ghép nối trên hệ thống tài nguyên hạn chế. Thử nghiên cứu xây dựng hệ xử lý tiếng nói trên các hệ nghiệm và đánh giá được trình bày trong phần 5. Phần 6 thống có tài nguyên hạn chế để đáp ứng những mục là kết luận bài báo. đích về giao tiếp tiếng nói trên các hệ thống này. Do đặc thù của hệ thống tài nguyên hạn chế, các hệ tổng hợp chạy trên các hệ thống này cũng cần sử dụng lượng bộ nhớ và chí phí tính toán đủ nhỏ. Và các nhà nghiên cứu trên thế giới đã đạt được những thành công ngay cả trên ISBN: 978-604-67-0349-5 432 Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) II. TỔNG HỢP TIẾNG NÓI DỰA TRÊN GHÉP NỐI Sơ đồ tổng quát hệ thống tổng hợp tiếng nói từ văn bản mô tả trong hình 1. Nói chung, mô đun xử lý tín hiệu số chọn các âm vị và thông tin ngôn điệu từ đầu ra của mô đun xử lý ngôn ngữ tự nhiên và đưa chúng thành các tín hiệu tiếng nói. Các kỹ thuật chính sử dụng trong mô đun xử lý tín hiệu số: tổng hợp theo luật, tổng hợp ghép nối và tổng hợp dựa trên thống kê. Hình 1. Sơ đồ tổng quát hệ thống tổng hợp tiếng nói từ văn bản. Tổng hợp ghép nối sử dụng tiếng nói ghi âm thực tế như là các đơn vị tổng hợp và ghép nối đơn vị cùng sinh ra tiếng nói. Dutoit [7] cho ...