Danh mục

Xử lý tiếng nói - Text to Speech System

Số trang: 40      Loại file: pdf      Dung lượng: 370.39 KB      Lượt xem: 10      Lượt tải: 0    
tailieu_vip

Xem trước 4 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Các hệ thống chuyển đổi văn bản thành giọng nóiCác hệ thống chuyển đổi văn bản thành giọng nói có thể được xem như là hệ thống mã hóa tiếng nói cho phép lựa chọn kiểu ể cách nói, tốc độ, cường độ và các hiệu ứngCác thành phần trong hệ thống TTSThành phần phân tích văn bản:– Xác định cấu trúc tài liệu, chuyển đổi ký hiệu, phân tích cấu trúc ngôn ngữ – Chuyển đổi các ký hiệu sang dạng chuẩn. – Chuyển đổi các số sang dạng chữ tương ứng – Phân tích khoảng trống, dấu chấm...
Nội dung trích xuất từ tài liệu:
Xử lý tiếng nói - Text to Speech System Bài 4:Các hệ thống chuyển đổi văn bản thành giọng nóiCác hệ thống chuyển đổi văn bản thànhgiọng nói có thể được xem như là hệ thốngmã hóa tiếng nói cho phép lựa chọn kiểu ểcách nói, tốc độ, cường độ và các hiệu ứngCác thành phần trong hệ thống TTS Thành phần phân tích văn bản: – Xác định cấu trúc tài liệu, chuyển đổi ký hiệu, phân tích cấu trúc ngôn ngữ – Chuyển đổi các ký hiệu sang dạng chuẩn. – Chuyển đổi các số sang dạng chữ tương ứng – Phân tích khoảng trống, dấu chấm câu để xác định cấu trúc ngôn ngữ ị g g Thành phần phân tích ngữ âm: – Chuyển đổi các từ đã chuẩn hóa sang các âm vị y g ị tương ứng (với thông tin như trọng âm, thời gian phát âm)Các quá trình trong thành p q g phầnphân tích văn bản Xác định cấu trúc tài liệu: – Cung cấp ngữ cảnh phục vụ cho các quá trình thực hiện sau này – Ngắt câu, phân đoạn văn bản Chuẩn hóa văn bản: – Chuyển đổi ký hiệu ở dạng dạng khác nhau về dạng chuẩn Phân tí h ô Phâ tích ngôn ngữ: ữ – Phân tích đặc điểm cú pháp, ngữ nghĩa của câu từ để có thể chọn cách phát âm thích hợpCác quá trình trong thành p q g phầnphân tích ngữ âm Phân biệt từ có cách viết giống nhau nhưng khác âm Phân tích từ để xác định cách phát âm thích hợp Chuyển đổi ký tự sang âm thanh và xây dựng từ điển phát âmCác quá trình được thực hiện trước có thểsinh ra nhiều kết quả và chuyển cho quátrình sau với hy vọng rằng quá trình sau có ằthể xác định kết quả đúng đắn khi có nhiềuthông tin hơn– Ví dụ: dấu chấm câu có thể được dùng sau một từ viết tắt hoặc dùng để kết thúc câuMột vài ví dụ về trường hợp nhầm lẫn trong ộ ụ g ợp gchuẩn hóa văn bảnCác luồng dữ liệu Hầu hết các hệ thống TTS cung cấp tập hợp các thẻ đánh dấu để cung cấp thêm thông tin cho việc đọc văn bảnW (Words): cấu trúc từΣ: cấu trúc âm tiếtC (Controls): cấu trúc âm vịS (Sy ta /Se a t c) cú p áp, ngữ nghĩa (Syntax/Semantic): pháp, gữ g a– NP (Noun Phrase)– VP (Verb Phrase)– S (Sentence)W Σ, C: cấu trúc âm tiết và âm vị đượcsinh ra từ cấu trúc từ W bằng từ vựng vàcác quy tắc ắW S: cấu trúc từ được dùng để xác địnhcú pháp và ngữ nghĩa. Ví dụ như danh từ ú há à ữ hĩ d h d h ừ(NP), động từ (VP), câu (S)S P cú pháp, ngữ nghĩa đượ dù để P: ú há ữ hĩ được dùngxác định âm vị sử dụng trong phát âm.Xác định cấu trúc tài liệu Văn bản thô Trang web g Tài liệu XML Email aThuật toán ngắt câuChuẩn hóa văn bản Văn bản thường bao gồm các từ viết tắt như FDA cho từ “Food and Drug Administration” hay WTO cho từ World Trade Organization Tài liệu kỹ thuật có thể bao gồm các biểu liệ h ậ ó hể b ồ á biể thức toán học, đồ thị, bảng biểu Nội dung email có thể có các biểu tượ d il ó ó á biể tượng cảm xúcChuẩn hóa văn bản Chuẩn hóa văn bản là quá trình đưa về biểu diễn đồng nhất cho các từ, các số, dấu ngắt câu, các ký hiệu Ví dụ: “The 7% Solution” được đọc là THE SEVEN PERCENT SOLUTION Sau khi chuẩn hóa, nó nên được đánh dấu bằng thẻ í d bằ thẻ, ví dụ: The 7% SolutionVí dụ: “at 8 am I …”Có thể được chuyển thành: ợ yAt eight am I …At e g t a I … t u be eight / u be amThuật toán mở rộng các từ viết tắt Bước 1: Nếu từ w không có trong bảng từ viết tắt dạng rút gọn chuyển sang bước 3 Bước 2 B ớ 2: Mở rộng từ viết tắt d ộ ừ iế ắ dạng rút gọn: ú – Nếu từ viết tắt tương ứng được tìm thấy trong bảng: mở rộng từ viết tắt bằng cách thêm thẻ SNOR và từ tương ứng – Đọc từ tiếp theo và chuyển sang bước 1Bước 3: Mở rộng từ viết tắt dạng ký tự đạidiện– Nếu từ w đã có trong bảng: mở rộng từ viết tắt bằng cách thêm thẻ SNOR và từ tương ứng– Nếu không thì đọc từ w theo dạng từng ký tự– Đọc từ tiếp theo và sang bước 1Chuẩn hóa văn bản Các từ viết tắt bởi ký tự đại diện Pronounced as a word – NATO North Atl ti Treaty Organization NATO: th tlantic t i ti – scuba: self-contained underwater breathing apparatus elf- Pronounced as the names of letters – DNA: deoxyribonucleic acid eoxyribon – LED: light-emitting diode ight- Pronounced as the names of letters but with a shortcut – IEEE: Institute of Electrical and Electronics Engineers – W3C: World Wide Web Consortium Pseudo- Pseudo-acronyms – IOU: “I owe you” I you – CQR: “secure”, a brand of boat anchor 19Chuẩn hóa văn bản Number formats – Pho ...

Tài liệu được xem nhiều: