Danh mục

Bài giảng xử lý tiếng nói part 8

Số trang: 6      Loại file: pdf      Dung lượng: 474.91 KB      Lượt xem: 19      Lượt tải: 0    
Jamona

Phí tải xuống: 4,000 VND Tải xuống file đầy đủ (6 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Tín hiệu tiếng nói được biểu diễn chính xác bởi các giá trị phổ trong một khung thời gian ngắn (short-term amplitude spectrum). Nhờ vậy ta có thể trích ra các đặc điểm tiếng nói từ những khoảng thời gian ngắn và dùng các đặc điểm này làm dữ liệu để nhận dạng tiếng nói.Nội dung của tiếng nói được biểu diễn dưới dạng chữ viết, là một dãy các ký hiệu ngữ âm. Do đó ý nghĩa của một phát âm được bảo toàn khi chúng ta phiên âm phát âm thành dãy các ký hiệu ngữ âm....
Nội dung trích xuất từ tài liệu:
Bài giảng xử lý tiếng nói part 8 3. M· ho¸ tiÕng nãi 3. M· 3. M· ho¸ tiÕng nãi D·y thao t¸c m· ho¸ vµ gi¶i m· NhiÔu, suy gi¶m, sai sè F1 AD M· ho¸NhiÔu, suy gi¶m, sai sè Gi¶i m· DA F2 43 3. M· ho¸ tiÕng nãiMétMét sè tÝnh chÊt thèng kª cñatÝntÝn hiÖu tiÕng nãi MËt ®é x¸c suÊt N : sè lîng mÉu x(n)cã biªn ®é trong kho¶ng[-/2, +/2] n[-N,...,N] x egodic vµ dõng px ( )  lim [ N /(2 N  1)] N    0 44 3. M· ho¸ tiÕng nãi Gi¸ trÞ trung b×nh vµ ph¬ng sai• Gi¸ trÞ trung b×nh cña tÝn hiÖu dõng  N 1 N x(n)  x    px ( ) d   lim N  2 N  1 n  víi tÝn hiÖu tiÕng nãi, gi¶ thiÕt x = 0• Ph¬ng sai  N 1  x    2 px ( ) d   lim 2 x 2 ( n) N N  2 N  1 n   45 3. M· ho¸ tiÕng nãiLîng tö tøc thêi (kh«ng nhí)• LuËt lîng tö y = Q(x) ®îc ®Þnh nghÜa: (L+1) møc tÝn hiÖu x(0), x(1), ..., x(L) L møc lîng tö ho¸• Mçi møc lîng tö ho¸ biÓu diÔn b»ng tõ b bit L = 2b.• Sai sè lîng tö (t¹p ©m lîng tö) e = Q(x) - x• Bíc lîng tö : hiÖu 2 møc tÝn hiÖu kÒ nhau (i) = x(i)-x(i-1)• Th«ng lîng I = bFs (bit/s). Fs : tÇn sè lÊy mÉu 46 3. M· ho¸ tiÕng nãiThông lượng (1)• Tín hiệu lượng tử 8 bit (256 mức), Fs = 8 kHz Thông lượng = 64 kbit/s• Tín hiệu lượng tử 16 bit (65536 mức), Fs = 16 kHz Thông lượng = 256 kbit/s , 1 giờ tiếng nói  100 Mbyte• Cần phải mã hoá tín hiệu tiếng nói (MPEG, GSM, G723, ...) để truyền tiếng nói trên mạng hoặc lưu trữ 47 3. M· ho¸ tiÕng nãiThông lượng (2) Dung lượng Tần số lấy Số bit cho Thông / phút Lĩnh vực mẫu (kHz) 1 mẫu luợng kbit/s (kbyte) 48 16 768 11520 Ghi âm chuyên nghiệp 44,1 16 705,6 10584 CD Audio 32 16 512 7680 Radio FM 22 8 264 3960 Radio AM 8 8 64 960 Điện thoại 48

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: