Đánh giá hiệu năng một số mô hình học máy thống kê với vấn đề nhận dạng thanh điệu tiếng Việt nói
Số trang: 6
Loại file: pdf
Dung lượng: 465.89 KB
Lượt xem: 13
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài báo đề xuất phương pháp nhận dạng thanh điệu tiếng Việt nói sử dụng mô hình K láng giềng gần nhất KNN (K-Nearest Neighbor) phân tích khác biệt tuyến tính LDA (Linear Discrimination Analysis), phân tích khác biệt toàn phương QDA (Quadratic Discrimination Analysis), bộ phân lớp hỗ trợ véc tơ SVC (support vector classifier) và máy hỗ trợ véc tơ SVM (Support Vector Machine). Theo các nhà ngôn ngữ học, thanh điệu tiếng Việt có đặc tính siêu đoạn, tồn tại trên cả âm tiết. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Đánh giá hiệu năng một số mô hình học máy thống kê với vấn đề nhận dạng thanh điệu tiếng Việt nói HộiHội Thảo Quốc Thảo GiaGia Quốc 2015 2015vềvềĐiện ĐiệnTử, Tử,Truyền TruyềnThông CôngNghệ Thông và Công NghệThông ThôngTinTin (ECIT (ECIT 2015) 2015) ánh giá hiu nng mt s mô hình hc máy thng kê vi vn nhn dng thanh iu ting Vit nói Nguyn Hng Quang, Trnh Vn Loan Vin Công Ngh Thông Tin và Truyn Thông, Trng i hc Bách khoa Hà Ni Email: quangnh@soict.hust.edu.vn, loantv@soict.hust.edu.vn Abstract— Bài báo xut phng pháp nhn dng thanh iu thanh iu dài). Nh vy nu so sánh vi hai ngôn ng trên thì ting Vit nói s dng mô hình K láng ging gn nht KNN (K- ting Vit là ngôn ng có cu trúc thanh iu phc tp nht. Nearest Neighbor) phân tích khác bit tuyn tính LDA (Linear iu này làm cho vic nhn dng thanh iu ting Vit tr nên Discrimination Analysis), phân tích khác bit toàn phng QDA khó khn hơn. (Quadratic Discrimination Analysis), b phân lp h tr véc t Hin nay, các h thng tng hp và nhn dng ting nói SVC (support vector classifier) và máy h tr véc t SVM (Support Vector Machine). Theo các nhà ngôn ng hc, thanh ang c phát trin rt mnh trên th gii. Các h thng này iu ting Vit có c tính siêu on, tn ti trên c âm tit. s óng vai trò quan trng trong vic thc hin tơng tác Trong nghiên cu này, chúng tôi tin hành th nghim nhn ngi-máy (human-machine) hoc tơng tác máy-máy dng thanh iu theo hai quan im: thanh iu tn ti trên c (machine-to-machine) trong tơng lai. Nghiên cu các h âm tit và thanh iu ch tn ti trên phn hu thanh ca âm tit. thng tơng tác nh vy ang c thc hin bc u vi Các tham s s dng cho nhn dng thanh iu gm có nng ting Vit. Vì vy nhn dng thanh iu cho các ngôn ng có lng và tn s c bn ca ting nói. nhn dng, các tham s thanh iu trong ó có ting Vit là mt vn quan trng, này c chun hóa theo thi gian. Kt qu c th nghim mang tính thi s hin nay. trên 6221 t phát âm ri rc ca ting Vit vi 3 ngi nói. Các Bên cnh ting Vit, ting ph thông Trung Quc và ting th nghim c thc hin theo phng pháp so sánh chéo (cross-validation). Các kt qu th nghim cho thy quan im Thái Lan cng là các ngôn ng có thanh iu. Vi c hai ngôn coi thanh iu ch tn ti trên phn hu thanh ca âm tit cho ng này, Yang, W. [3], Charnvivit, P. [4] và cng s ã s kt qu nhn dng cao hn so vi quan im coi thanh iu tn dng tn s cơ bn làm tham s s dng cho quá trình nhn ti trên c âm tit. Ngoài ra, trong các phng pháp nhn dng dng thanh iu. Kt qu ca các nghiên cu này cho thy F0 c th nghim, phng pháp QDA cho kt qu nhn dng cao là mt tham s hiu qu khi s dng mô hình HMM biu nht. din cho thanh iu. Trong nhng nm gn ây, ã có mt s công trình nghiên Keywords- thanh iu ting Vit, nhn dng thanh iu, tn s cu nhn dng ting Vit nói trong ó có b sung thông tin v c bn F0, phân tích khác bit tuyn tính, phân tích khác bit toàn phng, K láng ging gn nht, máy h tr véc t. thanh iu. Lê Vit Bc và cng s [9][12] s dng phơng pháp thích nghi t mt ngôn ng không có thanh iu (ting I. GII THIU Pháp) xây dng mô hình cho ting Vit. Trong khi ó, V Hi Quân [10], V Ngc Thng [11] và cng s li b sung tn Khác vi phn ln các ngôn ng trên th gii, ting Vit là s cơ bn F0 nh mt tham s cùng vi các tham s MFCC mt trong các ngôn ng có thanh iu. Vi loi ngôn ng này, dùng làm tham s c trng cho tng khung ting nói. ng ngha ca âm tit s thay i khi thay i thanh iu ca Mt hng nghiên cu khác là tách ri, thc hin song âm tit ó [1]. Hai yu t chính phân bit bao gm cao và song nhn dng âm tit cơ bn (âm tit coi nh không có thanh mc bin thiên phc tp ca thanh iu. Các thanh iu iu) vi nhn dng thanh iu riêng r. Nguyn Hng Quang c phân bit vi nhau ch yu qua qui lut bin thiên theo và cng s [14] ã s dng các tham s MFCC, F0 xây thi ...
Nội dung trích xuất từ tài liệu:
Đánh giá hiệu năng một số mô hình học máy thống kê với vấn đề nhận dạng thanh điệu tiếng Việt nói HộiHội Thảo Quốc Thảo GiaGia Quốc 2015 2015vềvềĐiện ĐiệnTử, Tử,Truyền TruyềnThông CôngNghệ Thông và Công NghệThông ThôngTinTin (ECIT (ECIT 2015) 2015) ánh giá hiu nng mt s mô hình hc máy thng kê vi vn nhn dng thanh iu ting Vit nói Nguyn Hng Quang, Trnh Vn Loan Vin Công Ngh Thông Tin và Truyn Thông, Trng i hc Bách khoa Hà Ni Email: quangnh@soict.hust.edu.vn, loantv@soict.hust.edu.vn Abstract— Bài báo xut phng pháp nhn dng thanh iu thanh iu dài). Nh vy nu so sánh vi hai ngôn ng trên thì ting Vit nói s dng mô hình K láng ging gn nht KNN (K- ting Vit là ngôn ng có cu trúc thanh iu phc tp nht. Nearest Neighbor) phân tích khác bit tuyn tính LDA (Linear iu này làm cho vic nhn dng thanh iu ting Vit tr nên Discrimination Analysis), phân tích khác bit toàn phng QDA khó khn hơn. (Quadratic Discrimination Analysis), b phân lp h tr véc t Hin nay, các h thng tng hp và nhn dng ting nói SVC (support vector classifier) và máy h tr véc t SVM (Support Vector Machine). Theo các nhà ngôn ng hc, thanh ang c phát trin rt mnh trên th gii. Các h thng này iu ting Vit có c tính siêu on, tn ti trên c âm tit. s óng vai trò quan trng trong vic thc hin tơng tác Trong nghiên cu này, chúng tôi tin hành th nghim nhn ngi-máy (human-machine) hoc tơng tác máy-máy dng thanh iu theo hai quan im: thanh iu tn ti trên c (machine-to-machine) trong tơng lai. Nghiên cu các h âm tit và thanh iu ch tn ti trên phn hu thanh ca âm tit. thng tơng tác nh vy ang c thc hin bc u vi Các tham s s dng cho nhn dng thanh iu gm có nng ting Vit. Vì vy nhn dng thanh iu cho các ngôn ng có lng và tn s c bn ca ting nói. nhn dng, các tham s thanh iu trong ó có ting Vit là mt vn quan trng, này c chun hóa theo thi gian. Kt qu c th nghim mang tính thi s hin nay. trên 6221 t phát âm ri rc ca ting Vit vi 3 ngi nói. Các Bên cnh ting Vit, ting ph thông Trung Quc và ting th nghim c thc hin theo phng pháp so sánh chéo (cross-validation). Các kt qu th nghim cho thy quan im Thái Lan cng là các ngôn ng có thanh iu. Vi c hai ngôn coi thanh iu ch tn ti trên phn hu thanh ca âm tit cho ng này, Yang, W. [3], Charnvivit, P. [4] và cng s ã s kt qu nhn dng cao hn so vi quan im coi thanh iu tn dng tn s cơ bn làm tham s s dng cho quá trình nhn ti trên c âm tit. Ngoài ra, trong các phng pháp nhn dng dng thanh iu. Kt qu ca các nghiên cu này cho thy F0 c th nghim, phng pháp QDA cho kt qu nhn dng cao là mt tham s hiu qu khi s dng mô hình HMM biu nht. din cho thanh iu. Trong nhng nm gn ây, ã có mt s công trình nghiên Keywords- thanh iu ting Vit, nhn dng thanh iu, tn s cu nhn dng ting Vit nói trong ó có b sung thông tin v c bn F0, phân tích khác bit tuyn tính, phân tích khác bit toàn phng, K láng ging gn nht, máy h tr véc t. thanh iu. Lê Vit Bc và cng s [9][12] s dng phơng pháp thích nghi t mt ngôn ng không có thanh iu (ting I. GII THIU Pháp) xây dng mô hình cho ting Vit. Trong khi ó, V Hi Quân [10], V Ngc Thng [11] và cng s li b sung tn Khác vi phn ln các ngôn ng trên th gii, ting Vit là s cơ bn F0 nh mt tham s cùng vi các tham s MFCC mt trong các ngôn ng có thanh iu. Vi loi ngôn ng này, dùng làm tham s c trng cho tng khung ting nói. ng ngha ca âm tit s thay i khi thay i thanh iu ca Mt hng nghiên cu khác là tách ri, thc hin song âm tit ó [1]. Hai yu t chính phân bit bao gm cao và song nhn dng âm tit cơ bn (âm tit coi nh không có thanh mc bin thiên phc tp ca thanh iu. Các thanh iu iu) vi nhn dng thanh iu riêng r. Nguyn Hng Quang c phân bit vi nhau ch yu qua qui lut bin thiên theo và cng s [14] ã s dng các tham s MFCC, F0 xây thi ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu hội nghị Quốc gia về Điện tử truyền thông Mô hình học máy thống kê Nhận dạng thanh điệu tiếng Việt nói Thanh điệu tiếng Việt Máy hỗ trợ véc tơGợi ý tài liệu liên quan:
-
7 trang 159 0 0
-
Kỹ thuật điều chế QPSK cho hệ thống thông tin quang vô tuyến DWDM
6 trang 147 0 0 -
6 trang 131 0 0
-
Khảo sát thuật toán OSD sử dụng bộ mã RS và kỹ thuật điều chế QAM
5 trang 107 0 0 -
Phương pháp chênh lệch trong hiện thực hóa các hàm phức tạp trên ASIC cho các hệ thống DSP
6 trang 78 0 0 -
Mô hình nghiên cứu thực nghiệm về truyền dữ liệu thời gian thực sử dụng ánh sáng đèn LED
6 trang 36 0 0 -
Một phương thức phát hiện bất thường trong lưu lượng mạng
4 trang 33 0 0 -
Nén tín hiệu ECG và bảo mật thông tin bệnh nhân
4 trang 31 0 0 -
4 trang 29 0 0
-
Kỹ thuật tái sử dụng tần số mềm trong mạng LTE
5 trang 29 0 0