Danh mục

Đánh giá hiệu năng một số mô hình học máy thống kê với vấn đề nhận dạng thanh điệu tiếng Việt nói

Số trang: 6      Loại file: pdf      Dung lượng: 465.89 KB      Lượt xem: 13      Lượt tải: 0    
10.10.2023

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài báo đề xuất phương pháp nhận dạng thanh điệu tiếng Việt nói sử dụng mô hình K láng giềng gần nhất KNN (K-Nearest Neighbor) phân tích khác biệt tuyến tính LDA (Linear Discrimination Analysis), phân tích khác biệt toàn phương QDA (Quadratic Discrimination Analysis), bộ phân lớp hỗ trợ véc tơ SVC (support vector classifier) và máy hỗ trợ véc tơ SVM (Support Vector Machine). Theo các nhà ngôn ngữ học, thanh điệu tiếng Việt có đặc tính siêu đoạn, tồn tại trên cả âm tiết. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Đánh giá hiệu năng một số mô hình học máy thống kê với vấn đề nhận dạng thanh điệu tiếng Việt nói HộiHội Thảo Quốc Thảo GiaGia Quốc 2015 2015vềvềĐiện ĐiệnTử, Tử,Truyền TruyềnThông CôngNghệ Thông và Công NghệThông ThôngTinTin (ECIT (ECIT 2015) 2015) ánh giá hiu nng mt s mô hình hc máy thng kê vi vn  nhn dng thanh iu ting Vit nói Nguyn Hng Quang, Trnh Vn Loan Vin Công Ngh Thông Tin và Truyn Thông, Trng i hc Bách khoa Hà Ni Email: quangnh@soict.hust.edu.vn, loantv@soict.hust.edu.vn Abstract— Bài báo  xut phng pháp nhn dng thanh iu thanh iu dài). Nh vy nu so sánh vi hai ngôn ng trên thì ting Vit nói s dng mô hình K láng ging gn nht KNN (K- ting Vit là ngôn ng có cu trúc thanh iu phc tp nht. Nearest Neighbor) phân tích khác bit tuyn tính LDA (Linear iu này làm cho vic nhn dng thanh iu ting Vit tr nên Discrimination Analysis), phân tích khác bit toàn phng QDA khó khn hơn. (Quadratic Discrimination Analysis), b phân lp h tr véc t Hin nay, các h thng tng hp và nhn dng ting nói SVC (support vector classifier) và máy h tr véc t SVM (Support Vector Machine). Theo các nhà ngôn ng hc, thanh ang c phát trin rt mnh trên th gii. Các h thng này iu ting Vit có c tính siêu on, tn ti trên c âm tit. s óng vai trò quan trng trong vic thc hin tơng tác Trong nghiên cu này, chúng tôi tin hành th nghim nhn ngi-máy (human-machine) hoc tơng tác máy-máy dng thanh iu theo hai quan im: thanh iu tn ti trên c (machine-to-machine) trong tơng lai. Nghiên cu các h âm tit và thanh iu ch tn ti trên phn hu thanh ca âm tit. thng tơng tác nh vy ang c thc hin bc u vi Các tham s s dng cho nhn dng thanh iu gm có nng ting Vit. Vì vy nhn dng thanh iu cho các ngôn ng có lng và tn s c bn ca ting nói.  nhn dng, các tham s thanh iu trong ó có ting Vit là mt vn  quan trng, này c chun hóa theo thi gian. Kt qu c th nghim mang tính thi s hin nay. trên 6221 t phát âm ri rc ca ting Vit vi 3 ngi nói. Các Bên cnh ting Vit, ting ph thông Trung Quc và ting th nghim c thc hin theo phng pháp so sánh chéo (cross-validation). Các kt qu th nghim cho thy quan im Thái Lan cng là các ngôn ng có thanh iu. Vi c hai ngôn coi thanh iu ch tn ti trên phn hu thanh ca âm tit cho ng này, Yang, W. [3], Charnvivit, P. [4] và cng s ã s kt qu nhn dng cao hn so vi quan im coi thanh iu tn dng tn s cơ bn  làm tham s s dng cho quá trình nhn ti trên c âm tit. Ngoài ra, trong các phng pháp nhn dng dng thanh iu. Kt qu ca các nghiên cu này cho thy F0 c th nghim, phng pháp QDA cho kt qu nhn dng cao là mt tham s hiu qu khi s dng mô hình HMM  biu nht. din cho thanh iu. Trong nhng nm gn ây, ã có mt s công trình nghiên Keywords- thanh iu ting Vit, nhn dng thanh iu, tn s cu nhn dng ting Vit nói trong ó có b sung thông tin v c bn F0, phân tích khác bit tuyn tính, phân tích khác bit toàn phng, K láng ging gn nht, máy h tr véc t. thanh iu. Lê Vit Bc và cng s [9][12] s dng phơng pháp thích nghi t mt ngôn ng không có thanh iu (ting I. GII THIU Pháp)  xây dng mô hình cho ting Vit. Trong khi ó, V Hi Quân [10], V Ngc Thng [11] và cng s li b sung tn Khác vi phn ln các ngôn ng trên th gii, ting Vit là s cơ bn F0 nh mt tham s cùng vi các tham s MFCC  mt trong các ngôn ng có thanh iu. Vi loi ngôn ng này, dùng làm tham s c trng cho tng khung ting nói. ng ngha ca âm tit s thay i khi thay i thanh iu ca Mt hng nghiên cu khác là tách ri, thc hin song âm tit ó [1]. Hai yu t chính  phân bit bao gm cao  và song nhn dng âm tit cơ bn (âm tit coi nh không có thanh mc  bin thiên phc tp ca thanh iu. Các thanh iu iu) vi nhn dng thanh iu riêng r. Nguyn Hng Quang c phân bit vi nhau ch yu qua qui lut bin thiên theo và cng s [14] ã s dng các tham s MFCC, F0  xây thi ...

Tài liệu được xem nhiều: