Đề xuất nhận dạng tiếng Việt Nam cho điện thoại di động
Số trang: 8
Loại file: pdf
Dung lượng: 457.26 KB
Lượt xem: 13
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Đã 20 năm qua, nhận dạng tiếng nói vẫn là một nỗ lực lớn để tạo ra trí tuệ cho máy tính, nỗ lực không ngừng này đã mang lại ứng dụng trong quản lý điện thoại. Khởi đầu với nhận dạng đọc các chữ số từ 0 đến 9 trong ứng dụng này, sau đó là các bài toán nhận dạng các từ cô lập. Chúng ta bắt đầu bước vào lĩnh vực nhận dạng tiếng nói với từ vựng lớn, khi đó các yêu cầu về yếu tố bền vững của nhận dạng tiếng nói trở lên cần thiết, nghĩa là: Hệ thống không dễ đổ vỡ khi gặp bất kì một lỗi nhận dạng, một lỗi phần mềm; khi gặp một tình huống nhận dạng ngoài ý muốn, hệ thống dễ dàng khôi phục để tiếp tục tiến trình nhận dạng liên tục.
Nội dung trích xuất từ tài liệu:
Đề xuất nhận dạng tiếng Việt Nam cho điện thoại di động 10 Khoa hoïc - kó thuaäät ÑEÀ XUAÁT NHAÄN DAÏNG TIEÁNG VIEÄT NAM CHO ÑIEÄN THOAÏI DI ÑOÄNG (Nguyeãn Vaên Khieâm, Leâ Quaân Haø, Hoaøng Tieán Long, Nguyeãn Höõu Tình, Nguyeãn Ngoïc Thaém, Ñoã Hoàng Thy)* TOÙM TAÉT Ñaõ 20 naêm qua, nhaän daïng tieáng noùi vaãn laø moät noã löïc lôùn ñeå taïo ra trí tueä cho maùy tính, noã löïc khoâng ngöøng naøy ñaõ mang vöïng lôùn treân caùc thieát bò caàm tay. Chuùng toâi laïi öùng duïng trong quaûn lyù ñieän thoaïi. Khôûi ñaõ nhuùng ñöôïc tieáng Vieät töø vöïng lôùn laø ñaàu vôùi nhaän daïng ñoïc caùc chöõ soá töø 0 ñeán 9 7660 töø tieáng Vieät, ñaït ñoä chính xaùc laø trong öùng duïng naøy (digit recognition), sau 98,13% tæ leä loãi töø 1,87%. ñoù laø caùc baøi toaùn nhaän daïng caùc töø coâ laäp (isolated word recognition). Töø sau thaäp PROPOSAL FOR nieân 90, chuùng ta baét ñaàu böôùc vaøo lónh vöïc IETNAMESE RECOGNITION FOR nhaän daïng tieáng noùi vôùi töø vöïng lôùn, khi ñoù MOBILE PHONE caùc yeâu caàu veà yeáu toá beàn vöõng cuûa nhaän daïng tieáng noùi trôû neân caàn thieát, nghóa laø: ABSTRACT heä thoáng khoâng deã ñoå vôõ khi gaëp baát kyø moät Over the past 20 years, speech loãi nhaän daïng, moät loãi phaàn meàm; khi gaëp recognition has been still a major effort to moät tình huoáng nhaän daïng ngoaøi yù muoán, heä create intelligence for the computer. The thoáng deã daøng khoâi phuïc ñeå tieáp tuïc tieán ceaseless effort has brought the application trình nhaän daïng lieân tuïc.* in the phone management. We started with Söï xuaát hieän cuûa vieäc nhaän daïng recognition of reading numbers from 0 to 9 tieáng noùi treân ñieän thoaïi di ñoäng vaø caùc thieát in this application (digit recognition), then bò nhuùng ñaõ môû ra loaïi hình nghieân cöùu môùi the problems of isolated word recognition. veà caùc öùng duïng töông taùc giöõa con ngöôøi vaø Since the 1990s onwards, we have started to maùy tính. Nhöng haàu heát caùc hoaït ñoäng enter a field of speech recognition with trong lónh vöïc naøy ñeán nay ñaõ bò giôùi haïn do large vocabulary. Thus, requests for the caùc vaán ñeà veà ñoäc quyeàn phaàn meàm, hoaëc sustainability element of the speech chæ nhaän daïng nhöõng caâu coù caáu truùc ngöõ recognition becomes necessary, that is, the phaùp ñôn giaûn vaø bò haïn cheá. Trong phaàn system is not easily broken to meet any nghieân cöùu naøy, chuùng toâi seõ trình baøy sô recognized errors or a software errors. löôïc veà Pocket Sphinx, moät heä thoáng maõ When a situation of unintended recognition nguoàn môû veà nhaän daïng tieáng noùi lieân tuïc töø is encountered, the system shall easily restore to continue the ongoing process of recognition. * Khoa Công Nghệ Thông Tin, trường Đại Học Công Nghiệp Tp.HCM Khoa hoïc - kó thuaäät 11 khoâng coù maõ nguoàn keøm theo. Ñoàng thôøi, caùc heä ñieàu haønh treân thieát bò nhuùng thöôøng GIÔÙI THIEÄU bò thieáu caùc tính naêng cho caùc nhaø phaùt Caùc öùng duïng veà tieáng noùi treân thieát trieån khoâng gioáng nhö treân caùc heä thoáng bò nhuùng, ñieän thoaïi di ñoäng thöôøng ñoøi hoûi maùy tính ñeå baøn. phaûi lieân tuïc vaø nhaän daïng ôû thôøi gian thöïc. Raát nhieàu öùng duïng veà gioïng noùi hieän taïi, HEÄ THOÁNG OCKETSPHINX chaúng haïn nhö ñieàu khieån chuyeån höôùng Boä nhaän daïng SPHINX laø neàn taûng cuûa heä thoáng ñònh vò toaøn caàu, choïn nhaïc raát toát cho söï phaùt trieån nhaän daïng gioïng cho maùy haùt nhaïc, hoaëc caùc öùng duïng veà noùi, vaø chuùng ñang ñöôïc söû duïng bôûi caùc ngoân ngöõ töï nhieân nhö thieát bò chuyeån ñoåi nhaø nghieân cöùu trong caùc lónh vöïc ví duï ngoân ngöõ töø gioïng noùi (speech-to-speech nhö: heä thoáng ñoái thoaïi vaø heä thoáng maùy translation) [tham khaûo theâm A.Waibel, A. tính hoã trôï hoïc taäp… Trong soá caùc boä nhaän Badran, A. W Black, R. Frederking, D. daïng CMU SPHINX, PocketSphinx laø coâng Gates, A. Lavie, L. Levin, K. Lenzo, L. cuï ñaõ ñöôïc toái öu cho nhaän daïng tieáng noùi Mayfield Tomokiyo, J.Reichert, T. Schultz, treân thieát bò nhuùng vaø ñieän thoaïi di ñoäng. D. Wallace, M. Woszczyna, vaø J. Zhang 2003],... ñeàu ñoøi hoûi phaûi nhanh, chính xaùc vaø linh ñoäng. TOÁI ÖU HOÙA Vieäc trieån khai vaø caøi ñaët caùc öùng Do phaàn cöùng cuûa thieát bò nhuùng vaø duïng treân caùc thieát bò nhuùng gaëp raát nhieåu ñieän thoaïi di ñoäng so vôùi maùy PC coù nhieàu khoù khaên, trong ñoù khoù khaên lôùn nhaát laø khaùc bieät cho neân coù caùc löu yù sau: yeâu caàu nhaän daïng gioïng noùi lieân tuïc cho Toác ñoä truy caäp boä nhôù chaäm moät ngöõ caûnh töø vöïng töø vöøa ñeán lôùn. Ngoaøi Toå chöùc döõ lieäu sao cho töông thích ra coøn coù caùc trôû ngaïi veà phaàn cöùng: CPU vôùi phaàn cöùng CPU cuûa thieát bò nhuùng khoâng hoã trôï kieåu daáu Caàn thay ñoåi caùc ñoaïn maõ khoâng phaåy ñoäng, boä ...
Nội dung trích xuất từ tài liệu:
Đề xuất nhận dạng tiếng Việt Nam cho điện thoại di động 10 Khoa hoïc - kó thuaäät ÑEÀ XUAÁT NHAÄN DAÏNG TIEÁNG VIEÄT NAM CHO ÑIEÄN THOAÏI DI ÑOÄNG (Nguyeãn Vaên Khieâm, Leâ Quaân Haø, Hoaøng Tieán Long, Nguyeãn Höõu Tình, Nguyeãn Ngoïc Thaém, Ñoã Hoàng Thy)* TOÙM TAÉT Ñaõ 20 naêm qua, nhaän daïng tieáng noùi vaãn laø moät noã löïc lôùn ñeå taïo ra trí tueä cho maùy tính, noã löïc khoâng ngöøng naøy ñaõ mang vöïng lôùn treân caùc thieát bò caàm tay. Chuùng toâi laïi öùng duïng trong quaûn lyù ñieän thoaïi. Khôûi ñaõ nhuùng ñöôïc tieáng Vieät töø vöïng lôùn laø ñaàu vôùi nhaän daïng ñoïc caùc chöõ soá töø 0 ñeán 9 7660 töø tieáng Vieät, ñaït ñoä chính xaùc laø trong öùng duïng naøy (digit recognition), sau 98,13% tæ leä loãi töø 1,87%. ñoù laø caùc baøi toaùn nhaän daïng caùc töø coâ laäp (isolated word recognition). Töø sau thaäp PROPOSAL FOR nieân 90, chuùng ta baét ñaàu böôùc vaøo lónh vöïc IETNAMESE RECOGNITION FOR nhaän daïng tieáng noùi vôùi töø vöïng lôùn, khi ñoù MOBILE PHONE caùc yeâu caàu veà yeáu toá beàn vöõng cuûa nhaän daïng tieáng noùi trôû neân caàn thieát, nghóa laø: ABSTRACT heä thoáng khoâng deã ñoå vôõ khi gaëp baát kyø moät Over the past 20 years, speech loãi nhaän daïng, moät loãi phaàn meàm; khi gaëp recognition has been still a major effort to moät tình huoáng nhaän daïng ngoaøi yù muoán, heä create intelligence for the computer. The thoáng deã daøng khoâi phuïc ñeå tieáp tuïc tieán ceaseless effort has brought the application trình nhaän daïng lieân tuïc.* in the phone management. We started with Söï xuaát hieän cuûa vieäc nhaän daïng recognition of reading numbers from 0 to 9 tieáng noùi treân ñieän thoaïi di ñoäng vaø caùc thieát in this application (digit recognition), then bò nhuùng ñaõ môû ra loaïi hình nghieân cöùu môùi the problems of isolated word recognition. veà caùc öùng duïng töông taùc giöõa con ngöôøi vaø Since the 1990s onwards, we have started to maùy tính. Nhöng haàu heát caùc hoaït ñoäng enter a field of speech recognition with trong lónh vöïc naøy ñeán nay ñaõ bò giôùi haïn do large vocabulary. Thus, requests for the caùc vaán ñeà veà ñoäc quyeàn phaàn meàm, hoaëc sustainability element of the speech chæ nhaän daïng nhöõng caâu coù caáu truùc ngöõ recognition becomes necessary, that is, the phaùp ñôn giaûn vaø bò haïn cheá. Trong phaàn system is not easily broken to meet any nghieân cöùu naøy, chuùng toâi seõ trình baøy sô recognized errors or a software errors. löôïc veà Pocket Sphinx, moät heä thoáng maõ When a situation of unintended recognition nguoàn môû veà nhaän daïng tieáng noùi lieân tuïc töø is encountered, the system shall easily restore to continue the ongoing process of recognition. * Khoa Công Nghệ Thông Tin, trường Đại Học Công Nghiệp Tp.HCM Khoa hoïc - kó thuaäät 11 khoâng coù maõ nguoàn keøm theo. Ñoàng thôøi, caùc heä ñieàu haønh treân thieát bò nhuùng thöôøng GIÔÙI THIEÄU bò thieáu caùc tính naêng cho caùc nhaø phaùt Caùc öùng duïng veà tieáng noùi treân thieát trieån khoâng gioáng nhö treân caùc heä thoáng bò nhuùng, ñieän thoaïi di ñoäng thöôøng ñoøi hoûi maùy tính ñeå baøn. phaûi lieân tuïc vaø nhaän daïng ôû thôøi gian thöïc. Raát nhieàu öùng duïng veà gioïng noùi hieän taïi, HEÄ THOÁNG OCKETSPHINX chaúng haïn nhö ñieàu khieån chuyeån höôùng Boä nhaän daïng SPHINX laø neàn taûng cuûa heä thoáng ñònh vò toaøn caàu, choïn nhaïc raát toát cho söï phaùt trieån nhaän daïng gioïng cho maùy haùt nhaïc, hoaëc caùc öùng duïng veà noùi, vaø chuùng ñang ñöôïc söû duïng bôûi caùc ngoân ngöõ töï nhieân nhö thieát bò chuyeån ñoåi nhaø nghieân cöùu trong caùc lónh vöïc ví duï ngoân ngöõ töø gioïng noùi (speech-to-speech nhö: heä thoáng ñoái thoaïi vaø heä thoáng maùy translation) [tham khaûo theâm A.Waibel, A. tính hoã trôï hoïc taäp… Trong soá caùc boä nhaän Badran, A. W Black, R. Frederking, D. daïng CMU SPHINX, PocketSphinx laø coâng Gates, A. Lavie, L. Levin, K. Lenzo, L. cuï ñaõ ñöôïc toái öu cho nhaän daïng tieáng noùi Mayfield Tomokiyo, J.Reichert, T. Schultz, treân thieát bò nhuùng vaø ñieän thoaïi di ñoäng. D. Wallace, M. Woszczyna, vaø J. Zhang 2003],... ñeàu ñoøi hoûi phaûi nhanh, chính xaùc vaø linh ñoäng. TOÁI ÖU HOÙA Vieäc trieån khai vaø caøi ñaët caùc öùng Do phaàn cöùng cuûa thieát bò nhuùng vaø duïng treân caùc thieát bò nhuùng gaëp raát nhieåu ñieän thoaïi di ñoäng so vôùi maùy PC coù nhieàu khoù khaên, trong ñoù khoù khaên lôùn nhaát laø khaùc bieät cho neân coù caùc löu yù sau: yeâu caàu nhaän daïng gioïng noùi lieân tuïc cho Toác ñoä truy caäp boä nhôù chaäm moät ngöõ caûnh töø vöïng töø vöøa ñeán lôùn. Ngoaøi Toå chöùc döõ lieäu sao cho töông thích ra coøn coù caùc trôû ngaïi veà phaàn cöùng: CPU vôùi phaàn cöùng CPU cuûa thieát bò nhuùng khoâng hoã trôï kieåu daáu Caàn thay ñoåi caùc ñoaïn maõ khoâng phaåy ñoäng, boä ...
Tìm kiếm theo từ khóa liên quan:
Công nghệ điện tử Nhận dạng tiếng Việt Điện thoại di động Điện tử viễn thông Mạng di động Nhận dạng tiếng nóiGợi ý tài liệu liên quan:
-
Đề cương chi tiết học phần Trí tuệ nhân tạo
12 trang 417 0 0 -
44 trang 289 0 0
-
Đề cương chi tiết học phần Vi xử lý
12 trang 280 0 0 -
Đồ án: Kỹ thuật xử lý ảnh sử dụng biến đổi Wavelet
41 trang 214 0 0 -
79 trang 209 0 0
-
91 trang 183 0 0
-
32 trang 160 0 0
-
Tìm hiểu chương trình đào tạo ngành Điện tử - Viễn thông hệ đại học: Phần 2
174 trang 152 0 0 -
Đề cương chi tiết học phần Thực tập Kỹ thuật truyền hình
16 trang 151 0 0 -
Đồ án: Cấu tạo và nguyên lý hoạt động của màn hình LCD monitor
80 trang 135 0 0