Luận văn này xây dựng với mong muốn góp phần khắc phục những hạn chế trên, nâng cao hiệu quả nhận dạng tiếng Việt; bằng cách rút trích và sử dụng nhiều đặc trưng âm học tiếng Việt hơn, từ đó dùng nhiều đặc trưng hơn để nhận dạng giúp nâng cao độ chính xác và phân biệt được các từ đồng âm góp phần nâng kích thước từ điển lên lớn hơn.
Nội dung trích xuất từ tài liệu:
Luận văn: Nghiên cứu các đặc trưng tiếng Việt áp dụng vào nhận dạng tiếng nói tiếng Việt ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN BỘ MÔN CÔNG NGHỆ TRI THỨC hóóóg LUẬN VĂN TỐT NGHIỆP CỬ NHÂN CÔNG NGHỆ THÔNG TIN NGHIÊN CỨUCÁC ĐẶC TRƯNG CỦA TIẾNG VIỆT ÁP DỤNG VÀO NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT Giáo viên hướng dẫn: Th.S Thái Hùng Văn Sinh viên thực hiện: Đỗ Xuân Đạt – 9912540 Võ Văn Tuấn – 9912737 Thành phố Hồ Chí Minh, tháng 7 năm 2003 Lời Cảm Ơn Hoàn thành luận văn này, chúng em xin chân thành cảmơn thầy Thái Hùng Văn đã trực tiếp hướng dẫn và tạo điều kiệncho chúng em tiếp cận với lĩnh vực nhận dạng tiếng nói, một lĩnhvực vô cùng lý thú. Chúng em xin gởi lời cảm ơn đến các thầy cô trongtrường, đặc biệt là các thầy cô bộ môn Công Nghệ Tri Thức, vàthầy Trần Tiến Đức trường ĐH Sư Phạm Kỹ Thuật đã truyền đạtcho chúng em nhiều kiến thức bổ ích. Chúng tôi cũng không thể không nhắc đến sự động viênchăm sóc của gia đình, sự cộng tác giúp đỡ và ủng hộ tinh thầncủa bạn bè, đặc biệt là bạn Nguyễn Tấn Dũng và anh ĐặngHoàng Vũ. Chúng tôi xin ghi ơn tất cả. Thành phố Hồ Chí Minh, tháng 7 năm 2003. Đỗ Xuân Đạt - Võ Văn Tuấn iLời Giới Thiệu Trong quá trính tiến hoá, con người đã trở thành động vật mạnh nhất, caocấp nhất nhờ vào hai thứ: lao động và tiếng nói. Lao động tạo ra tư duy và tiếngnói giúp con người kết hợp với nhau. Cùng với thời gian, các phương tiện giaotiếp - thông tin của con người đã phát triển rất phong phú đa dạng. Tuy nhiên, dùđa dạng đến đâu cũng không thể thay thế được vai trò của tiếng nói. Tiếng nói làmột phương tiện giao tiếp đặc biệt hiệu quả và cực kỳ phổ dụng, là một chức năngvô cùng quý giá của con người [L.V.Lợi-99]. Sự phát triển vượt bậc của con ngườichính là nhờ ở tốc độ và khả năng giao tiếp phong phú của tiếng nói. Ngày nay, nhờ sự phát triển của khoa học kỹ thuật, máy móc dần dần thaythế các lao động tay chân. Tuy nhiên để điều khiển máy móc, con người phải làmkhá nhiều thao tác tốn nhiều thời gian và cần phải được đào tạo. Điều này gây trởngại không ít đối với việc sử dụng các máy móc, thành tựu khoa học kỹ thuật.Chúng ta hãy tưởng tượng trong nhà có một người máy giúp việc. Khi ta muốnngười máy làm việc, ta phải lục tìm đĩa chương trình tương ứng, phải nạp chươngtrình, … phải chạy lăng xăng làm một danh sách các công việc trong khi lúc đó tađang ngồi bên bàn làm việc, đang phải tập trung suy nghĩ vào một vấn đề cần giảiquyết. Và ta hãy tưởng tượng xem nếu người máy đó “nghe hiểu” được những gìta nói. Lúc đó ta chỉ cần “nhờ vả” một câu, mọi việc sẽ trở nên dễ dàng! Đi tìm giải pháp giúp cho máy có thể “nghe hiểu” được, con người đã bướcvào lĩnh vực nhận dạng tiếng nói. Hơn nửa thế kỷ trôi qua, con người đã thu đượcnhững thành tựu đáng kể, có những ứng dụng khá hữu ích vào đời sống. Nhưng dùsao, khả năng “nghe hiểu” của máy vẫn còn một khoảng cách khá xa so với thựctế. Mặt khác, các hệ thống nhân dạng hiện nay cũng chỉ được phát triển tương đốitốt đối với một số ngôn ngữ như tiếng Anh, tiếng Pháp, tiếng Hoa,… Còn đối vớinước ta, nhận dạng tiếng nói vẫn còn là một lĩnh vực khá mới mẻ. Đến nay tuycũng đã đạt được một số thành tựu và đã có những ứng dụng nhất định, nhưngnhìn chung, nhận dạng tiếng Việt vẫn chưa đạt được kết quả cần thiết để có thể tạora một sản phẩm thực tế hoàn chỉnh. Khó khăn nằm ở tính phức tạp của vấn đề vàmức độ đầu tư cũng như kế thừa chưa cao. Các nghiên cứu chủ yếu vẫn là nhận iidạng tiếng nói chung chung chứ chưa có nhiều phân tích kỹ các đặc tính riêng c ủatiếng Việt. Các hệ nhận dạng trước đây hầu hết không phân biệt được từ đồng âmnhư: a, á, à, ả, ã, ạ… Hơn nữa kích thước từ điển (số từ nhận biết được) còn nhỏ,thời gian học mẫu khá lâu, và nhận dạng mang tính ph ụ thuộc người nói khá cao.Vấn đề còn khó khăn ở chỗ nhận dạng tiếng nói mang tính liên ngành [T.H.Văn-00]. Nghiên cứu nhận dạng tiếng nói bằng máy tính là nghiên cứu cả một hệ thốngcác ngành khoa học có liên quan như: ngôn ng ữ học, thống kê h ọc, sinh lý học, vậtlý học, toán học, âm học, tâm lý học, lý thuyết thông tin và truy ền tin… và dĩnhiên có cả công nghệ thông tin. Luận văn này xây dựng với mong muốn góp phần khắc phục những hạn chếtrên, nâng cao hiệu quả nhận dạng tiếng Việt; bằng cách rút trích và sử dụng nhiềuđặc trưng âm học tiếng Việt hơn, từ đó dùng nhiều đặc trưng hơn để nhận dạnggiúp nâng cao độ chính xác và phân bi ệt được các từ đồng âm góp phần nâng kíchthước từ điển lên lớn hơn. Nội dung luận văn được trình bày thành các ch ương như sau: Chương 1: Tiếng nói và ngữ âm tiếng Việt. Chương thứ nhất tóm tắt vềtiếng nói và trình bày một số đặc điểm ngữ âm tiếng Việt. Trong số đó, luận vănquan tâm nhiều đến thanh điệu, là đặc điểm khác biệt của tiếng Việt so với nhiềungôn ngữ khác. Chương 2: Xử lý tín hiệu số - phân tích tiếng nói: Trình bày một số kiếnthức cơ bản về xử lý tín hiệu số và một số phương pháp tiếp cận tín hiệu tiếng nói. Chương 3: Nhận dạng tiếng nói. Chương này mô tả một hệ nhận dạngtiếng nói tổng quát, và đi cụ thể vào hệ nhận dạng tiếng nói sử dụng mô hìnhMarkov ẩn liên tục. Chương 4: Một số khảo sát về thanh điệu tiếng Việt. Đây là các khảo sátcủa người viết về thanh điệu tiếng Việt. Kết quả khảo sát sẽ được kết hợp, so sánhvới các nghiên cứu về ngữ âm tiếng Việt trước đây để rút ra các đặc điểm ngữ âmtiếng Việt, làm cơ sở cho việc xây dựng một hệ nhận dạng tiếng Việt theo mô tảcủa luận văn. Chương 5: Xây dựng mô hình nhận dạng thanh điệu tiếng Việt. Nhậndạng thanh điệu là bước đầu tiên ứng dụng các nghiên cứu nói trên vào một hệ ...