ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGA
Số trang: 7
Loại file: pdf
Dung lượng: 444.96 KB
Lượt xem: 19
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mô hình Markov ẩn (HMM) là một mô hình thống kê, thích hợp ứngdụng trong việc nhận dạng mẫu: tiếng nói, hình ảnh và chữ viết…HMM được ứng dụng rộng rãi trong những năm gần đây vi hai lý do.Thứ nhất, mô hình có độ chính xác cao trong nhiều ứng dụng; Thứ hai,cấu trúc mô hình có thể thay đổi dễ dàng cho phù hợp với từng ứngdụng cụ thể.
Nội dung trích xuất từ tài liệu:
ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGATạp chí Khoa học Trường Đại học Cần Thơ Phần A: Khoa học Tự nhiên, Công nghệ và Môi trường: 25 (2013): 1-7ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGANguyễn Cao Quí11 Bộ môn Điện tử Viễn thông, Khoa Công nghệ, Trường Đại học Cần ThơThông tin chung: ABSTRACTNgày nhận: 11/10/2011 Hidden Markov Model (HMM) is a statistical model, well suited forNgày chấp nhận: 25/03/2013 pattern recognition: speech, image, handwriting,... HMM has widely used in the last several years because of the two reasons. First it canTitle: perform with high accuracy in a wide range of application, second theSpeech recognition using hidden model structure can be changed easily to fit practical applications.Markov model on FPGA This paper focused on studying of HMM for speech recognition and installing it on FPGA. HMM has many parameters, so choosingTừ khóa: appropriate parameters of the model for the FPGA is included in theNhận dạng, tiếng nói, mô hình project. The selection is very important and must balance between timeMarkov ẩn, FPGA and accuracy.Keywords: TÓM TẮTSpeech recognition, hidden Markov Mô hình Markov ẩn (HMM) là một mô hình thống kê, thích hợp ứngmodel, FPGA dụng trong việc nhận dạng mẫu: tiếng nói, hình ảnh và chữ viết… HMM được ứng dụng rộng rãi trong những năm gần đây vi hai lý do. Thứ nhất, mô hình có độ chính xác cao trong nhiều ứng dụng; Thứ hai, cấu trúc mô hình có thể thay đổi dễ dàng cho phù hợp với từng ứng dụng cụ thể. Bài báo này tập trung nghiên cứu mô hình Markov ẩn theo hướng ứng dụng nhận dạng tiếng nói và cài đặt mô hình này lên chip FPGA. HMM có nhiều tham số, vì vậy việc lựa chọn tham số sao cho tốt nhất cũng được thực hiện trong đề tài. Việc lựa chọn này rất quan trọng, nó phải đạt được sự cân bằng giữa tốc độ xử lý và độ chính xác. Hệ thống nhận dạng này được cài đặt trên FPGA để nhận dạng các từ đơn, số lượng từ trong bộ từ vựng có thể thay đổi nhờ khả năng có thể huấn luyện của HMM. Do hệ thống nhận dạng này được cài đặt trên FPGA nên nó chiếm khoảng không nhỏ, thích hợp ứng dụng trong giao tiếp người-máy, robot, điều khiển bằng tiếng nói hay hỗ trợ người khuyết tật…1 GIỚI THIỆU lĩnh vực nhận dạng. Do đạt được độ chính xác cao và có khả năng thay đổi cấu trúc dễ dàng HMM được bắt đầu xây dựng và công bố từ nên mô hình này ngày càng được sử dụng rộngnhững năm 1960, đây là mô hình toán học về rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnhthống kê. Nhiều năm sau đó (từ 1980), mô hình vực nhận dạng tiếng nói.này được bắt đầu nghiên cứu để ứng dụng trong 1Tạp chí Khoa học Trường Đại học Cần Thơ Phần A: Khoa học Tự nhiên, Công nghệ và Môi trường: 25 (2013): 1-7 Năm 1952, phòng thí nghiệm Bell phát triểnmáy nhận dạng tiếng nói đơn với các từ vựng làcác số. Hệ thống này dựa trên sự cộng hưởngphổ tần của các số nên có độ chính xác rất thấp.Đến những năm 1970, việc nghiên cứu máynhận dạng tiếng nói đạt được một bước tiếnđáng kể nhờ vào sự phát triển của lý thuyếtnhận dạng mẫu và thuật toán tiên đoán tuyếntính LPC (linear predictive coding) để rút tríchđặc trưng của tín hiệu tiếng nói. Từ năm 1980,các phương pháp thống kê bắt đầu đượcsử dụng mạnh mẽ trong kỹ thuật nhận dạng,đặc biệt là mô hình Markov do nó có độ chínhxác cao. Mục tiêu của đề tài này là tạo ra thiết bịnhận dạng tiếng nói nhỏ gọn nhưng có độ chínhxác và đạt tốc độ cao. Vì vậy công việc chính Hình 1: HMM 5 trạng tháitrong đề tài này là nghiên cứu lý thuyết HMM Hai vấn đề chính của HMM:và tập trung vào ...
Nội dung trích xuất từ tài liệu:
ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGATạp chí Khoa học Trường Đại học Cần Thơ Phần A: Khoa học Tự nhiên, Công nghệ và Môi trường: 25 (2013): 1-7ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGANguyễn Cao Quí11 Bộ môn Điện tử Viễn thông, Khoa Công nghệ, Trường Đại học Cần ThơThông tin chung: ABSTRACTNgày nhận: 11/10/2011 Hidden Markov Model (HMM) is a statistical model, well suited forNgày chấp nhận: 25/03/2013 pattern recognition: speech, image, handwriting,... HMM has widely used in the last several years because of the two reasons. First it canTitle: perform with high accuracy in a wide range of application, second theSpeech recognition using hidden model structure can be changed easily to fit practical applications.Markov model on FPGA This paper focused on studying of HMM for speech recognition and installing it on FPGA. HMM has many parameters, so choosingTừ khóa: appropriate parameters of the model for the FPGA is included in theNhận dạng, tiếng nói, mô hình project. The selection is very important and must balance between timeMarkov ẩn, FPGA and accuracy.Keywords: TÓM TẮTSpeech recognition, hidden Markov Mô hình Markov ẩn (HMM) là một mô hình thống kê, thích hợp ứngmodel, FPGA dụng trong việc nhận dạng mẫu: tiếng nói, hình ảnh và chữ viết… HMM được ứng dụng rộng rãi trong những năm gần đây vi hai lý do. Thứ nhất, mô hình có độ chính xác cao trong nhiều ứng dụng; Thứ hai, cấu trúc mô hình có thể thay đổi dễ dàng cho phù hợp với từng ứng dụng cụ thể. Bài báo này tập trung nghiên cứu mô hình Markov ẩn theo hướng ứng dụng nhận dạng tiếng nói và cài đặt mô hình này lên chip FPGA. HMM có nhiều tham số, vì vậy việc lựa chọn tham số sao cho tốt nhất cũng được thực hiện trong đề tài. Việc lựa chọn này rất quan trọng, nó phải đạt được sự cân bằng giữa tốc độ xử lý và độ chính xác. Hệ thống nhận dạng này được cài đặt trên FPGA để nhận dạng các từ đơn, số lượng từ trong bộ từ vựng có thể thay đổi nhờ khả năng có thể huấn luyện của HMM. Do hệ thống nhận dạng này được cài đặt trên FPGA nên nó chiếm khoảng không nhỏ, thích hợp ứng dụng trong giao tiếp người-máy, robot, điều khiển bằng tiếng nói hay hỗ trợ người khuyết tật…1 GIỚI THIỆU lĩnh vực nhận dạng. Do đạt được độ chính xác cao và có khả năng thay đổi cấu trúc dễ dàng HMM được bắt đầu xây dựng và công bố từ nên mô hình này ngày càng được sử dụng rộngnhững năm 1960, đây là mô hình toán học về rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnhthống kê. Nhiều năm sau đó (từ 1980), mô hình vực nhận dạng tiếng nói.này được bắt đầu nghiên cứu để ứng dụng trong 1Tạp chí Khoa học Trường Đại học Cần Thơ Phần A: Khoa học Tự nhiên, Công nghệ và Môi trường: 25 (2013): 1-7 Năm 1952, phòng thí nghiệm Bell phát triểnmáy nhận dạng tiếng nói đơn với các từ vựng làcác số. Hệ thống này dựa trên sự cộng hưởngphổ tần của các số nên có độ chính xác rất thấp.Đến những năm 1970, việc nghiên cứu máynhận dạng tiếng nói đạt được một bước tiếnđáng kể nhờ vào sự phát triển của lý thuyếtnhận dạng mẫu và thuật toán tiên đoán tuyếntính LPC (linear predictive coding) để rút tríchđặc trưng của tín hiệu tiếng nói. Từ năm 1980,các phương pháp thống kê bắt đầu đượcsử dụng mạnh mẽ trong kỹ thuật nhận dạng,đặc biệt là mô hình Markov do nó có độ chínhxác cao. Mục tiêu của đề tài này là tạo ra thiết bịnhận dạng tiếng nói nhỏ gọn nhưng có độ chínhxác và đạt tốc độ cao. Vì vậy công việc chính Hình 1: HMM 5 trạng tháitrong đề tài này là nghiên cứu lý thuyết HMM Hai vấn đề chính của HMM:và tập trung vào ...
Tìm kiếm theo từ khóa liên quan:
mô hình Markov ẩn MÔ HÌNH MARKOV báo cáo khoa học nghiên cứu khoa học công nghệ môi trường khoa học tự nhiênGợi ý tài liệu liên quan:
-
Đề tài nghiên cứu khoa học: Kỹ năng quản lý thời gian của sinh viên trường Đại học Nội vụ Hà Nội
80 trang 1553 4 0 -
Tiểu luận: Phương pháp Nghiên cứu Khoa học trong kinh doanh
27 trang 496 0 0 -
57 trang 339 0 0
-
33 trang 333 0 0
-
63 trang 315 0 0
-
176 trang 278 3 0
-
Tiểu luận môn Phương Pháp Nghiên Cứu Khoa Học Thiên văn vô tuyến
105 trang 272 0 0 -
95 trang 269 1 0
-
Phương pháp nghiên cứu trong kinh doanh
82 trang 267 0 0 -
13 trang 264 0 0