Danh mục

Kỹ thuật nhận dạng tiếng nói là ứng dụng trong điều khiển

Số trang: 5      Loại file: pdf      Dung lượng: 165.07 KB      Lượt xem: 7      Lượt tải: 0    
tailieu_vip

Phí lưu trữ: miễn phí Tải xuống file đầy đủ (5 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Vấn đề nhận dạng tiếng nói tiếng Việt chỉ mới được quan tâm nghiên cứu trong những năm gần đây và chưa có một chương trình nhận dạng hoàn chỉnh nào được công bố. Trên thế giới đã có rất nhiều hệ thống nhận dạng tiếng nói (tiếng Anh) đã và đang được ứng dụng rất hiệu quả như: Via Voice của IBM, Spoken Toolkit của CSLU (Central of Spoken Laguage Understanding)… nhưng trong tiếng Việt thì còn rất nhiều hạn chế. ...
Nội dung trích xuất từ tài liệu:
Kỹ thuật nhận dạng tiếng nói là ứng dụng trong điều khiển KỸ THUẬT NHẬN DẠNG TIẾNG NÓI và ỨNG DỤNG TRONG ĐIỀU KHIỂN TS. Nguyễn Văn Giáp KS. Trần Việt Hồng Bộ môn Cơ điện tử - Khoa Cơ khí – Đại học Bách Khoa TPHCM nvgiap@dme.hcmut.edu.vn; tvhong@dme.hcmut.edu.vn TÓM TẮT Vấn đề nhận dạng tiếng nói tiếng Việt chỉ mới được quan tâm nghiên cứu trong những năm gần đây và Vấn đề nghiên cứu các phương pháp nhận dạng chưa có một chương trình nhận dạng hoàn chỉnh tiếng nói đã và đang thu hút rất nhiều sự đầu tư và nào được công bố. nghiên cứu của các nhà khoa học trên khắp thế giới. Tuy nhiên cho đến nay kết quả mang lại vẫn Trên thế giới đã có rất nhiều hệ th ống nhận dạng chưa hoàn toàn làm hài lòng những người nghiên tiếng nói (tiếng Anh) đã và đang được ứng dụng rất cứu do tính chất quá phức tạp và không cố định của hiệu quả như: Via Voice củ a IBM, Spoken Toolkit đối tượng nhận dạng là tiếng nói con người. Đặc của CSLU (Central of Spoken Laguage Under- biệt, đối với tiếng Việt thì kết quả càng còn nhiều standing)… nhưng trong tiếng Việt thì còn rất nhiều hạn chế. Bài báo trình bày một hướng nhận dạng hạn chế. tiếng nói tiếng Việt, dựa trên việc trích đặc trưng 1.3 Mục tiêu của đề tài tiếng nói bằng phương pháp MFCC và bộ nhận dạng dùng mạng HMM. Kết quả được kiểm nghiệm Đề tài này nghiên cứu thử n ghiệm một h ướng nhận thực tế bằng mô hình xe điều khiển từ xa. dạng tiếng nói - tiếng Việt d ựa trên vi ệc trích đặc trưng của tiếng nói bằng ph ương pháp MFCC (Mel- ABSTRACT Frequency Ceptrums Coefficients), và nhận dạng bằng mô hình HMM (Hidden Markov Models). Researching and inventing speech recognition Đồng thời, một mô hình điều khiển bằng tiếng nói – methods have been paid much considerations by tiếng Việt được xây dựng với bộ từ vựng nhỏ, thiết many scientists over the world. However, the lập hệ thống điều khiển bằng tiếng nói với một tập achievements don’t satisfy researchers’ demands lệnh cố định. Tập lệnh này dùng để điều khiển because of the complexity and unstability of speech Robot, và mô hình điều khiển xe bằng tiếng nói until now. Especially with Vietnamese speech, the hoàn chỉnh là một ứng dụng thực tế mang tính thử results are more unsatisfied. The paper suggests a nghiệm của đề tài. synthetic method for recogniting Vietnamese speech: extract speech’s particularities by MFCC 2 XÂY DỰNG HỆ THỐNG NHẬN DẠNG method and recognize by HMM network. The TIẾNG NÓI results are experimented through a model of RF Một hệ thống nhận dạng nói chung thường bao gồm controlled car. hai phần: phần huấn luyện (training phase) và phần 1 ĐẶT VẤN ĐỀ nhận dạng (recognition phase). “Huấn luyện” là quá 1.1 Giới thiệu trình hệ thống “học” những mẫu chuẩn được cung cấp bởi những tiếng khác nhau (từ hoặc âm), để từ Ngày nay, cùng với sự phát triển của ngành điện tử đó hình thành bộ từ vựng của h ệ thống. “Nhận và tin học, các hệ thống máy tự động đã dần thay dạng” là quá trình quyết định xem từ nào đ ược đọc thế con người trong nhiều công đoạn của công việc. căn cứ vào bộ từ vựng đã đ ược huấn luyện. Sơ đ ồ Máy có khả n ăng làm việc hiệu quả và năng suất tổng quát của hệ thống nhận dạng tiếng nói được cao hơn con người rất nhiều. Song cho đến nay, vấn thể hiện trên hình 1. đề giao tiếp người – máy tuy đã được cải thiện nhiều nhưng vẫn còn rất thủ công: thông qua bàn Để thuận tiện cho việc kiểm tra và đánh giá kết quả, phím và các thiết bị nhập dữ liệu khác. Giao tiếp từ sơ đồ trên chúng tôi chia ch ương trình nhận dạng với thiết bị máy bằng tiếng nói sẽ là phương thức thành ba mô-đun riêng biệt: giao tiếp văn minh và tự nhiên nhất, dấu ấn giao ! Mô-đun 1: Thực hiện việc ghi âm tín hiệu tiếng tiếp người – máy sẽ mất đi mà thay vào đó là cảm nói, tách tiếng nói khỏi nền nhiễu và lưu vào nhận của sự giao tiếp giữa người với người, nếu cơ sở dữ liệu. hoàn thiện thì đây sẽ là một ph ương thức giao tiếp tiện lợi và hiệu quả nhất. ! Mô-đun 2: Trích đ ặc trưng tín hiệu tiếng nói đã thu ở mô-đun 1 bằng phương pháp MFCC, Do có sự khác bi ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: