Nhận dạng cử chỉ tay bằng ra-đa FMCW dựa trên mạng nơ ron tích chập kết nối chéo
Số trang: 8
Loại file: pdf
Dung lượng: 856.19 KB
Lượt xem: 12
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Nghiên cứu này đề xuất sử dụng mạng nơ-ron tích chập kết nối chéo (CrossCNN: Cross-connection Convolutional Neural Network) để nhận dạng cử chỉ tay dựa trên dữ liệu phân tích phổ Doppler vi mô (micro-Doppler) của ra-đa FMCW (Frequency Modulated Continuous Wave). Thêm vào đó, các mức nhiễu khác nhau được thêm vào dữ liệu để đánh giá đầy đủ hơn đối với mô hình đề xuất.
Nội dung trích xuất từ tài liệu:
Nhận dạng cử chỉ tay bằng ra-đa FMCW dựa trên mạng nơ ron tích chập kết nối chéoNghiên cứu khoa học công nghệ NHẬN DẠNG CỬ CHỈ TAY BẰNG RA-ĐA FMCW DỰA TRÊN MẠNG NƠ-RON TÍCH CHẬP KẾT NỐI CHÉO Lê Hải1*, Hoàng Văn Phúc1, Đoàn Văn Sáng2, Lê Thị Trang3, Lê Đại Phong1 Tóm tắt: Nghiên cứu này đề xuất sử dụng mạng nơ-ron tích chập kết nối chéo (Cross- CNN: Cross-connection Convolutional Neural Network) để nhận dạng cử chỉ tay dựa trên dữ liệu phân tích phổ Doppler vi mô (micro-Doppler) của ra-đa FMCW (Frequency Modulated Continuous Wave). Thêm vào đó, các mức nhiễu khác nhau được thêm vào dữ liệu để đánh giá đầy đủ hơn đối với mô hình đề xuất. Kết quả thử nghiệm cho thấy, mô hình được huấn luyện với dữ liệu có nhiễu cho chất lượng nhận dạng tốt hơn mô hình được huấn luyện với dữ liệu không có nhiễu. Sau đó, mô hình Cross-CNN được phân tích, đánh giá khi thay đổi các tham số cấu trúc, từ đó chọn ra bộ tham số phù hợp nhất cho bài toán đề ra. Cuối cùng, mô hình Cross-CNN được đánh giá, so sánh với các mô hình hiện có khác khi thực hiện trên cùng một tập dữ liệu. Kết quả là, mạng Cross-CNN cho khả năng nhận dạng cử chỉ tay tốt hơn các mô hình khác nhờ vào các kết nối chéo cho phép sử dụng kết hợp các đặc tính cũ với đặc tính mới trong quá trình huấn luyện mạng.Từ khóa: Mạng nơ-ron tích chập; Nhận dạng cử chỉ tay; Ra đa FMCW; Phổ micro-Doppler. 1. GIỚI THIỆU Hiện nay, với sự phát triển bùng nổ của các hệ thống và thiết bị thông minh, việc điều khiểnkhông tiếp xúc các thiết bị điện tử, gia dụng đang trở nên phổ biến. Theo đó, sự chuyển động củatay, chân, cơ thể hoặc sự thay đổi nét mặt sẽ là những dấu hiệu để các mô-đun giao tiếp người-máy (HMI: human-machine interface) thực hiện việc nhận dạng hoặc phân loại [1]. Các mô-đunHMI thường sử dụng camera quang học để nhận dạng là chủ yếu. Nhưng tính bảo mật riêng tưcủa dữ liệu hình ảnh lại trở thành vấn đề thách thức đối với các nhà phát triển thiết bị. Một giảipháp thay thế cho camera quang học, đó là ra-đa FMCW (Frequency Modulated ContinuousWave), vì nó có tính bảo mật, xử lý nhanh, và tiết kiệm năng lượng [2]. Nắm bắt được lợi thế đó,hiện nay, các hãng sản xuất điện thoại đã bắt đầu sử dụng ra-đa FMCW để nhận biết cử chỉ củacon người nhằm thực hiện một số tác vụ trên điện thoại mà không cần tiếp xúc. Điển hình nhưcông nghệ Soli được phát triển bởi Google cho đồng hồ thông minh và điện thoại [3]. Gần đây, có nhiều công bố sử dụng thuật toán trí tuệ nhân tạo (AI: Artificial Intelligence), đặcbiệt là các mô hình học máy (ML: Machine Learning) và học sâu (DL: Deep Learning), để nhậndạng cử chỉ tay dựa vào các đặc trưng phổ micro-Doppler thu được từ ra-đa FMCW. Điển hìnhnhư Scherer và cộng sự [4] đã sử dụng kết hợp các mạng nơ-ron tích chập (CNN: ConvolutionalNeural Network) không gian và thời gian để nhận dạng cử chỉ bằng ra-đa cự ly ngắn. Mô hìnhnày đã đạt được độ chính xác 86,6% trên tập dữ liệu 26 người dùng với 11 cử chỉ, và 92,4% với11 người dùng. Đặc biệt, mô hình CNN được thiết kế rất nhẹ, chỉ chiếm 92 kB bộ nhớ. Trongmột nghiên cứu khác, Amin và cộng sự [5] đã giới thiệu một kỹ thuật đơn giản nhưng hiệu quảcho bài toán nhận dạng cử chỉ tay bằng cảm biến ra-đa. Theo đó, kỹ thuật đề xuất có thể phânloại các cử chỉ tay dựa trên đường bao của dấu hiệu micro-Doppler. Bằng cách này, mô hình đềxuất trong [5] đạt độ chính xác nhận dạng lên đến 96%. Bên cạnh những nghiên cứu về mô hìnhthuật toán, Ritchie và công sự [6] đã công bố một bộ dữ liệu về 4 cử chỉ tay được thu thập bằngra-đa FMCW ở tần số 24 GHz, độ rộng băng thông 750 MHz. Tập dữ liệu này được kiểm tra thửvới các thuật toán ML. Kết quả cho thấy, kỹ thuật SVM bậc hai (Support Vector MachineQuadratic) đạt tỉ lệ nhận dạng chính xác cao nhất (74,2%). Tập dữ liệu này được chia sẽ côngkhai và làm cơ sở để các nhà nghiên cứu đề xuất các mô hình cạnh tranh khác. Trên cơ sở nghiên cứu khảo sát, trong bài báo này, nhóm tác giả đã đề xuất một mô hìnhCNN mới, tên là Cross-CNN, nhằm nâng cao hiệu năng nhận dạng cử chỉ tay bằng ra-đa FMCW.Tạp chí Nghiên cứu KH&CN quân sự, Số 75, 10 - 2021 15 Kỹ thuật điều khiển & Điện tửMô hình đề xuất sử dụng các cấu trúc kết nối chéo (Cross-connection) và kết nối bỏ qua (Skip-connection) để sử dụng lại các đặc tính cũ trong quá trình huấn luyện, nhờ vào đó, hiệu năng củamô hình được cải thiện đáng kể. Mô hình Cross-CNN được huấn luyện và kiểm chứng trên tậpdữ liệu Dop-Net được công bố trong [6]. Khi so sánh với một số mô hình khác, mô hình Cross-CNN mà chúng tôi đề xuất đạt hiệu năng vượt trội hơn các mô hình khác cả về độ chính xácnhận dạng, thời gian thực thi và kích thước bộ nhớ. 2. RA-ĐA FMCW VÀ PHÂN TÍCH PHỔ MICRO-DOPPLER Ra-đa FMCW là thiết bị được sử dụng ...
Nội dung trích xuất từ tài liệu:
Nhận dạng cử chỉ tay bằng ra-đa FMCW dựa trên mạng nơ ron tích chập kết nối chéoNghiên cứu khoa học công nghệ NHẬN DẠNG CỬ CHỈ TAY BẰNG RA-ĐA FMCW DỰA TRÊN MẠNG NƠ-RON TÍCH CHẬP KẾT NỐI CHÉO Lê Hải1*, Hoàng Văn Phúc1, Đoàn Văn Sáng2, Lê Thị Trang3, Lê Đại Phong1 Tóm tắt: Nghiên cứu này đề xuất sử dụng mạng nơ-ron tích chập kết nối chéo (Cross- CNN: Cross-connection Convolutional Neural Network) để nhận dạng cử chỉ tay dựa trên dữ liệu phân tích phổ Doppler vi mô (micro-Doppler) của ra-đa FMCW (Frequency Modulated Continuous Wave). Thêm vào đó, các mức nhiễu khác nhau được thêm vào dữ liệu để đánh giá đầy đủ hơn đối với mô hình đề xuất. Kết quả thử nghiệm cho thấy, mô hình được huấn luyện với dữ liệu có nhiễu cho chất lượng nhận dạng tốt hơn mô hình được huấn luyện với dữ liệu không có nhiễu. Sau đó, mô hình Cross-CNN được phân tích, đánh giá khi thay đổi các tham số cấu trúc, từ đó chọn ra bộ tham số phù hợp nhất cho bài toán đề ra. Cuối cùng, mô hình Cross-CNN được đánh giá, so sánh với các mô hình hiện có khác khi thực hiện trên cùng một tập dữ liệu. Kết quả là, mạng Cross-CNN cho khả năng nhận dạng cử chỉ tay tốt hơn các mô hình khác nhờ vào các kết nối chéo cho phép sử dụng kết hợp các đặc tính cũ với đặc tính mới trong quá trình huấn luyện mạng.Từ khóa: Mạng nơ-ron tích chập; Nhận dạng cử chỉ tay; Ra đa FMCW; Phổ micro-Doppler. 1. GIỚI THIỆU Hiện nay, với sự phát triển bùng nổ của các hệ thống và thiết bị thông minh, việc điều khiểnkhông tiếp xúc các thiết bị điện tử, gia dụng đang trở nên phổ biến. Theo đó, sự chuyển động củatay, chân, cơ thể hoặc sự thay đổi nét mặt sẽ là những dấu hiệu để các mô-đun giao tiếp người-máy (HMI: human-machine interface) thực hiện việc nhận dạng hoặc phân loại [1]. Các mô-đunHMI thường sử dụng camera quang học để nhận dạng là chủ yếu. Nhưng tính bảo mật riêng tưcủa dữ liệu hình ảnh lại trở thành vấn đề thách thức đối với các nhà phát triển thiết bị. Một giảipháp thay thế cho camera quang học, đó là ra-đa FMCW (Frequency Modulated ContinuousWave), vì nó có tính bảo mật, xử lý nhanh, và tiết kiệm năng lượng [2]. Nắm bắt được lợi thế đó,hiện nay, các hãng sản xuất điện thoại đã bắt đầu sử dụng ra-đa FMCW để nhận biết cử chỉ củacon người nhằm thực hiện một số tác vụ trên điện thoại mà không cần tiếp xúc. Điển hình nhưcông nghệ Soli được phát triển bởi Google cho đồng hồ thông minh và điện thoại [3]. Gần đây, có nhiều công bố sử dụng thuật toán trí tuệ nhân tạo (AI: Artificial Intelligence), đặcbiệt là các mô hình học máy (ML: Machine Learning) và học sâu (DL: Deep Learning), để nhậndạng cử chỉ tay dựa vào các đặc trưng phổ micro-Doppler thu được từ ra-đa FMCW. Điển hìnhnhư Scherer và cộng sự [4] đã sử dụng kết hợp các mạng nơ-ron tích chập (CNN: ConvolutionalNeural Network) không gian và thời gian để nhận dạng cử chỉ bằng ra-đa cự ly ngắn. Mô hìnhnày đã đạt được độ chính xác 86,6% trên tập dữ liệu 26 người dùng với 11 cử chỉ, và 92,4% với11 người dùng. Đặc biệt, mô hình CNN được thiết kế rất nhẹ, chỉ chiếm 92 kB bộ nhớ. Trongmột nghiên cứu khác, Amin và cộng sự [5] đã giới thiệu một kỹ thuật đơn giản nhưng hiệu quảcho bài toán nhận dạng cử chỉ tay bằng cảm biến ra-đa. Theo đó, kỹ thuật đề xuất có thể phânloại các cử chỉ tay dựa trên đường bao của dấu hiệu micro-Doppler. Bằng cách này, mô hình đềxuất trong [5] đạt độ chính xác nhận dạng lên đến 96%. Bên cạnh những nghiên cứu về mô hìnhthuật toán, Ritchie và công sự [6] đã công bố một bộ dữ liệu về 4 cử chỉ tay được thu thập bằngra-đa FMCW ở tần số 24 GHz, độ rộng băng thông 750 MHz. Tập dữ liệu này được kiểm tra thửvới các thuật toán ML. Kết quả cho thấy, kỹ thuật SVM bậc hai (Support Vector MachineQuadratic) đạt tỉ lệ nhận dạng chính xác cao nhất (74,2%). Tập dữ liệu này được chia sẽ côngkhai và làm cơ sở để các nhà nghiên cứu đề xuất các mô hình cạnh tranh khác. Trên cơ sở nghiên cứu khảo sát, trong bài báo này, nhóm tác giả đã đề xuất một mô hìnhCNN mới, tên là Cross-CNN, nhằm nâng cao hiệu năng nhận dạng cử chỉ tay bằng ra-đa FMCW.Tạp chí Nghiên cứu KH&CN quân sự, Số 75, 10 - 2021 15 Kỹ thuật điều khiển & Điện tửMô hình đề xuất sử dụng các cấu trúc kết nối chéo (Cross-connection) và kết nối bỏ qua (Skip-connection) để sử dụng lại các đặc tính cũ trong quá trình huấn luyện, nhờ vào đó, hiệu năng củamô hình được cải thiện đáng kể. Mô hình Cross-CNN được huấn luyện và kiểm chứng trên tậpdữ liệu Dop-Net được công bố trong [6]. Khi so sánh với một số mô hình khác, mô hình Cross-CNN mà chúng tôi đề xuất đạt hiệu năng vượt trội hơn các mô hình khác cả về độ chính xácnhận dạng, thời gian thực thi và kích thước bộ nhớ. 2. RA-ĐA FMCW VÀ PHÂN TÍCH PHỔ MICRO-DOPPLER Ra-đa FMCW là thiết bị được sử dụng ...
Tìm kiếm theo từ khóa liên quan:
Mạng nơ-ron tích chập Nhận dạng cử chỉ tay Ra đa FMCW Phổ micro-Doppler Mô hình Cross-CNNGợi ý tài liệu liên quan:
-
Tích hợp DSM và ảnh chụp UAV với mô hình nơ-ron tích chập trong phân loại lớp phủ mặt đất
8 trang 139 0 0 -
Nhận dạng tấm pin mặt trời bị lỗi dựa trên dữ liệu ảnh bằng trí tuệ nhân tạo
4 trang 65 0 0 -
Ứng dụng Teachable Machine trong nhận diện khuôn mặt theo thời gian thực
4 trang 59 0 0 -
Giáo trình Mạng nơ ron học sâu và ứng dụng: Phần 1
121 trang 44 0 0 -
Nhận dạng tín hiệu ra đa LPI sử dụng mạng nơ ron học sâu
6 trang 40 0 0 -
Ứng dụng kỹ thuật học sâu trong hỗ trợ chẩn đoán bệnh viêm phổi thông qua ảnh chụp X-quang
11 trang 40 0 0 -
Nhận dạng vân tay sử dụng kỹ thuật học sâu
9 trang 39 0 0 -
Mô hình Deep Learning trong nhận diện cảm xúc và cảnh báo stress
3 trang 34 0 0 -
9 trang 33 0 0
-
Ứng dụng học sâu trong nhận dạng cử chỉ tay
6 trang 32 0 0