Danh mục

Ứng dụng học sâu cho bài toán nhận diện khuôn mặt có đeo khẩu trang

Số trang: 9      Loại file: pdf      Dung lượng: 422.10 KB      Lượt xem: 6      Lượt tải: 0    
10.10.2023

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong môi trường y tế, việc nhận diện những người không đeo khẩu trang có thể giúp cải thiện quản lý an ninh và an toàn cho người bệnh và cả nhân viên y tế, đặc biệt là các khu vực như phòng thí nghiệm hay các phòng cách ly bệnh truyền nhiễm. Nhận thức được tầm quan trọng của vấn đề này, nghiên cứu này tập trung vào việc áp dụng mô hình học sâu Convolutional Neural Network (CNN) để giải quyết vấn đề nhận diện người không đeo khẩu trang.
Nội dung trích xuất từ tài liệu:
Ứng dụng học sâu cho bài toán nhận diện khuôn mặt có đeo khẩu trang ỨNG DỤNG HỌC SÂU CHO BÀI TOÁN NHẬN DIỆN KHUÔN MẶT CÓ ĐEO KHẨU TRANG Nguyễn Thành Trung1, Huỳnh Nguyễn Thành Luân2 1. Lớp CH22HT0, Trường Đại học Thủ Dầu Một; 2. Trường Đại học Thủ Dầu MộtTÓM TẮT Trong môi trường y tế, việc nhận diện những người không đeo khẩu trang có thể giúp cảithiện quản lý an ninh và an toàn cho người bệnh và cả nhân viên y tế, đặc biệt là các khu vựcnhư phòng thí nghiệm hay các phòng cách ly bệnh truyền nhiễm. Nhận thức được tầm quantrọng của vấn đề này, nghiên cứu này tập trung vào việc áp dụng mô hình học sâu ConvolutionalNeural Network (CNN) để giải quyết vấn đề nhận diện người không đeo khẩu trang. Bộ dữ liệuthu thập bao gồm các hình ảnh về cảnh có người đeo và không đeo khẩu trang từ nhiều loạikhẩu trang và góc độ khác nhau. Mô hình CNN được huấn luyện trên bộ dữ liệu này với mụctiêu xây dựng một hệ thống nhận diện cảnh báo người không đeo khẩu trang. Kết quả củanghiên cứu cho thấy rằng CNN có khả năng phát hiện và nhận dạng tình trạng không đeo khẩutrang với độ chính xác cao. Những kết quả này mở ra triển vọng cho ứng dụng của học sâutrong lĩnh vực y tế, đồng thời giúp cải thiện việc kiểm soát và quản lý an toàn trong các môitrường đặc biệt như phòng thí nghiệm, khu vực cách ly và các cơ sở y tế khác. Từ khóa: Convolutional Neural Network (CNN), nhận diện khẩu trang, phân loại hình ảnh.1. ĐẶT VẤN ĐỀ Trong bối cảnh phát triển không ngừng hiện nay, các cơ sở y tế có các khu vực đặc biệt nhưphòng thí nghiệm và khu vực cách ly, nơi tuân thủ nghiêm ngặt các biện pháp phòng ngừa là cựckỳ quan trọng [1]. Đeo khẩu trang là một biện pháp hiệu quả để ngăn ngừa sự lây nhiễm và bảovệ sức khỏe, đặc biệt là trong môi trường như phòng thí nghiệm, nơi tiềm ẩn nguy cơ từ các chấthóa học. Mặc dù việc đeo khẩu trang được khuyến cáo mạnh mẽ bởi các tổ chức y tế, nhưngkhông phải ai cũng tuân thủ nghiêm túc quy định này, gây nguy cơ cho bản thân và cộng đồng. Để giải quyết vấn đề này, việc áp dụng hệ thống nhận diện và cảnh báo khi phát hiệnngười không đeo khẩu trang trở nên cực kỳ cần thiết. Đề tài này ứng dụng mô hình học sâuConvolutional Neural Network (CNN) để nhận diện không đeo khẩu trang đặc biệt hữu íchtrong việc kiểm soát và nhắc nhở khi ra vào khu vực như phòng thí nghiệm và phòng cách ly.Xây dựng một hệ thống như vậy không chỉ nâng cao ý thức và trách nhiệm cá nhân trong việcbảo vệ sức khỏe mà còn đóng góp vào việc tạo ra môi trường an toàn cho tất cả mọi người. Hình 50 : Mô hình CNN 775 (Nguồn: viblo.asia, Tìm hiểu về mạng tích chập CNN) Mô hình mạng CNN trong neural được xem đây là một mô hình được dùng để phân loạihay nhận dạng trên các hình ảnh. Với mô hình mạng tích chập có thể coi là một trong số môhình thuộc nhận dạng khuôn mặt và phát hiện đối tượng. Chính vì thế, phát hiện khuôn mặt vànhận dạng đối tượng là những ứng dụng có trong mô hình CNN được sử dụng rộng rãi nhất [4].Mô hình CNN được mô tả ở hình 1. Tổng quan sơ đồ nghiên cứu Hình 51 : Sơ đồ đề xuất xây dựng mô hình dự đoán Ở hình 2 là sơ đồ đề xuất xây dựng mô hình dự đoán được chia làm 4 phần bao gồm: Xâydựng mô hình : Tạo mô hình CNN và thêm các lớp Convolution Layer, Pooling Layer, Flatten,Dense, ngoài ra mô hình với bộ tối ưu Adam và hàm mất hát binary cross-entropy. Huấn luyệnmô hình : Sử dụng dữ liệu huấn luyện đã chuẩn bị và kiểm tra mô hình. Nhận diện khẩu trangtrong thời gian thực : Sử dụng Webcam từ thư viện OpenCV và sử dụng Haar Cascade để pháthiện khuôn mặt trong các khung hình video kết hợp với ghi nhãn lên các khung hình dựa trênkết quả dự đoán, cuối cùng là phát âm thanh cảnh báo nếu phát hiện người không đeo khẩutrang. Hiển thị và điều khiển : hiển thị khung hình quay trực tiếp khuôn mặt thông qua Webcam. Cấu trúc của mô hình CNN Convolution Layer – Lớp tích chập Hình 52 : Minh họa về lớp tích chập (Nguồn: viblo.asia, Tìm hiểu về mạng tích chập CNN) Từ hình ảnh trích xuất được lớp đầu tiên được gọi là lớp tích chập. Hình 3 minh họa vềlớp tích chập. Lớp tích chập sử dụng dữ liệu với các hình vuông nhỏ bằng việc duy trì các đặcđiểm của hình ảnh giữa các pixel. Đây được coi là phép toán hai đầu vào làm bộ lọc và ma trậnhình ảnh hoặc hạt nhân. Ở hình 4 là các giá trị pixel bao gồm 0 và 1 trong ma trận 5x5 và matrận với bộ lọc là 3x3. 776 Hình 53 : Xem xét 1 Matrix 5 x 5 và Matrix 3 x 3m (Nguồn: viblo.asia, Tìm hiểu về mạng tích chập CNN) Feature Map là một lớp tích chập của ma trận bộ lọc 3 x 3 nhân với ma trận hình ảnh 5 x5. Việc áp dụng các bộ lọc có thể thực hiện một loạt các thao tác làm sắc nét, làm mờ và pháthiện các cạnh từ khả năng kết hợp các bộ lọc khác nhau với một hình ảnh. Stride – Bước nhảy Với stride được định nghĩa là thay đổi pixel trong ma trận đầu vào. Nếu di chuyển cáckernel thêm 1 pixel thí đó là khi stride là 1, còn nếu di chuyển thêm 2 pixel thì khi đó stride sẽlà 2 và cứ liên tiếp như vậy [5]. Hình 5 là khi stride là 2 thì lớp tích chập hoạt động. Hình 54 : Lớp tích chập hoạt động với stride là 2 (Nguồn: viblo.asia, Tìm hiểu về mạng tích chập CNN) Padding – Đường viền Với kernel khi hình ảnh đầu vào không khớp, sẽ có 2 sự chọn lựa đó chính là : Ở nhữngđiểm trên ảnh chưa thích hợp đối với kernel sẽ crop ảnh đó đi và thêm số 0 vào các mép viềncủa khung hình. ReLU – Hàm tuyến tính ReLU được sử dụng trong ConvNet để giới thiệu phi tuyến tính. Trong đó có các gi ...

Tài liệu được xem nhiều: