Danh mục

Hệ thống nhận diện khuôn mặt trong chấm công và điểm danh

Số trang: 7      Loại file: pdf      Dung lượng: 633.10 KB      Lượt xem: 23      Lượt tải: 0    
10.10.2023

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết nghiên cứu các thành tựu của mô hình nhận diện khuôn mặt, so sánh và thực nghiệm để tìm ra phương pháp tối ưu nhất. Song song với đó sẽ thực hiện phân tích, thiết kế một hệ thống lưu trữ thông tin hoàn chỉnh, ứng dụng các công nghệ xây dựng phần mềm mới nhất hiện nay áp dụng vào hệ thống chấm công, điểm danh.
Nội dung trích xuất từ tài liệu:
Hệ thống nhận diện khuôn mặt trong chấm công và điểm danh HỆ THỐNG NHẬN DIỆN KHUÔN MẶT TRONG CHẤM CÔNG VÀ ĐIỂM DANH Lê Trung Kiên, Nguyễn Văn Kiện Khoa Công nghệ Thông tin, Trường Đại học Công nghệ TP. Hồ Chí Minh GVHD: ThS. Võ Hoàng Khang TÓM TẮT Điểm danh là một công việc thực tế thường được thực hiện trong các trường học, cơ quan, nhà máy. Tuy nhiên, công tác điểm danh còn khá nhiều bất cập, phương pháp điểm danh bằng cách đọc tên tốn rất nhiều thời gian, điểm danh bằng cách quét vân tay thì có thể lây bệnh truyền nhiễm, hay nếu điểm danh bằng quẹt thẻ thì có thể xảy ra tình trạng người này quẹt thẻ giúp người khác. Từ các vấn đề ở trên, chúng ta cần phải xây dựng hệ thống mới có yêu cầu kỹ thuật, quản lý chuyên nghiệp hơn, giải quyết các khuyết điểm của cách quản lý cũ. Trong bài báo này, chúng tôi nghiên cứu các thành tựu của mô hình nhận diện khuôn mặt, so sánh và thực nghiệm để tìm ra phương pháp tối ưu nhất. Song song với đó sẽ thực hiện phân tích, thiết kế một hệ thống lưu trữ thông tin hoàn chỉnh, ứng dụng các công nghệ xây dựng phần mềm mới nhất hiện nay áp dụng vào hệ thống chấm công, điểm danh. Từ khóa: cnn, nhận diện khuôn mặt, resnet, ssd mobilenet, support vector machine… 1 GIỚI THIỆU Hệ thống điểm danh bằng khuôn mặt thực hiện tự động phát hiện khuôn mặt người trong ảnh thu được từ camera và xác định danh tính của đối tượng trong hệ thống dựa vào nội dung của ảnh khuôn mặt rút trích được. Do đó, chỉ cần gắn camera trong phòng hoặc trước lối đi vào, hệ thống sẽ tự động quét và cập nhật chính xác thông tin của những người có mặt mà không gây bất cứ sự phiền phức nào cho người cần điểm danh. Tuy nhiên, hiện nay ở Việt Nam các hệ thống này chưa thực sự phát triển mạnh, chủ yếu là các sản phẩm của nước ngoài với giá thành cao. Vì vậy, chúng tôi đề xuất giải pháp tổng thể cho bài toán nhận diện khuôn mặt người trực tiếp từ các thiết bị webcam, camera giám sát, hướng đến mục tiêu xây dựng hệ thống hoàn chỉnh bao gồm các ứng dụng dùng để chấm công một cách tự động theo thời gian thực, ứng dụng điểm danh trên thiết bị di động và ứng dụng cho người quản lý. Cùng với đó hệ thống cũng cần đạt được các yêu cầu về tốc độ xử lý nhanh, dễ dàng triển khai trên quy mô lớn và có chi phí đầu tư thấp. Mô hình được đề xuất sử dụng trên cơ sở kết hợp mô hình SSD [1, 7] dựa trên mạng MobileNet V1 [4] cho phát hiện khuôn mặt và kiến trúc mạng neural học sâu ResNet-34 [2] có khả năng tự động trích chọn đặc trưng khuôn mặt, sử dụng bộ phân lớp SVM [8]. 84 2 PHƯƠNG ÁN TIẾP CẬN Hình 1. Sơ đồ xử lý logic nhận diện khuôn mặt 2.1 SSD MobileNet Phát hiện khuôn mặt là quá trình tìm kiếm và định vị khuôn mặt trên một frame ảnh bất kì [3]. Phương pháp phát hiện khuôn mặt ở đây được đề xuất sử dụng là mô hình kiến trúc của SSD xây dựng trên mạng cơ sở MobileNet [6]. 2.1.1 SSD Được thiết kế để phát hiện đối tượng trong thời gian thực, được tăng tốc quá trình bằng cách loại bỏ sự cần thiết của mạng đề xuất khu vực. Để giải quyết về vấn đề độ chính xác giảm, SSD áp dụng một vài cải tiến bao gồm các feature map đa kích thước và sử dụng bounding box mặc định [1]. Những cải tiến này cho phép SSD tiến gần được với độ chính xác cao nhưng lại có thể sử dụng hình ảnh có độ phân giải thấp hơn, giúp đẩy tốc độ cao hơn [7]. 2.1.2 MobileNet MobileNet có được độ chính xác cao trong khi thời gian tính toán thấp nằm ở sự cải tiến Convolution layer bình thường [4]. Trong MobileNet có 2 Conv layer được sử dụng là: Separable Convolution và Depthwise Convolution [4, 6]. Thay vì thực hiện phép tích chập như thông thường, Separable Convolution sẽ tiến hành phép tích chập Depthwise Spatial sau đó là phép tích chập Pointwise [9]. Còn Depthwise Convolution sẽ chỉ thực hiện phép tích chập Depthwise spatial. Ở đây, thay vì thực hiện 1 Conv với 9 phép nhân thì Depthwise Spatial chỉ dùng 3 phép nhân cho mỗi kernel nhỏ, nghĩ là 6 phép nhân tất cả để đạt được kết quả tương tự như với Conv thông thường [4, 5, 7]. Như vậy, khi khối lượng các phép nhân giảm đi, độ phức tạp của tính toán sẽ giảm xuống, đồng thời giúp giảm đáng kể khối lượng tính toán và số lượng tham số của mạng. Với sự thay đổi này, MobileNet có thể hoạt động một cách mượt mà ngay cả trên phần cứng cấu hình thấp. 85 Hình 2. Cấu trúc của một Depthwise Separable Convolution Bảng 1. Độ chính xác và hiệu suất của mô hình dựa trên bộ dữ liệu xác thực ImageNet [9] Top-1 Top-5 Model Size Parameters Accuracy Accuracy VGG16 528 MB 71,3% 90,1% 138,357,544 VGG19 549 MB 71,3% 90,0% 143,667,240 ResNet50 98 MB 74,9% 92,1% 25,636,712 ResNet101 171 MB 76,4% 92,8% 44,707,176 ResNet50V2 98 MB 76,0% 93,0% 25,613,800 InceptionV3 92 MB 77,9% 93,7% 23,851,784 InceptionResNetV2 215 MB 80,3% 95,3% 55,873,736 MobileNet 16 MB 70,4% 89,5% 4,253,864 Mô hình SSD được chia làm hai giai đoạn: - Trích xuất feature map, dựa vào mạng cơ sở để tăng hiệu quả trong việc phát hiện. - Áp dụng các bộ lọc tích chập để có thể detect được các đối tượng. 86 Hình 3. Mô hình mạng SSD dựa trên ki ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: