Cảnh báo phát hiện người lái xe buồn ngủ
Số trang: 6
Loại file: pdf
Dung lượng: 631.19 KB
Lượt xem: 15
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Nghiên cứu "Cảnh báo phát hiện người lái xe buồn ngủ" áp dụng YOLOv4 để trích xuất các đặc điểm trên khuôn mặt tự động. Sau đó, áp dụng mô hình LSTM để tìm hiểu các hành vi tạm thời của người lái xe bao gồm khoảng thời gian ngáp và chớp mắt cũng như trình tự phân loại. Nghiên cứu đã sử dụng tập dữ liệu đã thu thập của mình bên cạnh phương pháp học tập chuyển giao. Bộ dữ liệu đã phát triển xem xét cả những rối loạn như ánh sáng và tư thế đầu. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Cảnh báo phát hiện người lái xe buồn ngủ CẢNH BÁO PHÁT HIỆN NGƯỜI LÁI XE BUỒN NGỦ Tôn Thị Mỹ Tho* Khoa Công nghệ Thông tin, Trường Đại học Công nghệ Thành phố Hồ Chí Minh GVHD: TS. Huỳnh Quốc Bảo TÓM TẮT Phát hiện tình trạng buồn ngủ của người lái xe đã là chủ đề của nhiều nghiên cứu trong thời gian vừa qua và các đã phương pháp khác nhau đã được phát triển để phát hiện. Hiện nay, bài toán phát hiện buồn ngủ của người lái xe vẫn còn thu hút được nhiều nghiên cứu tiếp theo do khả năng ứng dụng cao. Trong nghiên cứu này, chúng tôi đã áp dụng YOLOv4 để trích xuất các đặc điểm trên khuôn mặt tự động. Sau đó, áp dụng mô hình LSTM để tìm hiểu các hành vi tạm thời của người lái xe bao gồm khoảng thời gian ngáp và chớp mắt cũng như trình tự phân loại. Nghiên cứu đã sử dụng tập dữ liệu đã thu thập của mình bên cạnh phương pháp học tập chuyển giao. Bộ dữ liệu đã phát triển xem xét cả những rối loạn như ánh sáng và tư thế đầu. Từ khóa: Phát hiện và dự đoán tình trạng buồn ngủ 1. GIỚI THIỆU 1.1. Giới thiệu bài toán Sự mệt mỏi của người lái xe là vấn đề chính gây ra nhiều rủi ro, do tình trạng đường giao thông và các tình huống thời tiết xấu [1]. Hàng năm, Cơ quan Quản lý An toàn Giao thông Đường cao tốc Quốc gia (NHTSA) và Tổ chức Y tế Thế giới (WHO) đã báo cáo rằng khoảng 1,35 triệu người chết do tai nạn xe cộ trên khắp thế giới [2]. Nhìn chung, tai nạn đường bộ hầu hết xảy ra do cách lái xe không phù hợp bao gồm cả những tình huống phát sinh nếu người lái xe nghiện rượu hoặc buồn ngủ. Trong số các nguyên nhân gây ra tai nạn chết người, thì buồn ngủ được xem là yếu tố nghiêm trọng và thường xuyên do người lái xe phải làm việc trong thời gian dài. Khi người lái xe ngủ gật sẽ mất quyền điều khiển phương tiện. Do đó, nghiên cứu thiết kế hệ thống thông minh giúp cảnh báo các tình huống buồn ngủ hay ngủ gật của người lái xe là rất cần thiết. 1.2. Các lĩnh vực ứng dụng Mô hình này có thể được áp dụng trong lĩnh vực giao thông để hạn chế các vụ tai nạn giao thông đáng tiếc. Hoặc dùng làm đề tài cho Nghiên cứu khoa học, có thể tái sử dụng và nâng cấp mô hình bằng những công nghệ mới. 2. CÁC CÔNG TRÌNH LIÊN QUAN Nhận diện khuôn mặt và mắt bằng thuật toán Machine Learning (ML) và Deep Learning (DL) [3] 15 Ed-Doughmi và cộng sự đã phân tích các hành vi của người lái xe thông qua thuật toán RNN. Nó đặc biệt tập trung vào việc xây dựng tính năng phát hiện mệt mỏi theo thời gian thực để ngăn ngừa tai nạn bên đường. Hệ thống này tạo ra một số khuôn mặt của người lái xe, hoạt động trên mô hình CNN 3D nhiều lớp để xác định những người lái xe buồn ngủ và cung cấp tỷ lệ chấp nhận 92%. Hệ thống phát hiện buồn ngủ dựa trên FPGA [4] Một hệ thống phát hiện buồn ngủ xâm nhập thấp sử dụng mảng cổng lập trình trường (FPGA) đã được thiết kế bởi Vitabile và các cộng sự. Hệ thống này tập trung vào đồng tử sáng của mắt được phát hiện bởi nguồn sáng cảm biến hồng ngoại gắn trong xe. Nhờ hiệu ứng hình ảnh này, võng mạc được nhận dạng đến 90%, giúp tìm ra ánh mắt của người lái xe để phân tích tình trạng buồn ngủ qua một số khung hình nhằm tránh những rủi ro nghiêm trọng. 3. XÂY DỰNG MÔ HÌNH 3.1. Cơ sở lý thuyết Convolutional Neural Network (CNNs – Mạng nơ-ron tích chập) là một trong những mô hình Deep Learning tiên tiến. CNN cho phép xây dựng nhiều hệ thống thông minh với độ chính xác cao như hiện nay. CNN được sử dụng nhiều trong các bài toán nhận dạng các object trong ảnh. Mạng CNN là tập hợp những các lớp tích chập xếp chồng lên nhau, đồng thời mạng sử dụng những hàm kích hoạt ReLU và Tanh để kích hoạt các trọng số trong các nút. Các lớp tích chập sau khi qua các hàm kích hoạt sẽ có trọng số trong những nút và có thể tạo ra những thông tin trừu tượng hơn để chuyển đến với các lớp kế tiếp trong mạng. Mạng CNN sử dụng 3 ý tưởng cơ bản: Các trường tiếp nhận cục bộ (local receptive field) Trọng số chia sẻ (shared weights) Tổng hợp (pooling). Hình 1: Sơ đồ mạng CNN LSTM là một kiến trúc đặc biệt của RNN có khả năng học được sự phục thuộc trong dài hạn (long-term dependencies) được giới thiệu bởi Hochreiter & Schmidhuber (1997) [5]. Kiến trúc này đã được phổ biến và sử dụng rộng rãi tới hiện này vì LSTM đã tỏ ra khắc phục được rất nhiều những hạn chế của RNN trước đây về triệt tiêu đạo hàm. Tuy nhiên cấu trúc của LSTM có phần phức tạp hơn mặc dù vẫn giữ được tư tưởng chính của RNN là sự sao chép các kiến trúc theo dạng chuỗi. 16 Hình 2: Kiến trúc LSTM 3.2. Công nghệ Yolo là một mô hình mạng CNN cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các convolutional layers và connected layers. Trong đó các convolutional layers sẽ trích xuất ra các feature của ảnh, còn full-connected layers sẽ dự đoán ra xác suất đó và tọa độ của đối tượng. Hình 3: Mô Hình Yolo Trong Yolo đầu vào của mô hình là một ảnh, mô hình sẽ nhận dạng ảnh đó có đối tượng nào hay không, sau đó sẽ xác định tọa độ của đối tượng trong bức ảnh. 3.3. Mô hình đề xuất Trong mô hình camera liên tục ghi lại từng chuyển động của khuôn mặt người lái xe, đặc biệt tập trung vào các biện pháp hành vi của người lái xe. Khoảng quy định được tính toán chính xác do sử dụng bộ dữ liệu COCO cho quá trình đào tạo LSTM, dựa trên CNN và được định dạng như một chuỗi hai chiều bao gồm mắt khoảng thời gian chớp mắt và ngáp. Nhận diện ngủ và nhận diện khuôn mặt Bước 1: Ghi hình Bước 2: Nhận diện khuôn mặt từ video 17 Bước 3: Phát hiện hành vi mắt và miệng Bước 4: Phát hiện buồn ngủ (k ...
Nội dung trích xuất từ tài liệu:
Cảnh báo phát hiện người lái xe buồn ngủ CẢNH BÁO PHÁT HIỆN NGƯỜI LÁI XE BUỒN NGỦ Tôn Thị Mỹ Tho* Khoa Công nghệ Thông tin, Trường Đại học Công nghệ Thành phố Hồ Chí Minh GVHD: TS. Huỳnh Quốc Bảo TÓM TẮT Phát hiện tình trạng buồn ngủ của người lái xe đã là chủ đề của nhiều nghiên cứu trong thời gian vừa qua và các đã phương pháp khác nhau đã được phát triển để phát hiện. Hiện nay, bài toán phát hiện buồn ngủ của người lái xe vẫn còn thu hút được nhiều nghiên cứu tiếp theo do khả năng ứng dụng cao. Trong nghiên cứu này, chúng tôi đã áp dụng YOLOv4 để trích xuất các đặc điểm trên khuôn mặt tự động. Sau đó, áp dụng mô hình LSTM để tìm hiểu các hành vi tạm thời của người lái xe bao gồm khoảng thời gian ngáp và chớp mắt cũng như trình tự phân loại. Nghiên cứu đã sử dụng tập dữ liệu đã thu thập của mình bên cạnh phương pháp học tập chuyển giao. Bộ dữ liệu đã phát triển xem xét cả những rối loạn như ánh sáng và tư thế đầu. Từ khóa: Phát hiện và dự đoán tình trạng buồn ngủ 1. GIỚI THIỆU 1.1. Giới thiệu bài toán Sự mệt mỏi của người lái xe là vấn đề chính gây ra nhiều rủi ro, do tình trạng đường giao thông và các tình huống thời tiết xấu [1]. Hàng năm, Cơ quan Quản lý An toàn Giao thông Đường cao tốc Quốc gia (NHTSA) và Tổ chức Y tế Thế giới (WHO) đã báo cáo rằng khoảng 1,35 triệu người chết do tai nạn xe cộ trên khắp thế giới [2]. Nhìn chung, tai nạn đường bộ hầu hết xảy ra do cách lái xe không phù hợp bao gồm cả những tình huống phát sinh nếu người lái xe nghiện rượu hoặc buồn ngủ. Trong số các nguyên nhân gây ra tai nạn chết người, thì buồn ngủ được xem là yếu tố nghiêm trọng và thường xuyên do người lái xe phải làm việc trong thời gian dài. Khi người lái xe ngủ gật sẽ mất quyền điều khiển phương tiện. Do đó, nghiên cứu thiết kế hệ thống thông minh giúp cảnh báo các tình huống buồn ngủ hay ngủ gật của người lái xe là rất cần thiết. 1.2. Các lĩnh vực ứng dụng Mô hình này có thể được áp dụng trong lĩnh vực giao thông để hạn chế các vụ tai nạn giao thông đáng tiếc. Hoặc dùng làm đề tài cho Nghiên cứu khoa học, có thể tái sử dụng và nâng cấp mô hình bằng những công nghệ mới. 2. CÁC CÔNG TRÌNH LIÊN QUAN Nhận diện khuôn mặt và mắt bằng thuật toán Machine Learning (ML) và Deep Learning (DL) [3] 15 Ed-Doughmi và cộng sự đã phân tích các hành vi của người lái xe thông qua thuật toán RNN. Nó đặc biệt tập trung vào việc xây dựng tính năng phát hiện mệt mỏi theo thời gian thực để ngăn ngừa tai nạn bên đường. Hệ thống này tạo ra một số khuôn mặt của người lái xe, hoạt động trên mô hình CNN 3D nhiều lớp để xác định những người lái xe buồn ngủ và cung cấp tỷ lệ chấp nhận 92%. Hệ thống phát hiện buồn ngủ dựa trên FPGA [4] Một hệ thống phát hiện buồn ngủ xâm nhập thấp sử dụng mảng cổng lập trình trường (FPGA) đã được thiết kế bởi Vitabile và các cộng sự. Hệ thống này tập trung vào đồng tử sáng của mắt được phát hiện bởi nguồn sáng cảm biến hồng ngoại gắn trong xe. Nhờ hiệu ứng hình ảnh này, võng mạc được nhận dạng đến 90%, giúp tìm ra ánh mắt của người lái xe để phân tích tình trạng buồn ngủ qua một số khung hình nhằm tránh những rủi ro nghiêm trọng. 3. XÂY DỰNG MÔ HÌNH 3.1. Cơ sở lý thuyết Convolutional Neural Network (CNNs – Mạng nơ-ron tích chập) là một trong những mô hình Deep Learning tiên tiến. CNN cho phép xây dựng nhiều hệ thống thông minh với độ chính xác cao như hiện nay. CNN được sử dụng nhiều trong các bài toán nhận dạng các object trong ảnh. Mạng CNN là tập hợp những các lớp tích chập xếp chồng lên nhau, đồng thời mạng sử dụng những hàm kích hoạt ReLU và Tanh để kích hoạt các trọng số trong các nút. Các lớp tích chập sau khi qua các hàm kích hoạt sẽ có trọng số trong những nút và có thể tạo ra những thông tin trừu tượng hơn để chuyển đến với các lớp kế tiếp trong mạng. Mạng CNN sử dụng 3 ý tưởng cơ bản: Các trường tiếp nhận cục bộ (local receptive field) Trọng số chia sẻ (shared weights) Tổng hợp (pooling). Hình 1: Sơ đồ mạng CNN LSTM là một kiến trúc đặc biệt của RNN có khả năng học được sự phục thuộc trong dài hạn (long-term dependencies) được giới thiệu bởi Hochreiter & Schmidhuber (1997) [5]. Kiến trúc này đã được phổ biến và sử dụng rộng rãi tới hiện này vì LSTM đã tỏ ra khắc phục được rất nhiều những hạn chế của RNN trước đây về triệt tiêu đạo hàm. Tuy nhiên cấu trúc của LSTM có phần phức tạp hơn mặc dù vẫn giữ được tư tưởng chính của RNN là sự sao chép các kiến trúc theo dạng chuỗi. 16 Hình 2: Kiến trúc LSTM 3.2. Công nghệ Yolo là một mô hình mạng CNN cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các convolutional layers và connected layers. Trong đó các convolutional layers sẽ trích xuất ra các feature của ảnh, còn full-connected layers sẽ dự đoán ra xác suất đó và tọa độ của đối tượng. Hình 3: Mô Hình Yolo Trong Yolo đầu vào của mô hình là một ảnh, mô hình sẽ nhận dạng ảnh đó có đối tượng nào hay không, sau đó sẽ xác định tọa độ của đối tượng trong bức ảnh. 3.3. Mô hình đề xuất Trong mô hình camera liên tục ghi lại từng chuyển động của khuôn mặt người lái xe, đặc biệt tập trung vào các biện pháp hành vi của người lái xe. Khoảng quy định được tính toán chính xác do sử dụng bộ dữ liệu COCO cho quá trình đào tạo LSTM, dựa trên CNN và được định dạng như một chuỗi hai chiều bao gồm mắt khoảng thời gian chớp mắt và ngáp. Nhận diện ngủ và nhận diện khuôn mặt Bước 1: Ghi hình Bước 2: Nhận diện khuôn mặt từ video 17 Bước 3: Phát hiện hành vi mắt và miệng Bước 4: Phát hiện buồn ngủ (k ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu hội nghị khoa học sinh viên Cảnh báo phát hiện người lái xe buồn ngủ Phát hiện tình trạng buồn ngủ Dự đoán tình trạng buồn ngủ Mô hình LSTM Quản lý an toàn giao thôngGợi ý tài liệu liên quan:
-
6 trang 817 0 0
-
6 trang 642 0 0
-
Nghiên cứu sự hài lòng của sinh viên Hutech khi mua sắm tại cửa hàng GS25 tại Ung Văn Khiêm Campus
6 trang 487 9 0 -
Nghiên cứu, đề xuất qui trình sản xuất nước rửa chén thân thiện môi trường từ vỏ cam phế thải
7 trang 461 1 0 -
6 trang 460 7 0
-
Khảo sát mức độ hài lòng của khách hàng về Nhà hàng Buffet Topokki Dookki chi nhánh D2
5 trang 404 10 0 -
7 trang 351 2 0
-
Nghiên cứu các nhân tố ảnh hưởng đến hành vi mua hàng trên TikTok Shop của sinh viên trường Hutech
6 trang 313 1 0 -
Thái độ của giới trẻ đối với người thuộc cộng đồng LGBT
5 trang 289 2 0 -
6 trang 234 4 0