Danh mục

Nhận dạng một số nhãn hàng trên kệ hàng siêu thị sử dụng kỹ thuật học sâu

Số trang: 27      Loại file: pdf      Dung lượng: 1.73 MB      Lượt xem: 28      Lượt tải: 0    
tailieu_vip

Hỗ trợ phí lưu trữ khi tải xuống: 1,000 VND Tải xuống file đầy đủ (27 trang) 0
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết Nhận dạng một số nhãn hàng trên kệ hàng siêu thị sử dụng kỹ thuật học sâu khảo sát một số phương pháp mới nhất về phát hiện đối tượng bằng kỹ thuật học sâu được cài đặt dựa trên thư viện MMDetection, để giải quyết bài toán nhận dạng một số nhãn hàng nước giải khát trên các kệ hàng trong siêu thị.
Nội dung trích xuất từ tài liệu:
Nhận dạng một số nhãn hàng trên kệ hàng siêu thị sử dụng kỹ thuật học sâu Tạp chí KH&CN- Trường Đại học Bình Dương, Vol.4 № 4/2021 NHẬN DẠNG MỘT SỐ NHÃN HÀNG TRÊN KỆ HÀNG SIÊU THỊ SỬ DỤNG KỸ THUẬT HỌC SÂU Lê Phước Lộc1, Đào Văn Tuyết2,3, Nông Nguyễn Minh Thúy3, Nguyễn Trung Thành4 1 Viện Cơ học và Tin học Ứng dụng, Viện Hàn lâm Khoa học và Công nghệ, Việt Nam 2 Trung tâm Vũ trụ Việt Nam, Viện Hàn lâm Khoa học và Công nghệ, Việt Nam 3 Trường Đại học Bình Dương, Thành phố Thủ Dầu Một, Tỉnh Bình Dương, Viet Nam 4 Trường Đại học Giáo dục, Đại học quốc gia Hà Nội, Viet Nam Ngày nhận bài:27/09/2021 Biên tập xong:07/12/2021 Duyệt đăng:10/12/2021 TÓM TẮT Phát hiện đối tượng là một bài toán quan trọng trong lĩnh vực thị giác máy tính. Trải qua nhiều năm phát triển, những vấn đề thực tế đối với bài toán này như đa dạng đối tượng, đa cỡ đối tượng, đối tượng bị che lấp, nhiễu, ánh sáng bất ổn, ... dần được cải thiện rõ rệt nhờ vận dụng kỹ thuật học sâu tiên tiến. Có rất nhiều phương pháp hiện đại nghiên cứu phát hiện đối tượng thông qua học sâu, tuy nhiên tính hiệu quả của chúng chỉ có thể chứng minh qua thực nghiệm tùy theo tập dữ liệu cụ thể. Bài báo này khảo sát một số phương pháp mới nhất về phát hiện đối tượng bằng kỹ thuật học sâu được cài đặt dựa trên thư viện MMDetection, để giải quyết bài toán nhận dạng một số nhãn hàng nước giải khát trên các kệ hàng trong siêu thị. Từ đó tiến hành thực nghiệm, đánh giá kết quả đạt được để thể hiện tính hiệu quả của mỗi phương pháp đã chọn trên một tập dữ liệu nhỏ tự thu thập. Từ khóa: Nhận dạng ảnh, thị giác máy tính, học sâu, tập dữ liệu, nhãn hàng ở siêu thị. 1. GIỚI THIỆU camera để dự đoán xem có sự xuất hiện Kỹ thuật thị giác máy tính từ lâu đã của một hay nhiều đối tượng cho trước được áp dụng rộng rãi trong nhiều lĩnh hay không, đồng thời cũng cho biết vị vực sản xuất và đời sống nhờ vào khả trí của đối tượng thông qua khung đánh năng nhận biết và xử lý thông minh dữ dấu (bounding box) bao quanh. Loại liệu hình ảnh. Bài toán phát hiện đối của đối tượng bên trong mỗi khung tượng (object detection) là một ứng đánh dấu tiềm năng được thể hiện thông dụng của kỹ thuật thị giác máy tính, qua nhãn lớp (class) kèm độ tin cậy trong đó máy tính hay thiết bị xử lý sẽ (confidence score) của dự đoán đó. đọc dữ liệu đầu vào từ hình ảnh hay Quy trình tổng quát của một hệ thống 107 TC KH&CN- BDU, Vol.4 № 4/2021 Lê Phước Lộc và cộng sự phát hiện đối tượng được thể hiện ở trích các đặc trưng (feature) của ảnh Hình 1. Đầu vào của hệ thống là ảnh đầu vào, sau đó đưa vào bộ phân lớp để đơn hoặc chuỗi ảnh lấy từ thiết bị thu xác định loại đối tượng cũng như tìm ra ảnh (camera), tùy vào mỗi hệ thống ảnh vị trí của nó trong ảnh. Sau quá trình đầu vào có thể là ảnh màu, ảnh mức hậu xử lý, kết quả đầu ra được thể hiện xám hay các loại ảnh đa phổ (multi- bằng cách đánh dấu trên ảnh gốc vị trí spectral) như ảnh kèm độ sâu, ảnh hồng và gán nhãn đối tượng đã phát hiện ngoại, … Sau quá trình tiền xử lý (pre- được. processing), hệ thống sẽ tiến hành rút Feature Classification extraction BBox Regression Ảnh đầu Feature descriptor Kết quả vào Hình 5: Sơ đồ bài toán phát hiện đối tượng Bài toán phát hiện đối tượng tuy đã phát hiện đối tượng. Phương hướng phổ được nghiên cứu từ lâu, nhưng cho đến biến trước đây là sử dụng phương pháp nay vẫn cần giải quyết nhiều vấn đề, rút trích đặc trưng thủ công. Cụ thể là nhất là phải đảm bảo độ chính xác cao sử dụng một trong những kỹ thuật mô để có thể áp dụng thực tế. Bài báo này tả đặc trưng như HOG, SIFT, LBP, khảo sát hiệu năng một số phương pháp SURF, Haar (Szeliski, 2021) để xây học sâu phát hiện đối tượng tiêu biểu dựng các bảng mô tả đặc trưng (feature hiện nay thông qua việc giải quyết bài descriptor) cho những lớp đối tượng toán nhận dạng một số nhãn hàng nước cần phát hiện. Sau đó sử dụng một bộ giải khát trên kệ hàng siêu thị. Phần kế phân lớp như SVM (Support Vector tiếp dưới đây trình bày một số phương Machine) để học cách phân lớp đối pháp học sâu được dùng thử nghiệm. tượng căn cứ vào các đặc trưng đã cho. Sau đó trình bày hệ thống nhận dạng Các phương pháp thủ công phụ thuộc nhãn hàng trong phần tiếp theo. Phần nhiều vào điều kiện đầu vào của thử cuối là thử nghiệm và đánh giá kết quả nghiệm nên khó khăn khi đem áp dụng đạt được. tổng quát cho nhiều trường hợp thực tế. 2. CÔNG TRÌNH LIÊN QUAN Các yếu tố thách thức tính chính xác của bài toán phát hiện đối tượng gồm Có hai phương hướng xử lý bài toán chất lượng ảnh, nhiễu gây ra bởi camera 108 TC KH&CN- BDU, Vol.4 № 4/2021 Nhận Dạng Một Số Nhãn Hàng… và quá trình thu nhận ảnh, điều kiện ánh độ sâu mạng từ hàng chục đến cả trăm sáng, thời tiết, tính chất phông nền lớp. Việc tăng độ sâu giúp mạng thể (background), tỉ lệ khác nhau và kích cỡ hiện nhiều loại đặc trưng từ mức thấp đa dạng của đối tượng. đến mức ngữ nghĩa cao của đối tượng, Những năm gần đây, sự phát triển ...

Tài liệu được xem nhiều: