Danh mục

Đánh giá một số phương pháp biểu diễn đặc trưng cho bài toán tái nhận dạng nhân vật

Số trang: 10      Loại file: pdf      Dung lượng: 1,013.66 KB      Lượt xem: 10      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết phân tích đánh giá thực nghiệm trên bộ dữ liệu lớn Airport, DukeMTMC4ReID được công bố gần đây bằng các phương pháp rút trích đặc trưng ELF, gBiCov, LOMO, WHOS. Kết quả cho thấy đặc trưng gBiCov có nAUC 54,42% (Airport), 40,61% (DukeMTMC4ReID) cao hơn các đặc trưng khác.
Nội dung trích xuất từ tài liệu:
Đánh giá một số phương pháp biểu diễn đặc trưng cho bài toán tái nhận dạng nhân vậtTRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINHTẠP CHÍ KHOA HỌCHO CHI MINH CITY UNIVERSITY OF EDUCATIONJOURNAL OF SCIENCEKHOA HỌC TỰ NHIÊN VÀ CÔNG NGHỆISSN:1859-3100 Tập 15, Số 6 (2018): 97-106NATURAL SCIENCES AND TECHNOLOGYVol. 15, No. 6 (2018): 97-106Email: tapchikhoahoc@hcmue.edu.vn; Website: http://tckh.hcmue.edu.vnĐÁNH GIÁ MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN ĐẶC TRƯNGCHO BÀI TOÁN TÁI NHẬN DẠNG NHÂN VẬTVõ Duy Nguyên*, Nguyễn Thị Bảo Ngọc, Nguyễn Tấn Trần Minh KhangPhòng Thí nghiệm Truyền thông Đa phương tiện - Trường Đại học Công nghệ Thông tin – ĐHQG TPHCMNgày nhận bài: 14-5-2018; ngày nhận bài sửa: 29-5-2018; ngày duyệt đăng: 19-6-2018TÓM TẮTTái nhận dạng nhân vật là bài toán tìm kiếm các đối tượng đã di chuyển qua các camerakhác nhau. Trong bài báo này, chúng tôi đánh giá thực nghiệm trên bộ dữ liệu lớn Airport,DukeMTMC4ReID được công bố gần đây bằng các phương pháp rút trích đặc trưng ELF, gBiCov,LOMO, WHOS. Kết quả cho thấy đặc trưng gBiCov có nAUC 54,42% (Airport), 40,61%(DukeMTMC4ReID) cao hơn các đặc trưng khác.Từ khóa: tái nhận dạng nhân vật, hệ thống giám sát.ABSTRACTEmpirical evaluation of feature representation methods for Person reidentificationPerson re-identification is a practical task matching people moving across cameras. In thispaper, we evaluated performance of various person re-identification approaches on recentlypublished datasets Airport and DukeMTMC4ReId by feature extractors as ELF, gBiCov, LOMO,WHOS. The results show gBiCov achieved nAUC 54.42% (Airport), 40.61% (DukeMTMC4ReID)greater than the others.Keywords: person re-identification, surveillance system.Giới thiệuViệc giám sát an ninh ở những nơi công cộng đang rất được chú trọng. Các cameragiám sát được lắp đặt ở nhiều nơi như nhà ga, sân bay, trường học… Để vận hành các hệthống giám sát này cần tốn nhiều chi phí về nhân lực và việc giám sát thủ công cũng khôngđảm bảo hiệu quả giám sát. Trong những năm gần đây, các hệ thống giám sát thông minhđược xây dựng để nâng cao hiệu quả, giảm chi phí cũng như đáp ứng nhu cầu phát triểncủa các khu đô thị, thành phố thông minh. Bài toán Tái nhận dạng nhân vật (person re-id)là một trong những bài toán được ứng dụng trong việc giám sát an ninh.Tái nhận dạng nhân vật là bài toán có ảnh đầu vào là ảnh của một người thu được ởmột camera, đầu ra là một danh sách những người được thu ở các camera khác, danh sáchnày được sắp xếp giảm dần theo mức độ tương đồng với ảnh đầu vào. Hình 1 minh họa bàitoán tái nhận dạng nhân vật, tìm cùng một người xuất hiện ở hai camera khác nhau. Trongví dụ, cô gái xuất hiện ở camera A ở góc quay ngang được tìm thấy ở camera B ở góc quaytừ phía sau.1.*Email: nguyenvd@uit.edu.vn97TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCMTập 15, Số 6 (2018): 97-106Bài toán có nhiều thách thức lớn do ảnh của nhân vật có nhiều biến thể trong nhữngđiều kiện khác nhau về ánh sáng, góc quay của camera, sự chồng lấp bởi các nhân vật haycác vật thể khác, sự thay đổi của nền (background) như trong nhà, ngoài trời hay giữa thờiđiểm ban ngày và ban đêm, thậm chí trong một số trường hợp thay đổi cả về trang phụccủa nhân vật.Bài toán nhận được sự quan tâm của cộng đồng nghiên cứu thị giác máy tính tronghơn một thập kỉ qua [1, 2, 3]. Hai hướng nghiên cứu chính là biểu diễn đặc trưng (featurerepresentation) và học độ đo khoảng cách (metric learning) giữa các đặc trưng. Bộ biểudiễn đặc trưng tốt sẽ “ổn định bền” trước những yếu tố làm đa dạng biến thể của nhân vậtvà giúp cho các phương pháp học độ đo khoảng cách giữa các hình ảnh biến thể của nhânvật đạt kết quả tốt hơn.Cùng với sự phát triển của khoa học thế giới, nghiên cứu trong nước cũng có tiếntriển, một số nghiên cứu sơ khởi nhằm nâng cao hiệu suất cho bài toán đã công bố [4, 5].Tuy nhiên, ở Việt Nam chưa có một đánh giá nào trên các trên các bộ dữ liệu lớn mới đượccông bố trong những năm gần đây. Trong nghiên cứu này, chúng tôi sẽ trình bày tổng quanvề các phương pháp biểu diễu đặc trưng và học độ đo khoảng cách để đánh giá trên nhữngbộ dữ liệu mới bằng các độ đo tiêu chuẩn. Thông qua khảo sát này, chúng tôi cung cấp cáinhìn tổng quan hơn về bài toán tái nhận dạng nhân vật.Hình 1. Minh họa bài toán tái nhận dạng nhân vật [6]Phần còn lại của bài báo được tổ chức như sau: Phần 2 trình bày mô hình tái nhậndạng nhân vật, một số phương pháp rút trích đặc trưng và học độ đo. Phần 3 trình bày cácbộ dữ liệu Airport, DukeMTMC4ReID, các độ tiêu chuẩn Rank i, nAUC và kết quả thựcnghiệm. Cuối cùng, phần 4 trình bày kết luận.98TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCMVõ Duy Nguyên và tgk2.Các nghiên cứu liên quan2.1. Mô hình phổ biến của bài toán tái nhận dạng nhân vậtTrong phần này, chúng tôi trình bày tổng quan về các phương pháp rút trích đặctrưng của bài toán tái nhận dạng nhân vật. Tái nhận dạng nhân vật được nghiên cứu chủyếu dựa trên ảnh đơn (single im ...

Tài liệu được xem nhiều: