![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Khảo sát thực nghiệm đặc trưng học sâu trên bộ dữ liệu lớn cho bài toán tái nhận dạng nhân vật
Số trang: 7
Loại file: pdf
Dung lượng: 686.63 KB
Lượt xem: 17
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết trình bày việc tiến hành đánh giá hiệu quả của các mạng học sâu trên một bộ dữ liệu lớn MSMT17 vừa được công bố trong năm 2018 nhằm có một cái nhìn tổng quan hơn về hiệu quả và khả năng áp dụng của đặc trưng học sâu trong bài toán tái nhận dạng nhân vật.
Nội dung trích xuất từ tài liệu:
Khảo sát thực nghiệm đặc trưng học sâu trên bộ dữ liệu lớn cho bài toán tái nhận dạng nhân vậtKỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018DOI: 10.15625/vap.2018.00031 KHẢO SÁT THỰC NGHIỆM ĐẶC TRƯNG HỌC SÂU TRÊN BỘ DỮ LIỆU LỚN CHO BÀI TOÁN TÁI NHẬN DẠNG NHÂN VẬT Võ Duy Nguyên1, Huỳnh Nhật Lưu2, Nguyễn Thị Bảo Ngọc1, Nguyễn Tấn Trần Minh Khang1 1 PTN Truyền thông Đa phương tiện, Đại học Công nghệ Thông tin ĐHQG TP. HCM 2 Trường Đại học Mở TP. HCM 1 {nguyenvd,ngocntb,khangnttm}@uit.edu.vn 2 1451010101luu@ou.edu.vnTÓM TẮT: Cho ảnh của một người đã được quan sát tại một vị trí, bài toán tái nhận dạng nhân vật giúp nhận dạng và liên kết ảnhcủa đối tượng đó xuất hiện tại các địa điểm khác trong hệ thống camera giám sát. Đây là một bài toán có khả năng ứng dụng cao,đặc biệt là trong các hệ thống camera giám sát. Nhiều phương pháp rút trích đặc trưng khác nhau được đề xuất nhằm giúp biểudiễn tốt ảnh của các đối tượng vượt qua các thách thức như sự thay đổi về tư thế của đối tượng, sự khác nhau về khung nền hay điềukiện chiếu sáng. Trong những năm gần đây, đặc trưng học sâu được sử dụng và mang lại kết quả cao trong nhiều bài toán tronglĩnh vực thị giác máy tính. Trong nghiên cứu này, chúng tôi sẽ tiến hành đánh giá hiệu quả của các mạng học sâu trên một bộ dữliệu lớn MSMT17 vừa được công bố trong năm 2018 nhằm có một cái nhìn tổng quan hơn về hiệu quả và khả năng áp dụng của đặctrưng học sâu trong bài toán tái nhận dạng nhân vật.Từ khóa: Tái nhận dạng nhân vật, đặc trưng học sâu, dữ liệu lớn. I. GIỚI THIỆU Cùng với sự phát triển của các hệ thống camera giám sát, các hệ thống giám sát an ninh được đề xuất nhằmgiám sát nhiều nơi công cộng như siêu thị, sân bay hay bệnh viện. Những hệ thống này bao gồm rất nhiều camera đượcđặt ở nhiều vị trí khác nhau. Hình ảnh của các camera này được thu thập và quản lý bởi một trung tâm kiểm soát. Côngviệc của trung tâm kiểm soát này có thể bao gồm nhiều tác vụ khác nhau như phát hiện người, tìm kiếm và theo vết cácđối tượng (người). Trong những công việc đó, tìm kiếm các đối tượng di chuyển qua nhiều vùng quan sát của cáccamera khác nhau đóng vai trò rất quan trọng trong các hệ thống giám sát an ninh. Nhiệm vụ này được biết đến với têngọi là tái nhận dạng nhân vật (Person Re-Identification). Hình 1. Mục tiêu của tái nhận dạng nhân vật là tìm ra ảnh của mục tiêu đã di chuyển qua vùng quan sát của nhiều camera khác nhau Việc tái nhận dạng nhân vật trong một hệ thống gồm nhiều camera khác nhau gặp rất nhiều thách thức. Đặc biệt,khi số lượng người di chuyển qua các camera tăng lên, khả năng tái nhận dạng càng thấp do các đối tượng có thể bị chekhuất và nhiều người có ngoại hình, trang phục giống nhau. Ngoài ra, sự khác biệt về hình ảnh của các đối tượng xuấthiện trong các camera do các tác nhân khác nhau như khung cảnh, điều kiện ánh sáng, góc nhìn ... cũng là một vấn đềlớn cần giải quyết để tái nhận dạng các nhân vật một cách chính xác.Võ Duy Nguyên, Huỳnh Nhật Lưu, Nguyễn Thị Bảo Ngọc, Nguyễn Tấn Trần Minh Khang 233 Trong những năm gần đây, đặc trưng học sâu được áp dụng và mang lại hiệu quả cao trong nhiều bài toán tronglĩnh vực thị giác máy tính. Nhiều đặc trưng học sâu cũng đã được đề xuất để áp dụng cho bài toán tái nhận dạng nhânvật và cho kết quả vượt trội so với các phương pháp khác [1]-[4]. Tuy nhiên, do các bộ dữ liệu về tái nhận dạng nhânvật trước đây thường có kích thước nhỏ (ví dụ bộ dữ liệu VIPeR[5] tổng cộng chỉ có 1264 hình, bộ dữ liệu GRID[6]chỉ có 1275 hình), do đó khó có khả năng đánh giá được chính xác hiệu quả của đặc trưng học sâu trong bài toán táinhận dạng nhân vật. Trong bài báo này, chúng tôi sẽ đánh giá hiệu quả của các đặc trưng học sâu khác nhau trên dữ liệu lớn. Cụ thể,chúng tôi đánh giá đặc trưng rút trích từ mạng học sâu gồm AlexNet[7], VGG16[8]trên bộ dữ liệu lớn và mới đượccông bố là MSMT17 (4,101 người và 126,441 ảnh). Ngoài ra, chúng tôi cũng đề xuất thay đổi kích thước ảnh đầu vàođể rút trích đặc trưng phù hợp hơn với bài toán tái nhận dạng nhân vật. Từ các kết quả thực nghiệm, chúng tôi đưa ramột số nhận xét về các kết quả thu được. Phần còn lại của bài báo được tổ chức như sau, trong phần II chúng tôi sẽ khảo sát bài toán Tái nhận dạng nhânvật cũng như các phương pháp rút trích đặc trưng sẽ được sử dụng. Phần III sẽ trình bày các đặc trưng học sâu. PhầnIV, chúng tôi sẽ thảo lu ...
Nội dung trích xuất từ tài liệu:
Khảo sát thực nghiệm đặc trưng học sâu trên bộ dữ liệu lớn cho bài toán tái nhận dạng nhân vậtKỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018DOI: 10.15625/vap.2018.00031 KHẢO SÁT THỰC NGHIỆM ĐẶC TRƯNG HỌC SÂU TRÊN BỘ DỮ LIỆU LỚN CHO BÀI TOÁN TÁI NHẬN DẠNG NHÂN VẬT Võ Duy Nguyên1, Huỳnh Nhật Lưu2, Nguyễn Thị Bảo Ngọc1, Nguyễn Tấn Trần Minh Khang1 1 PTN Truyền thông Đa phương tiện, Đại học Công nghệ Thông tin ĐHQG TP. HCM 2 Trường Đại học Mở TP. HCM 1 {nguyenvd,ngocntb,khangnttm}@uit.edu.vn 2 1451010101luu@ou.edu.vnTÓM TẮT: Cho ảnh của một người đã được quan sát tại một vị trí, bài toán tái nhận dạng nhân vật giúp nhận dạng và liên kết ảnhcủa đối tượng đó xuất hiện tại các địa điểm khác trong hệ thống camera giám sát. Đây là một bài toán có khả năng ứng dụng cao,đặc biệt là trong các hệ thống camera giám sát. Nhiều phương pháp rút trích đặc trưng khác nhau được đề xuất nhằm giúp biểudiễn tốt ảnh của các đối tượng vượt qua các thách thức như sự thay đổi về tư thế của đối tượng, sự khác nhau về khung nền hay điềukiện chiếu sáng. Trong những năm gần đây, đặc trưng học sâu được sử dụng và mang lại kết quả cao trong nhiều bài toán tronglĩnh vực thị giác máy tính. Trong nghiên cứu này, chúng tôi sẽ tiến hành đánh giá hiệu quả của các mạng học sâu trên một bộ dữliệu lớn MSMT17 vừa được công bố trong năm 2018 nhằm có một cái nhìn tổng quan hơn về hiệu quả và khả năng áp dụng của đặctrưng học sâu trong bài toán tái nhận dạng nhân vật.Từ khóa: Tái nhận dạng nhân vật, đặc trưng học sâu, dữ liệu lớn. I. GIỚI THIỆU Cùng với sự phát triển của các hệ thống camera giám sát, các hệ thống giám sát an ninh được đề xuất nhằmgiám sát nhiều nơi công cộng như siêu thị, sân bay hay bệnh viện. Những hệ thống này bao gồm rất nhiều camera đượcđặt ở nhiều vị trí khác nhau. Hình ảnh của các camera này được thu thập và quản lý bởi một trung tâm kiểm soát. Côngviệc của trung tâm kiểm soát này có thể bao gồm nhiều tác vụ khác nhau như phát hiện người, tìm kiếm và theo vết cácđối tượng (người). Trong những công việc đó, tìm kiếm các đối tượng di chuyển qua nhiều vùng quan sát của cáccamera khác nhau đóng vai trò rất quan trọng trong các hệ thống giám sát an ninh. Nhiệm vụ này được biết đến với têngọi là tái nhận dạng nhân vật (Person Re-Identification). Hình 1. Mục tiêu của tái nhận dạng nhân vật là tìm ra ảnh của mục tiêu đã di chuyển qua vùng quan sát của nhiều camera khác nhau Việc tái nhận dạng nhân vật trong một hệ thống gồm nhiều camera khác nhau gặp rất nhiều thách thức. Đặc biệt,khi số lượng người di chuyển qua các camera tăng lên, khả năng tái nhận dạng càng thấp do các đối tượng có thể bị chekhuất và nhiều người có ngoại hình, trang phục giống nhau. Ngoài ra, sự khác biệt về hình ảnh của các đối tượng xuấthiện trong các camera do các tác nhân khác nhau như khung cảnh, điều kiện ánh sáng, góc nhìn ... cũng là một vấn đềlớn cần giải quyết để tái nhận dạng các nhân vật một cách chính xác.Võ Duy Nguyên, Huỳnh Nhật Lưu, Nguyễn Thị Bảo Ngọc, Nguyễn Tấn Trần Minh Khang 233 Trong những năm gần đây, đặc trưng học sâu được áp dụng và mang lại hiệu quả cao trong nhiều bài toán tronglĩnh vực thị giác máy tính. Nhiều đặc trưng học sâu cũng đã được đề xuất để áp dụng cho bài toán tái nhận dạng nhânvật và cho kết quả vượt trội so với các phương pháp khác [1]-[4]. Tuy nhiên, do các bộ dữ liệu về tái nhận dạng nhânvật trước đây thường có kích thước nhỏ (ví dụ bộ dữ liệu VIPeR[5] tổng cộng chỉ có 1264 hình, bộ dữ liệu GRID[6]chỉ có 1275 hình), do đó khó có khả năng đánh giá được chính xác hiệu quả của đặc trưng học sâu trong bài toán táinhận dạng nhân vật. Trong bài báo này, chúng tôi sẽ đánh giá hiệu quả của các đặc trưng học sâu khác nhau trên dữ liệu lớn. Cụ thể,chúng tôi đánh giá đặc trưng rút trích từ mạng học sâu gồm AlexNet[7], VGG16[8]trên bộ dữ liệu lớn và mới đượccông bố là MSMT17 (4,101 người và 126,441 ảnh). Ngoài ra, chúng tôi cũng đề xuất thay đổi kích thước ảnh đầu vàođể rút trích đặc trưng phù hợp hơn với bài toán tái nhận dạng nhân vật. Từ các kết quả thực nghiệm, chúng tôi đưa ramột số nhận xét về các kết quả thu được. Phần còn lại của bài báo được tổ chức như sau, trong phần II chúng tôi sẽ khảo sát bài toán Tái nhận dạng nhânvật cũng như các phương pháp rút trích đặc trưng sẽ được sử dụng. Phần III sẽ trình bày các đặc trưng học sâu. PhầnIV, chúng tôi sẽ thảo lu ...
Tìm kiếm theo từ khóa liên quan:
Tái nhận dạng nhân vật Đặc trưng học sâu Bài toán tái nhận dạng nhân vật Bộ dữ liệu lớn MSMT17 Hệ thống camera giám sátTài liệu liên quan:
-
106 trang 385 7 0
-
41 trang 353 4 0
-
104 trang 149 2 0
-
106 trang 62 2 0
-
6 trang 32 1 0
-
Một kỹ thuật định vị đối tượng trong hệ thống camera giám sát phục vụ theo dõi trực quang
7 trang 32 0 0 -
Bài giảng Trang thiết bị kỹ thuật công trình - Chương 4: Hệ thống điện tử công trình
19 trang 16 0 0 -
Hệ thống Camera giám sát ngọn lửa lò nung Xi măng
8 trang 16 0 0 -
IVA-EC: Giải pháp phân tích video thông minh dựa trên điện toán biên
9 trang 15 0 0 -
50 trang 14 0 0