Cải tiến độ chính xác tra cứu ảnh thông qua học sâu và học độ đo khoảng cách tối ưu
Số trang: 7
Loại file: pdf
Dung lượng: 558.49 KB
Lượt xem: 15
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết đề xuất phương pháp tra cứu ảnh IRDLoM (Image Retrieval using Deep learning and optimal distance metric) sử dụng mạng CNN để xây dựng bộ đặc trưng và tìm một phép chiếu tuyến tính với một độ đo tương tự cải tiến. Phần thực nghiệm cung cấp các kết quả thực nghiệm để minh chứng độ chính xác của phương pháp đề xuất.
Nội dung trích xuất từ tài liệu:
Cải tiến độ chính xác tra cứu ảnh thông qua học sâu và học độ đo khoảng cách tối ưu Đào Thị Thúy Quỳnh CẢI TIẾN ĐỘ CHÍNH XÁC TRA CỨU ẢNH THÔNG QUA HỌC SÂU VÀ HỌC ĐỘ ĐO KHOẢNG CÁCH TỐI ƯU Đào Thị Thúy Quỳnh * * Khoa Công nghệ thông tin 1, Học Viện Công Nghệ Bưu Chính Viễn Thông Tóm tắt- Tra cứu ảnh dựa vào nội dung được thực hiện bởi việc so sánh độ đo tương tự giữa biểu diễn ảnh truy Do đó, biểu diễn ảnh bởi véc tơ đặc trưng và độ đo vấn và biểu diễn cơ sở dữ liệu ảnh. Do đó, hiệu quả của tương tự là hai yếu tố chính ảnh hưởng tới hiệu quả của hệ phương pháp tra cứu ảnh bị ảnh hưởng rất nhiều bởi biểu thống CBIR. Nâng cao hiệu quả của hệ thống CBIR là một diễn ảnh và độ đo tương tự. Gần đây, học sâu được sử vấn đề thách thức trong nghiên cứu. Để nâng cao hiệu quả, dụng và đem lại hiệu quả cao trong các bài toán phân lớp, chúng ta cần giảm khoảng trống ngữ nghĩa trong CBIR, nhận dạng ảnh, các đặc trưng ảnh được học bởi mô hình khoảng trống ngữ nghĩa thể hiện những hạn chế của biểu CNN mang tính ngữ nghĩa cao. Trong bài báo này, chúng diễn ảnh bởi đặc trưng mức thấp được trích rút tự động và tôi sẽ đề xuất phương pháp tra cứu ảnh IRDLoM (Image ngữ nghĩa của bức ảnh do con người cảm nhận. Để giảm Retrieval using Deep learning and optimal distance khoảng trống ngữ nghĩa này, đã có một số đề xuất đưa các metric) sử dụng mạng CNN để xây dựng bộ đặc trưng và kỹ thuật học máy vào trong quá trình tra cứu ảnh. Những tìm một phép chiếu tuyến tính với một độ đo tương tự cải năm gần đây, học sâu đã nâng cao được hiệu quả của các tiến. Phần thực nghiệm cung cấp các kết quả thực nghiệm bài toán nhận dạng, phân loại đối tượng. Với mong muốn để minh chứng độ chính xác của phương pháp đề xuất. nâng cao hiệu quả ngay từ quá trình xây dựng bộ đặc trưng biểu diễn ảnh, phương pháp đề xuất sẽ sử dụng cấu trúc Từ khóa: Content-based image retrieval, deep mạng CNN để xây dựng bộ đặc trưng có tính ngữ nghĩa learning, similarity measures, mahalanobis metric cao. Bên cạnh đó, phương pháp đề xuất sẽ kết hợp kỹ thuật distance. phân lớp LDA và học độ đo tương tự (Learning similarity measures) để đưa một độ đo tương tự cải tiến phù hợp hơn I. MỞ ĐẦU với dữ liệu. Tra cứu ảnh dựa vào nội dung (CBIR-Content Based Ý tưởng của học độ đo khoảng cách là tìm một độ đo Image Retrieval) đã nhận được nhiều sự quan tâm trong khoảng cách tối ưu mà tối thiểu được khoảng cách giữa thập kỷ qua, do nhu cầu xử lý hiệu quả lượng dữ liệu đa các cặp ảnh tương tự nhau và tối đa hóa khoảng cách giữa phương tiện khổng lồ và tăng nhanh chóng. Nhiều hệ những cặp ảnh không tương tự. Sau đó, độ đo khoảng cách thống CBIR đã được phát triển, gồm QBIC [21], tối ưu này sẽ được dùng để phân hạng lại toàn bộ tập ảnh Photobook [22], MARS [23], PicHunter [24] , Blobworld và trả về kết quả. Chúng tôi đề xuất một kỹ thuật hiệu cứu [25]. ảnh hiệu quả, kỹ thuật có tên là IRDLoM (Image Retrieval Trong một hệ thống CBIR tiêu biểu, các đặc trưng ảnh using Deep learning and optimal distance metric). Bằng trực quan mức thấp (màu, kết cấu và hình dạng) được trích thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh , rút tự động và biểu diễn thành các véc tơ đặc trưng tương chúng tôi sẽ chỉ ra sự chính xác của phương pháp đề xuất. ứng cho mục tiêu mô tả ảnh và so sánh độ tương tự. Để Phần còn lại của bài báo được tổ chức như sau. Trong tìm kiếm các ảnh mong muốn, người dùng đưa một ảnh Phần 2, trình bày chi tiết phương pháp đề xuất. Phần 3 mô làm mẫu truy vấn và hệ thống trả lại một tập các ảnh tương tả các thực nghiệm hiệu năng của chúng tôi và thảo luận tự dựa vào các đặc trưng được trích rút. Khi các hệ thống các kết quả. Cuối cùng, chúng tôi đưa ra kết luận. trình bày một tập các ảnh được xem là tương tự đối với truy vấn, người dùng có thể lấy ra những ảnh liên quan II. NGHIÊN CỨU LIÊN QUAN nhất với ảnh truy vấn được cho, và hệ thống điều chỉnh truy vấn sử dụng chúng. Phản hồi liên quan dựa vào các kỹ Tra cứu ảnh dựa vào nội dung sử dụng học khoảng thuật CBIR không yêu cầu người dùng cung cấp các truy cách đã nhận được sự quan tâm trong cộng đồng nghiên vấn khởi tạo chính xác, nhưng đánh giá truy vấn lý tưởng cứu [6, 9, 13, 14, 15, 16, 17,18]. Dữ liệu đầu vào của các của người dùng bằng sử dụng các ảnh liên quan phản hồi thuật toán học khoảng cách trong tra cứu ảnh thường được bởi người dùng. chia làm hai nhóm: (1) chỉ xem xét đến các cặp ảnh tương tự và (2) xem xét cả các cặp ảnh tương tự và các cặp ảnh không tương tự. Ý tưởng điều chỉnh trọng số của hàm khoảng cách đã ...
Nội dung trích xuất từ tài liệu:
Cải tiến độ chính xác tra cứu ảnh thông qua học sâu và học độ đo khoảng cách tối ưu Đào Thị Thúy Quỳnh CẢI TIẾN ĐỘ CHÍNH XÁC TRA CỨU ẢNH THÔNG QUA HỌC SÂU VÀ HỌC ĐỘ ĐO KHOẢNG CÁCH TỐI ƯU Đào Thị Thúy Quỳnh * * Khoa Công nghệ thông tin 1, Học Viện Công Nghệ Bưu Chính Viễn Thông Tóm tắt- Tra cứu ảnh dựa vào nội dung được thực hiện bởi việc so sánh độ đo tương tự giữa biểu diễn ảnh truy Do đó, biểu diễn ảnh bởi véc tơ đặc trưng và độ đo vấn và biểu diễn cơ sở dữ liệu ảnh. Do đó, hiệu quả của tương tự là hai yếu tố chính ảnh hưởng tới hiệu quả của hệ phương pháp tra cứu ảnh bị ảnh hưởng rất nhiều bởi biểu thống CBIR. Nâng cao hiệu quả của hệ thống CBIR là một diễn ảnh và độ đo tương tự. Gần đây, học sâu được sử vấn đề thách thức trong nghiên cứu. Để nâng cao hiệu quả, dụng và đem lại hiệu quả cao trong các bài toán phân lớp, chúng ta cần giảm khoảng trống ngữ nghĩa trong CBIR, nhận dạng ảnh, các đặc trưng ảnh được học bởi mô hình khoảng trống ngữ nghĩa thể hiện những hạn chế của biểu CNN mang tính ngữ nghĩa cao. Trong bài báo này, chúng diễn ảnh bởi đặc trưng mức thấp được trích rút tự động và tôi sẽ đề xuất phương pháp tra cứu ảnh IRDLoM (Image ngữ nghĩa của bức ảnh do con người cảm nhận. Để giảm Retrieval using Deep learning and optimal distance khoảng trống ngữ nghĩa này, đã có một số đề xuất đưa các metric) sử dụng mạng CNN để xây dựng bộ đặc trưng và kỹ thuật học máy vào trong quá trình tra cứu ảnh. Những tìm một phép chiếu tuyến tính với một độ đo tương tự cải năm gần đây, học sâu đã nâng cao được hiệu quả của các tiến. Phần thực nghiệm cung cấp các kết quả thực nghiệm bài toán nhận dạng, phân loại đối tượng. Với mong muốn để minh chứng độ chính xác của phương pháp đề xuất. nâng cao hiệu quả ngay từ quá trình xây dựng bộ đặc trưng biểu diễn ảnh, phương pháp đề xuất sẽ sử dụng cấu trúc Từ khóa: Content-based image retrieval, deep mạng CNN để xây dựng bộ đặc trưng có tính ngữ nghĩa learning, similarity measures, mahalanobis metric cao. Bên cạnh đó, phương pháp đề xuất sẽ kết hợp kỹ thuật distance. phân lớp LDA và học độ đo tương tự (Learning similarity measures) để đưa một độ đo tương tự cải tiến phù hợp hơn I. MỞ ĐẦU với dữ liệu. Tra cứu ảnh dựa vào nội dung (CBIR-Content Based Ý tưởng của học độ đo khoảng cách là tìm một độ đo Image Retrieval) đã nhận được nhiều sự quan tâm trong khoảng cách tối ưu mà tối thiểu được khoảng cách giữa thập kỷ qua, do nhu cầu xử lý hiệu quả lượng dữ liệu đa các cặp ảnh tương tự nhau và tối đa hóa khoảng cách giữa phương tiện khổng lồ và tăng nhanh chóng. Nhiều hệ những cặp ảnh không tương tự. Sau đó, độ đo khoảng cách thống CBIR đã được phát triển, gồm QBIC [21], tối ưu này sẽ được dùng để phân hạng lại toàn bộ tập ảnh Photobook [22], MARS [23], PicHunter [24] , Blobworld và trả về kết quả. Chúng tôi đề xuất một kỹ thuật hiệu cứu [25]. ảnh hiệu quả, kỹ thuật có tên là IRDLoM (Image Retrieval Trong một hệ thống CBIR tiêu biểu, các đặc trưng ảnh using Deep learning and optimal distance metric). Bằng trực quan mức thấp (màu, kết cấu và hình dạng) được trích thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh , rút tự động và biểu diễn thành các véc tơ đặc trưng tương chúng tôi sẽ chỉ ra sự chính xác của phương pháp đề xuất. ứng cho mục tiêu mô tả ảnh và so sánh độ tương tự. Để Phần còn lại của bài báo được tổ chức như sau. Trong tìm kiếm các ảnh mong muốn, người dùng đưa một ảnh Phần 2, trình bày chi tiết phương pháp đề xuất. Phần 3 mô làm mẫu truy vấn và hệ thống trả lại một tập các ảnh tương tả các thực nghiệm hiệu năng của chúng tôi và thảo luận tự dựa vào các đặc trưng được trích rút. Khi các hệ thống các kết quả. Cuối cùng, chúng tôi đưa ra kết luận. trình bày một tập các ảnh được xem là tương tự đối với truy vấn, người dùng có thể lấy ra những ảnh liên quan II. NGHIÊN CỨU LIÊN QUAN nhất với ảnh truy vấn được cho, và hệ thống điều chỉnh truy vấn sử dụng chúng. Phản hồi liên quan dựa vào các kỹ Tra cứu ảnh dựa vào nội dung sử dụng học khoảng thuật CBIR không yêu cầu người dùng cung cấp các truy cách đã nhận được sự quan tâm trong cộng đồng nghiên vấn khởi tạo chính xác, nhưng đánh giá truy vấn lý tưởng cứu [6, 9, 13, 14, 15, 16, 17,18]. Dữ liệu đầu vào của các của người dùng bằng sử dụng các ảnh liên quan phản hồi thuật toán học khoảng cách trong tra cứu ảnh thường được bởi người dùng. chia làm hai nhóm: (1) chỉ xem xét đến các cặp ảnh tương tự và (2) xem xét cả các cặp ảnh tương tự và các cặp ảnh không tương tự. Ý tưởng điều chỉnh trọng số của hàm khoảng cách đã ...
Tìm kiếm theo từ khóa liên quan:
Khoa học Công nghệ thông và Truyền thông Tra cứu ảnh dựa vào nội dung Học độ đo khoảng cách tối ưu Hệ thống CBIR Phép chiếu tuyến tínhTài liệu liên quan:
-
Nâng cao hiệu quả tra cứu ảnh nhãn hiệu sử dụng cây quyết định và phản hồi liên quan
10 trang 173 0 0 -
13 trang 38 0 0
-
Nghiên cứu hiệu năng bảo mật mạng vô tuyến nhận thức dạng nền cộng tác sử dụng mã fountain
9 trang 31 0 0 -
Nâng cao khả năng phát hiện xâm nhập mạng sử dụng mạng CNN
8 trang 29 0 0 -
Nhận dạng ngôn ngữ ký hiệu tiếng Việt trong video bằng LSTM và I3D đa khối
9 trang 28 0 0 -
Mạng chuyển tiếp đa chặng dạng nền trong truyền thông gói tin ngắn: Đánh giá tỷ lệ lỗi khối
6 trang 25 0 0 -
Tấn công tiêm lỗi trên AES-128 bằng phương pháp tấn công lỗi vi sai
6 trang 23 0 0 -
6 trang 22 0 0
-
Cải tiến tra cứu ảnh thông qua kết hợp các bộ phân lớp không gian con ngẫu nhiên
7 trang 22 0 0 -
Điều chế QPSK và 16PSK phân cực kép trong kênh truyền quang có và không có tín hiệu hỗn loạn
6 trang 21 0 0