Danh mục

Nâng cao độ chính xác tra cứu ảnh dựa vào nội dung trong ngữ cảnh tập mẫu huấn luyện hạn chế

Số trang: 8      Loại file: pdf      Dung lượng: 650.12 KB      Lượt xem: 10      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết trình bày việc đề xuất phương pháp tra cứu ảnh IREC (An image retrieval method using efficient Classifier), nó có ưu điểm xây dựng được bộ huấn luyện cân bằng giữa lớp âm và lớp dương.
Nội dung trích xuất từ tài liệu:
Nâng cao độ chính xác tra cứu ảnh dựa vào nội dung trong ngữ cảnh tập mẫu huấn luyện hạn chếKỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018DOI: 10.15625/vap.2018.00048 NÂNG CAO ĐỘ CHÍNH XÁC TRA CỨU ẢNH DỰA VÀO NỘI DUNG TRONG NGỮ CẢNH TẬP MẪU HUẤN LUYỆN HẠN CHẾ Đào Thị Thúy Quỳnh *, Nguyễn Hữu Quỳnh **, Phương Văn Cảnh**, Ngô Quốc Tạo*** * Khoa Công nghệ thông tin, Học viện Công nghệ Bưu chính Viên thông, ** Khoa Công nghệ thông tin, Trường Đại học Điện lực, ** * Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam, thuyquynhtn90@gmail.com, quynhnh@epu.edu.vn, canhpv@epu.edu.vn, nqtao@ioit.ac.vnTÓM TẮT: Nhiều hệ thống tra cứu ảnh hiện nay có tích hợp phản hồi liên quan để giảm khoảng trống ngữ nghĩa giữa mô tả ảnhmức thấp và ngữ nghĩa mức cao trong suy nghĩ người dùng. Từ thông tin người dùng cung cấp, một thuật toán phân lớp áp dụng lêntập huấn luyện tạo ra một bộ phân lớp được sử dụng trong pha tra cứu tiếp theo. Tuy nhiên, có hai hạn chế của tra cứu ảnh sử dụngphản hồi liên quan với SVM: (a) dữ liệu mất cân bằng mẫu dương và âm (mẫu âm thường lớn hơn mẫu dương) (b) số lượng mẫuphản hồi của người dùng thường rất nhỏ so với số chiều của dữ liệu. Nhằm khắc phục hai hạn chế trên, chúng tôi đề xuất phươngpháp tra cứu ảnh IREC (An image retrieval method using efficient Classifier), nó có ưu điểm xây dựng được bộ huấn luyện cânbằng giữa lớp âm và lớp dương. Bên cạnh đó, phương pháp khai thác tính chất hình học của dữ liệu đa tạp nhằm giảm số chiều củatập mẫu huấn luyện theo hướng tiếp cận phổ. Để minh chứng tính hiệu quả của của phương pháp đề xuất, chúng tôi cung cấp cáckết quả thực nghiệm trên cơ sở dữ liệu đặc trưng gồm 10800 ảnh.Từ khóa: Tra cứu ảnh dựa vào nội dung, phản hồi liên quan, đa tạp, phổ, giảm chiều dữ liệu, phân lớp cân bằng. I. GIỚI THIỆU Gần đây, tra cứu ảnh đã thu hút sự quan tâm của nhiều nhà nghiên cứu trong cộng đồng khoa học máy tính. Vớisự sẵn có của các thiết bị thu nhận ảnh số, số lượng ảnh số tăng lên với tốc độ nhanh chóng. Hệ thống tra cứu ảnh tựđộng trở thành chìa khóa cho việc sử dụng hiệu quả nguồn tài nguyên số. Trong một hệ thống CBIR tiêu biểu, các đặctrưng ảnh trực quan mức thấp (tức là màu, kết cấu và hình dạng) được trích rút tự động cho mục tiêu đánh chỉ số và môtả ảnh. Để tìm kiếm các ảnh mong muốn, người dùng đưa một ảnh làm mẫu và hệ thống trả lại một tập các ảnh tươngtự dựa vào các đặc trưng được trích rút. Khi các hệ thống trình bày một tập các ảnh được xem là tương tự đối với truyvấn, người dùng có thể lấy ra những ảnh liên quan nhất đến ảnh truy vấn được cho và hệ thống điều chỉnh truy vấn sửdụng chúng. Phản hồi liên quan dựa vào các kỹ thuật CBIR không yêu cầu người dùng cung cấp các truy vấn khởi tạochính xác, nhưng đánh giá truy vấn lý tưởng của người dùng bằng sử dụng các ảnh liên quan phản hồi. Trong các hệ thống tra cứu ảnh sử dụng phân lớp ở trên có hai chế: (a) dữ liệu mất cân bằng mẫu dương vàâm (mẫu âm thường lớn hơn mẫu dương) (b) số lượng mẫu phản hồi của người dùng thường rất nhỏ so với số chiềucủa dữ liệu. Hai hạn chế chính này dẫn đến độ chính xác thấp và độ phức tạp tính toán cao. Chúng tôi đề xuất mộtphương pháp nâng cao độ chính xác tra cứu ảnh dựa vào nội dung trong ngữ cảnh tập mẫu huấn luyện hạn chếIREC (An image retrieval method using efficient classifier). Bằng cách sử dụng một kỹ thuật sinh mẫu ngẫu nhiênvào lớp thiểu số để hai lớp cân bằng nhau. Sau đó khai thác tính chất hình học của dữ liệu đa tạp nhằm giảm sốchiều của tập mẫu huấn luyện sử dụng thuật toán giảm chiều sử dụng k véctơ riêng lên tập mẫu ví dụ huấn luyện.Trên tập mẫu cân bằng và giảm chiều, chúng tôi tìm được một siêu phẳng tách tối ưu và tính toán khoảng cách củatất cả ảnh trong cơ sở dữ liệu tới siêu phẳng tách và sắp xếp các điểm theo thứ tự tăng dần của khoảng cách và trảvề tập ảnh kết quả cho người dùng. Phần còn lại của bài báo được tổ chức như sau. Trong Phần II, chúng tôi khảo sát các nghiên cứu về tra cứu ảnhsử dụng phân lớp SVM. Phần III trình bày chi tiết phương pháp đề xuất. Phần IV mô tả các thực nghiệm đánh giá hiệunăng của phương pháp đề xuất và thảo luận các kết quả. Cuối cùng, chúng tôi đưa ra kết luận trong Phần V. II. PHẢN HỒI LIÊN QUAN VỚI SVM Phản hồi liên quan là một quá trình trực tuyến mà cố gắng học mục đích của người dùng trong quá trình và làmột công cụ mạnh được sử dụng truyền thống trong các hệ thống tra cứu thông tin. Nó được giới thiệu đối với CBIRkhoảng đầu những năm 1990, với mục đích mang người dùng vào lặp tra cứu để giảm khoảng cách ngữ nghĩ ...

Tài liệu được xem nhiều: