Danh mục

Cải tiến tra cứu ảnh thông qua kết hợp các bộ phân lớp không gian con ngẫu nhiên

Số trang: 7      Loại file: pdf      Dung lượng: 579.77 KB      Lượt xem: 22      Lượt tải: 0    
tailieu_vip

Hỗ trợ phí lưu trữ khi tải xuống: 3,000 VND Tải xuống file đầy đủ (7 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết đề xuất một phương pháp tra cứu ảnh phản hồi liên quan hiệu quả gọi là RFRS (Image retrieval using relevance feedback with random subspace), cho phép nâng cao hiệu năng của hệ thống tra cứu ảnh thông qua việc giải quyết vấn đề quá khớp.
Nội dung trích xuất từ tài liệu:
Cải tiến tra cứu ảnh thông qua kết hợp các bộ phân lớp không gian con ngẫu nhiên Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00010 CẢI TIẾN TRA CỨU ẢNH THÔNG QUA KẾT HỢP CÁC BỘ PHÂN LỚP KHÔNG GIAN CON NGẪU NHIÊN Cù Việt Dũng1, Nguyễn Hữu Quỳnh1, An Hồng Sơn2, Đào Thị Thúy Quỳnh3 1 Khoa Công nghệ thông tin, Trường Đại học Điện lực, 2 Trường Đại học Công nghiệp Việt Hung, 3 Khoa Công nghệ thông tin, Trường Bưu chính Viễn thông dungcv@epu.edu.vn, nhquynh@epu.edu.vn, sonanhongvh@gmail.com, thuyquynhtn90@gmail.com TÓM TẮT: Đã có nhiều phương pháp tra cứu ảnh phản hồi liên quan dựa vào phân lớp sử dụng máy véc tơ hỗ trợ (SVM). Tuy nhiên, các phương pháp này chưa đề cập tới vấn đề quá khớp với mẫu phản hồi dẫn đến độ chính xác thấp. Trong bài báo này, chúng tôi đề xuất một phương pháp tra cứu ảnh phản hồi liên quan hiệu quả gọi là RFRS(Image retrieval using relevance feedback with random subspace), cho phép nâng cao hiệu năng của hệ thống tra cứu ảnh thông qua việc giải quyết vấn đề quá khớp. Phương pháp của chúng tôi xây dựng nhiều bộ phân lớp máy véc tơ hỗ trợ dùng không gian con ngẫu nhiên thay vì một bộ và tổ hợp chúng thành một luật quyết định mạnh. Chúng tôi cũng cung cấp các kết quả thực nghiệm trên cơ sở dữ liệu đặc trưng 10800 ảnh để chỉ ra độ chính xác của phương pháp Từ khóa: Tra cứu ảnh dựa vào nội dung, không gian con, máy véc tơ hỗ trợ, phản hồi liên quan, quá khớp. I. GIỚI THIỆU Trong những thập kỷ vừa qua, tra cứu ảnh dựa vào nội dung (CBIR) đã thu hút nhiều sự quan tâm của nhiều nhà nghiên cứu [1, 2, 6, 7]. Các hệ thống CBIR truyền thống thường đo độ tương tự giữa ảnh truy vấn và các ảnh trong cơ sở dữ liệu bằng cách đo độ đo khoảng cách trong một không gian nhiều chiều [1, 2, 6, 7]. Tuy nhiên, bằng cách đo độ đo khoảng cách này trong không gian nhiều chiều thường không hiệu quả do khoảng trống giữa các đặc trưng mức thấp và các khái niệm ngữ nghĩa mức cao. Để thu hẹp khoảng trống ngữ nghĩa, các máy tính phải có khả năng học các đặc trưng mà mô tả tốt nhất các bức ảnh trong suy nghĩ của người dùng trực tuyến; và kỹ thuật phản hồi liên quan được giới thiệu như một công cụ mạnh để tăng cường hiệu năng của CBIR [10, 13]. Huang và cộng sự đã giới thiệu cả hai kỹ thuật đánh lại trọng số và dịch chuyển điểm truy vấn [8, 12]. Một ánh xạ tự tổ chức được sử dụng để xây dựng các thuật toán RF [4]. Trong [11], máy véc tơ hỗ trợ (SVM) một lớp đánh giá mật độ của các mẫu phản hồi tích cực. Tuy nhiên, tất cả các phương pháp này có một số giới hạn. Chẳng hạn, phương pháp trong [8] và [12] được dựa vào kinh nghiệm, phương pháp ước lượng mật độ trong [11] bỏ qua mọi thông tin chứa trong các mẫu phản hồi tiêu cực. Tuy nhiên, RF rất khác so với bài toán phân lớp truyền thống bởi vì các phản hồi được cung cấp bởi người dùng thường bị giới hạn trong các hệ thống tra cứu ảnh thực. Do đó, các phương pháp học mẫu nhỏ là hứa hẹn cho RF. Khi dữ liệu có chiều cao và cỡ của mẫu huấn luyện là nhỏ so với chiều của dữ liệu, nó khó có thể xây dựng một bộ phân lớp tốt. Thông thường, một bộ phân lớp được xây dựng trên các tập dữ liệu huấn luyện nhỏ sẽ bị lệch và có có sai số lớn do các tham số phân lớp bị ước lượng nghèo nàn. Do đó, một bộ phân lớp như thế có thể là yếu, có một hiệu năng nghèo [9]. Hơn nữa, thường nó sẽ không ổn định: các thay đổi nhỏ trong tập huấn luyện gây ra các thay đổi lớn trong bộ phân lớp. Nói chung, hiệu năng thấp của một bộ phân lớp có thể do các nhân tố khác nhau: các giả thiết về mô hình không chính xác khi xây dựng bộ phân lớp; các thiết lập cho các tham số phân lớp không chính xác; không ổn định của bộ phân lớp; các bộ phân lớp phụ thuộc vào các mô hình được giả thiết nào đó không luôn đúng. Tuy nhiên, trong tất cả các trường hợp khi có ý định cải tiến một “bộ phân lớp yếu”, người ta thường cải tiến hiệu năng của nó. Do đó, mô tả một “bộ phân lớp yếu” như một bộ phân lớp mà có một hiệu năng nghèo nàn dường như là một định nghĩa chung nhất. Để cải tiến một bộ phân lớp yếu (một bộ phân lớp mà có hiệu năng nghèo), người ta có thể sử dụng các cách tiếp cận khác nhau. Một cách là ổn định sự quyết định của một bộ phân lớp yếu (do bộ phân lớp yếu thường không ổn định) theo quy tắc (regularisation) [5] hoặc tiêm nhiều (noise injection) [3]. Cách tiếp cận khác là xây dựng nhiều bộ phân lớp yếu thay vì một bộ và tổ hợp chúng thành một luật quyết định mạnh. Chúng tôi sẽ trình bày phương pháp tra cứu ảnh mà kết hợp không gian con ngẫu nhiên và máy véc tơ hỗ trợ tạo ra nhiều bộ phân lớp yếu cùng một luật quyết định mạnh cho phép nâng cao độ chính xác hệ thống tra cứu ảnh. Phần còn lại bài báo này được tổ chức như sau: Trong phần II, chúng tôi trình bày phương pháp tra cứu ảnh đề xuất. Phần III mô tả các thực nghiệm độ chính xác của chúng tôi và thảo luận các kết quả. Cuối cùng, chúng tôi đưa ra kết luận trong phần IV. Cù Việt Dũng, Nguyễn Hữu Quỳnh, An Hồng Sơn, Đào Thị Thúy Quỳnh 73 II. PHƢƠNG PHÁP TRA CỨU ẢNH ĐỀ XUẤT Trong phần này, đầu tiên chúng tôi trình bày cách đo độ khác nhau giữa một mẫu được cho và ảnh truy vấn trong phản hồi liên quan dựa vào máy véc tơ hỗ trợ truyền thống. Sau đó, trình bày chi tiết phương pháp đề xuất kết hợp các bộ phân lớp với không gian con ngẫu nhiên cùng sơ đồ của phương pháp. 1. Máy véc tơ hỗ trợ Đối với tập dữ liệu huấn luyện D ={ }, là véc tơ đặc trưng trong không gian , m là số chiều của không gian, cùng các nhãn tương ứng của chúng ...

Tài liệu được xem nhiều: