Danh mục

Một phương pháp chuẩn hóa các đặc trưng mức thấp áp dụng cho độ đo đánh hạng đa tạp trong truy vấn ảnh theo nội dung

Số trang: 13      Loại file: pdf      Dung lượng: 919.88 KB      Lượt xem: 10      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết này trình bày một phương pháp chuẩn hóa mới để xây dựng EMR. Thực nghiệm đã chứng tỏ tính hiệu quả của thuật toán đề xuất cho vấn đề xây dựng độ đo đánh hạng đa tạp, phép chuẩn hóa mới đã tăng chất lượng CBIR so với các phép chuẩn hóa thông dụng.
Nội dung trích xuất từ tài liệu:
Một phương pháp chuẩn hóa các đặc trưng mức thấp áp dụng cho độ đo đánh hạng đa tạp trong truy vấn ảnh theo nội dungCông nghệ thông tin & Cơ sở toán học cho tin học MỘT PHƯƠNG PHÁP CHUẨN HÓA CÁC ĐẶC TRƯNG MỨC THẤP ÁP DỤNG CHO ĐỘ ĐO ĐÁNH HẠNG ĐA TẠP TRONG TRUY VẤN ẢNH THEO NỘI DUNG Hoàng Xuân Trung1*, Đoàn Văn Hòa2*, Nguyễn Tân Ân3, Hoàng Văn Quý4, Nguyễn Văn Quyền5 Tóm tắt: Trong vấn đề tra cứu ảnh dựa trên nội dung (CBIR), ảnh được biểu diễn bằng nhiều đặc trưng mức thấp để mô tả màu sắc, kết cấu và hình dạng của ảnh. EMR (Độ đo đánh hạng đa tạp hiệu quả) là một thuật toán học bán giám sát trên các đặc trưng mức thấp của ảnh, đã được sử dụng hiệu quả trong CBIR. Sự kết hợp nhiều đặc trưng ảnh khác nhau để xây dựng thuật toán EMR thường sử dụng phép chuẩn hóa dữ liệu đặc trưng để cân bằng khoảng biến thiên của từng đặc trưng. Bài báo này trình bày một phương pháp chuẩn hóa mới để xây dựng EMR. Thực nghiệm đã chứng tỏ tính hiệu quả của thuật toán đề xuất cho vấn đề xây dựng độ đo đánh hạng đa tạp, phép chuẩn hóa mới đã tăng chất lượng CBIR so với các phép chuẩn hóa thông dụng.Từ khóa: Tra cứu ảnh dựa trên nội dung; Đặc trưng mức thấp; Chuẩn hóa đặc trưng mức thấp; Chuẩn hóa 3-opt; EMR. 1. MỞ ĐẦU Truy vấn ảnh dựa vào nội dung (CBIR) trở thành lĩnh vực nghiên cứu tích cực trongnhững năm qua. Các hệ thống này thường trích rút các biểu diễn trực quan của ảnh và địnhnghĩa các hàm đo độ tương tự của các ảnh để tra cứu theo yêu cầu. Thông thường việc truy vấn ảnh dựa trên nội dung đòi hỏi phải kết hợp các thông tinmô tả về màu sắc, kết cấu và hình dạng đồng thời. Mỗi vector đặc trưng trực quan trích rútđược từ một ảnh có các thành phần giá trị số có thể thuộc các khoảng số rất khác nhau, dođó khi kết hợp nhiều đặc trưng biểu diễn cho các ảnh để xây dựng độ đo tương tự của cácảnh chúng ta cần phải chuẩn hóa dữ liệu đặc trưng về một miền số chung là đoạn [0,1](xem [1, 2]). Độ đo đánh hạng đa tạp [20] đo độ tương tự của các ảnh được sử dụng rộng rãi trongCBIR. Với một giả định rằng mỗi điểm dữ liệu trong một không gian đặc trưng có mộtmối quan hệ với các điểm dữ liệu khác tương tự trong không gian, Thuật toán trước hếtxây dựng một đồ thị có trọng số cho tất cả các điểm dữ liệu trong không gian đặc trưng ởđó mỗi cạnh được gán một trọng số để biểu diễn mối liên quan dữ liệu giữa hai điểm. Đầutiên, điểm dữ liệu truy vấn ban đầu được gán một giá trị nhất định, các điểm dữ liệu còn lạicó liên quan được gán giá trị 0. Thứ hai, tất cả các điểm dữ liệu lan truyền xếp hạng củachúng đến các điểm dữ liệu bên cạnh thông qua các đồ thị có trọng số. Quá trình lantruyền của các điểm số xếp hạng lặp đi lặp lại cho đến khi hội tụ tới một tình trạng ổn địnhtoàn cục. Các điểm chính thức được xếp hạng đại diện cho việc giống nhau giữa điểm dữliệu và điểm truy vấn. Các điểm dữ liệu tương tự như các điểm truy vấn là những điểm xếphạng lớn nhất. Các đặc trưng mức thấp được sử dụng trong thuật toán đánh hạng đa tạpEMR cũng cần sử dụng một phép chuẩn hóa khi tính trọng số của từng cạnh trong đồ thịđược xây dựng bởi thuật toán đánh hạng để tăng độ chính xác của kết quả đánh hạng.Trong bài báo này chúng tôi đề xuất một phương pháp chuẩn hóa các đặc trưng mức thấpđể tăng hiệu quả của thuật toán đánh hạng đa tạp EMR, phép chuẩn hóa đề xuất thỏa mãnba tính chất sau: (i) Không yêu cầu dữ liệu đặc trưng có phân bố Gaussian.162 H. X. Trung, …, N. V. Quyền, “Một phương pháp chuẩn hóa … ảnh theo nội dung.”Nghiên cứu khoa học công nghệ (ii) Bảo toàn thứ tự của từng thành phần của vector đặc trưng. (iii) Dải biến thiên của mỗi thành phần vector đặc trưng trên đoạn [-1,1] được tối ưu hóa. Phần còn lại của bài báo được tổ chức như sau. Phần 2, một số nghiên cứu liên quan sửdụng kết hợp đặc trưng, chuẩn hoá đặc trưng. Phần 3 là đề xuất chuẩn hoá đặc trưng cảitiến của chúng tôi. Các kết quả thực nghiệm đưa ra trong phần 4. Kết luận và hướngnghiên cứu tiếp theo được trình bày trong phần 5. 2. NGHIÊN CỨU LIÊN QUAN2.1. Các đặc trưng mức thấp trong CBIR và biểu diễn đối tượng ảnh Trong CBIR, ảnh mầu hoặc ảnh đa cấp xám được biểu diễn bằng các đặc trưng mứcthấp thuộc nhiều bộ (bộ mô tả về mầu, bộ mô tả về kết cấu hoặc mô tả về hình dạng…).Về các đặc trưng trực quan được sử dụng trong CBIR xem chẳng hạn [8, 9, 10, 11, 12, 13,2, 14, 15, 16, 17 ]. Dưới đây chúng tôi liệt kê một số đặc trưng mức thấp thông dụng trongCBIR và trong bài báo này.Đặc trưng mầu (color features) Color Moments (vector đặc trưng 81 chiều): Mỗi ảnh được chia thành các vùng 3x3 vàba moment màu color mean, color variance and color skewness được tính toán cho mỗivùng trong mỗi kênh màu HSV tương ứng [11].Đặc trưng kết cấu (texture features) Gabor Wavelets Texture (vector đặc trưng ...

Tài liệu được xem nhiều: