Danh mục

Sử dụng kỹ thuật phân lớp dữ liệu để tính toán các bins màu động trong tra cứu ảnh dựa trên màu sắc

Số trang: 5      Loại file: pdf      Dung lượng: 349.73 KB      Lượt xem: 15      Lượt tải: 0    
10.10.2023

Phí lưu trữ: miễn phí Tải xuống file đầy đủ (5 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong kỹ thuật này, người ta chia không gian màu ra thành các bins. Việc chia thành các bins màu có kích thước bằng nhau và cố định dẫn đến một số hạn chế trong việc tra cứu như không tính đến tính tương đồng giữa các màu khi phân các pixel vào các bins, vấn đề về tăng giảm độ sáng ảnh.
Nội dung trích xuất từ tài liệu:
Sử dụng kỹ thuật phân lớp dữ liệu để tính toán các bins màu động trong tra cứu ảnh dựa trên màu sắcNguyễn Văn Tới và ĐtgTạp chí KHOA HỌC & CÔNG NGHỆ90(02): 49 - 53SỬ DỤNG KỸ THUẬT PHÂN LỚP DỮ LIỆU ĐỂ TÍNH TOÁNCÁC BINS MÀU ĐỘNG TRONG TRA CỨU ẢNH DỰA TRÊN MÀU SẮCNguyễn Văn Tới*, Phạm Việt Bình, Nguyễn Tiến ThànhĐH Công nghệ Thông tin & Truyền thông – ĐH Thái NguyênTÓM TẮTKỹ thuật tra cứu dựa trên màu sắc là một trong những hướng tiếp cận cơ bản trong tra cứu ảnh.Trong kỹ thuật này, người ta chia không gian màu ra thành các bins. Việc chia thành các bins màucó kích thước bằng nhau và cố định dẫn đến một số hạn chế trong việc tra cứu như không tính đếntính tương đồng giữa các màu khi phân các pixel vào các bins, vấn đề về tăng giảm độ sáng ảnh.Bài báo này trình bày một cách tính toán các bins màu mềm dẻo sử dụng kỹ thuật phân lớp dữ liệu.Chúng tôi đã thử nghiệm với thuật toán K-Means trên cơ sở dữ liệu ảnh MISC [4] và cơ sở dữ liệuảnh IFIT (Thư viện ảnh của Khoa Công nghệ thông tin-ĐH Thái Nguyên).Từ khóa: Kỹ thuật phân lớp dữ liệu, bins màu động,thuật toán K-meansGIỚI THIỆU*Cùng với sự phát triển nhanh chóng của côngnghệ phần cứng trong đó có các thiết bị thunhận ảnh, lưu trữ dữ liệu, lượng dữ liệu ảnhtrong các lĩnh vực và trong đời sống ngàycàng gia tăng. Từ thực tế trên, nhu cầu lưutrữ, quản lý và tra cứu ảnh được đặt ra. Tracứu ảnh là việc tìm kiếm từ một cơ sở dữ liệu(CSDL) ảnh ra một ảnh theo một yêu cầu nàođó. Đã có nhiều hướng tiếp cận cho việcnghiên cứu vấn đề này (xem [1]). Một trongnhững hướng tiếp cận chính đó là tra cứu ảnhdựa vào màu sắc. Kỹ thuật cơ sở tra cứu ảnhdựa trên màu sắc sẽ được giới thiệu trongphần 2. Các kỹ thuật cơ sở tra cứu ảnh dựatrên màu sắc còn một số hạn chế. Những hạnchế này được giới thiệu trong phần 3 cùng vớimột số hướng tiếp cận khắc phục của một sốtác giả. Trong bài báo này, chúng tôi đưa ramột hướng khắc phục khác cho những hạnchế của kỹ thuật cơ sở. Ý tưởng của cáchkhắc phục này là cải tiến việc tính toán cácbins màu bằng cách sử dụng kỹ thuật phânlớp dữ liệu. Ý tưởng này được trình bày trongphần 4. Việc thực nghiệm với thuật toán phânlớp dữ liệu K-Means và kết quả được trìnhbày trong phần 5. Trong phần 6, chúng tôiđưa ra một số kết luận và hướng nghiên cứutiếp theo.*Tel: 0912847077; Email: nvtoicntt@gmail.comKỸ THUẬT CƠ SỞ TRA CỨU ẢNH DỰATRÊN MÀU SẮCÝ tưởng của các kỹ thuật tra cứu ảnh trên cơsở màu là tra cứu từ CSDL ảnh những ảnh cómàu cảm nhận tương tự ảnh truy vấn hay phùhợp với mô tả của người sử dụng. Người ta đãđề xuất một số kỹ thuật khác nhau nhưng ýtưởng chủ đạo là như nhau. Mỗi ảnh trongCSDL được biểu diễn bằng ba kênh củakhông gian màu. Không gian màu hay sửdụng nhất là RGB. Mỗi kênh màu được sốhóa thành m khoảng. Như vậy, tổng số tổ hợpmàu rời rạc (gọi là bins) sẽ là n = m3. Thí dụ,nếu mỗi kênh màu được số hóa thành 16khoảng thì sẽ có 4096 bins. Biểu đồ màuH(M) là véc tơ (h1, h2, ..., hj, ..., hn), trong đóphần tử hj biểu diễn tổng số pixel trong ảnh Mrơi vào bin j (j=1,..,n). Biểu đồ màu là véc tơđặc trưng, sẽ được lưu trữ làm chỉ mục ảnh.Khi tra cứu ảnh, biểu đồ màu của ảnh truyvấn được tính toán. Sau đó, tính toán khoảngcách giữa biểu đồ màu của ảnh truy vấn vàtừng biểu đồ màu của các ảnh trong CSDLảnh. Kết quả trình diễn cho người sử dụng làk ảnh đầu tiên có khoảng cách nhỏ nhất.Đã có nhiều độ đo khoảng cách biểu đồ màugiữa hai ảnh I và H được đề xuất. Ví dụ như:+ Độ đo L-1 (thuộc nhóm Minkowski-formr=1):nd (I , J ) il  jl .l 149Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyênhttp://www.lrc-tnu.edu.vnNguyễn Văn Tới và ĐtgTạp chí KHOA HỌC & CÔNG NGHỆ90(02): 49 - 53+ Độ đo khoảng cách Euclide (L-2) thuộcnhóm Minkowski-form r=2:SỬ DỤNG KỸ THUẬT PHÂN LỚP DỮLIỆU ĐỂ TÍNH TOÁN CÁC BINS MÀUnTrong phần này, chúng tôi trình bày mộthướng tiếp cận nhằm khắc phục hạn chế thứnhất và hạn chế thứ ba nêu trên của kỹ thuậtcơ sở. Hướng tiếp cận mà chúng tôi đưa ra làcải tiến việc tính toán các bins màu bằng cáchsử dụng kỹ thuật phân lớp dữ liệu. Giả sử tamuốn chia không gian màu ra thành k bins.Thay vì chọn các điểm chia cố định và đềunhau trên các kênh màu thì chúng ta sử dụngkỹ thuật phân lớp dữ liệu để phân các pixelcủa ảnh ra thành k lớp. Khi đó mỗi lớp sẽ làmột bins. Khi phân lớp, mỗi pixel được coi làmột phần tử. Toàn bộ các pixel của ảnh làmột tập các phần tử. Chúng ta áp dụng kỹthuật phân lớp để chia tập các phần tử này rathành k lớp.d ( I , J )   il  jl  .2l 1MỘT SỐ KỸ THUẬT TĂNG CƢỜNG KỸTHUẬT CƠ SỞ ĐÃ ĐƢỢC ĐỀ XUẤTKỹ thuật tra cứu ảnh trên cơ sở màu cơ bản cónhiều hạn chế. Trong phần này chúng tôi giớithiệu một số hạn chế và cách khắc phục đãđược đề xuất.• Hạn chế thứ nhất của kỹ thuật cơ sở làkhông sử dụng tính tương đồng giữa các màu.Khi đó, hai ảnh với màu cảm nhận tươngđồng nhưng không có màu chung thì khoảngcách của chúng sẽ lớn, có thể là cực đại. Điềunày xảy ra ...

Tài liệu được xem nhiều: