Bài viết trình bày việc thực hiện một phương pháp phân lớp đối tượng theo tiếp cận KD-Tree và áp dụng cho bài toán tìm kiếm ảnh theo ngữ nghĩa. Cấu trúc KD-Tree được xây dựng nhằm phân lớp cho một đối tượng đầu vào dưới dạng véctơ đặc trưng.
Nội dung trích xuất từ tài liệu:
Một phương pháp phân lớp trên cấu trúc KD-Tree cho bài toán tìm kiếm ảnh theo ngữ nghĩa
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), TP. HCM, ngày 23-24/12/2021
DOI: 10.15625/vap.2021.0075
MỘT PHƯƠNG PHÁP PHÂN LỚP TRÊN CẤU TRÚC KD-TREE
CHO BÀI TOÁN TÌM KIẾM ẢNH THEO NGỮ NGHĨA
Nguyễn Thị Định1,3, Văn Thế Thành2, Lê Mạnh Thạnh3*
1
Khoa Công nghệ thông tin, Trường ĐH Công nghiệp thực phẩm TP. Hồ Chí Minh
2
Phòng Quản lý khoa học và đào tạo sau Đại học, Trường ĐH Công nghiệp thực phẩm TP. Hồ Chí Minh
3
Trường Đại học Khoa học, Đại học Huế
{dinhnt, thanhvt}@hufi.edu.vn, 3lmthanh@hueuni.edu.vn
TÓM TẮT: Trong bài báo này, chúng tôi thực hiện một phương pháp phân lớp đối tượng theo tiếp cận KD-Tree và áp dụng
cho bài toán tìm kiếm ảnh theo ngữ nghĩa. Cấu trúc KD-Tree được xây dựng nhằm phân lớp cho một đối tượng đầu vào dưới dạng
véctơ đặc trưng. Vì vậy, thuật toán xây dựng cây và phương pháp phân lớp đối tượng dựa trên cấu trúc KD-Tree được đề xuất. Sau
đó, chúng tôi thực hiện phân lớp cho mỗi hình ảnh đầu vào, đồng thời tìm tập ảnh tương tự theo ngữ nghĩa. Mỗi ảnh truy vấn được
trích xuất véctơ đặc trưng nhằm thực hiện phân lớp trên cấu trúc KD-Tree và tạo câu truy vấn SPARQL để thực hiện tìm kiếm tập
ảnh tương tự theo ngữ nghĩa dựa trên Ontology. Trên cơ sở này, chúng tôi đề xuất mô hình tìm kiếm ảnh theo ngữ nghĩa và thực
nghiệm trên bộ ảnh COREL, Wang, Image CLEF với độ chính xác lần lượt là 79,98%, 78,10%, 70,16%. Theo kết quả thực nghiệm,
phương pháp đề xuất của chúng tôi được so sánh với các công trình được công bố gần đây, đánh giá tính hiệu quả và áp dụng được
trong các hệ tìm kiếm dữ liệu đa phương tiện.
Từ khóa: KD-Tree, image classification, image retrieval, similar image, Ontology.
I. GIỚI THIỆU
Phân lớp đối tượng là bài toán được ứng dụng trong nhiều lĩnh vực như nhận dạng mẫu, nhận dạng ký tự, phân loại
khách hàng, dự đoán thị trường chứng khoán, phát hiện thư Spam, chẩn đoán y khoa, v.v. giúp con người đưa ra quyết
định với từng đối tượng dựa trên các đặc trưng mô tả. Để thực hiện bài toán phân lớp cần xây dựng một mô hình (Model)
để phân loại cho một đối tượng đầu vào. Hiện nay, có nhiều phương pháp phân lớp đối tượng được sử dụng như phương
pháp tìm kiếm láng giềng gần nhất k-NN (k - Nearest Neighbors) [1, 2], thuật toán SVM (Support Véctơ Machine) [3],
thuật toán Navie Bayes [4, 6], cây quyết định (Decision Tree) [5],... đã có những kết quả khả quan. Trong bài báo này,
chúng tôi thực hiện một phương pháp phân lớp đối tượng dựa trên cấu trúc KD-Tree (k - Dimensional Tree) được đánh giá
là hiệu quả.
Theo thống kê của tập đoàn dữ liệu quốc tế IDC (International Data Group) [7] dữ liệu ảnh số tăng lên theo cấp số
nhân trong mỗi giây, điều này cho thấy sự cần thiết phải phân loại đối tượng bằng hình ảnh nhằm tăng khả năng tiếp cận
và xử lý thông tin. Ảnh số ngày càng gia tăng theo số lượng, điều này đã mang lại cơ hội và thách thức cho lĩnh vực tra
cứu ảnh. Bài toán tìm kiếm ảnh tương tự theo ngữ nghĩa là một trong những bài toán quan trọng của nhiều hệ tra cứu dữ
liệu đa phương tiện được nhiều nhóm nghiên cứu quan tâm. Trong cách tiếp cận của chúng tôi, một phương pháp phân lớp
dữ liệu hình ảnh dựa trên cấu trúc KD-Tree nhằm tạo ra một quá trình phân lớp theo mô hình cây; kết quả phân lớp được
ứng dụng cho bài toán tìm kiếm ảnh tương tự theo ngữ nghĩa dựa trên Ontology.
Đóng góp của bài báo gồm: (1) Đề xuất một phương pháp phân lớp dữ liệu dựa trên cấu trúc KD-Tree; (2) Đề xuất
các thuật toán xây dựng cấu trúc KD-Tree đa nhánh cân bằng, thuật toán gán nhãn cho nút lá, thuật toán huấn luyện trọng
số và thuật toán tìm kiếm tập ảnh tương tự dựa trên cấu trúc KD-Tree; (3) Đề xuất mô hình tìm kiếm ảnh theo ngữ nghĩa
dựa trên cấu trúc KD-Tree và Ontology; (4) Xây dựng thực nghiệm và chứng minh tính đúng đắn của phương pháp đề
xuất dựa trên các bộ dữ liệu ảnh COREL [8], Wang [9], Image CLEF [10].
Phần còn lại của bài báo gồm: Phần II, khảo sát và phân tích ưu nhược điểm của một số công trình liên quan để
minh chứng tính khả thi cho bài toán phân lớp dữ liệu dựa trên cấu trúc KD-Tree và tìm kiếm ảnh theo ngữ nghĩa; phần
III, trình bày thuật toán xây dựng cấu trúc KD-Tree đa nhánh cân bằng, thuật toán gán nhãn nút lá, thuật toán huấn luyện
trọng số cho mô hình phân lớp KD-Tree và thuật toán tìm kiếm tập ảnh tương tự dựa trên cấu trúc KD-Tree; Phần IV trình
bày mô hình tìm kiếm ảnh theo ngữ nghĩa dựa trên cấu trúc KD-Tree kết hợp Ontology; Phần V, trình bày kết quả thực
nghiệm được đánh giá trên bộ dữ liệu ảnh; Phần VI là kết luận và hướng phát triển tiếp theo.
II. CÁC CÔNG TRÌNH LIÊN QUAN
Phân lớp đối tượng bằng hình ảnh để áp dụng cho bài toán tìm kiếm ảnh được nhiều công trình công bố dựa trên
các kỹ thuật học máy như: sử dụng cấu trúc cây quyết định (Decision Tree) để phân loại cá ngừ đại dương bằng hình
ảnh [5]; sử dụng kỹ thuật phân lớp bằng Naïve Bayes [4, 6] để phân loại bạch hầu một cách tự động; nhận diện khuôn
mặt bằng cấu trúc KD-Tree kết hợp với thuật toán k-NN [11],... và nhiều công trình khác, cụ thể như sau:
Wijayanti Nurul Khotimah và cộng sự (2015) [5] đã thực hiện một phương pháp phân loại cá ngừ đại dương
bằng thuật toán cây quyết định (Decision Tree) dựa trên đặc trưng hình ảnh được trích xuất như kết cấu (độ tương
phản, sự tương quan, tính đồng nhất,...), hình dạng như tỷ lệ giữa diện tích đầu và diện tích hình tròn, tỷ lệ hình tròn
của đầu cá ngừ. Kết quả thực nghiệm đánh giá trên 60 mẫu ảnh cá ngừ loại mắt to, vây vàng và cá vằn. Kết quả đánh
328 MỘT PHƯ ...