![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Kết hợp kỹ thuật gom nhóm và phản hồi tương đồng trong tìm kiếm ảnh
Số trang: 9
Loại file: pdf
Dung lượng: 701.16 KB
Lượt xem: 13
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tìm kiếm ảnh là lĩnh vực đang nhận được rất nhiều sự quan tâm của cộng đồng khoa học máy tính, xu hướng nghiên cứu hiện nay là kết hợp các thuật toán và các phương pháp trích đặc trưng dữ liệu để làm tăng hiệu quả tìm kiếm. Nghiên cứu đề xuất sử dụng kết hợp kỹ thuật gom nhóm để lấy phản hồi tương đồng, với đặc trưng ảnh là đặc trưng cục bộ và đặc trưng văn bản.
Nội dung trích xuất từ tài liệu:
Kết hợp kỹ thuật gom nhóm và phản hồi tương đồng trong tìm kiếm ảnh Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Huế, ngày 07-08/6/2019 DOI: 10.15625/vap.2019.00029 KẾT HỢP KỸ THUẬT GOM NHÓM VÀ PHẢN HỒI TƯƠNG ĐỒNG TRONG TÌM KIẾM ẢNH Nguyễn Tí Hon1, Hà Thị Phƣơng Anh2, Phạm Thế Phi3 1 Khoa Phát triển Nông thôn, Trƣờng Đại học Cần Thơ 2 Khoa Công nghệ thông tin, Trƣờng Đại học Bạc Liêu 3 Khoa Công nghệ thông tin và Truyền thông, Trƣờng Đại học Cần Thơ nthon@ctu.edu.vn, htpanh52@gmail.com, ptphi@cit.ctu.edu.vn TÓM TẮT: Tìm kiếm ảnh là lĩnh vực đang nhận được rất nhiều sự quan tâm của cộng đồng khoa học máy tính, xu hướng nghiên cứu hiện nay là kết hợp các thuật toán và các phương pháp trích đặc trưng dữ liệu để làm tăng hiệu quả tìm kiếm. Một trong những phương pháp được sử dụng hiệu quả đó là kỹ thuật phản hồi tương đồng để con người xác định một ảnh kết quả là phù hợp hoặc không phù hợp với ảnh truy vấn thông qua đó điều chỉnh truy vấn gốc sao cho gần hơn các kết quả cần tìm. Bên cạnh đó, người ta còn sử dụng kỹ thuật gom nhóm để làm tăng hiệu quả lấy phản hồi, thay vì mỗi lần phản hồi, người dùng chỉ chọn một ảnh thì với phương pháp này, người dùng sẽ chọn một nhóm ảnh, tất cả ảnh trong nhóm sẽ được coi là tương đồng hoặc không tương đồng. Trong tìm kiếm ảnh, đặc trưng cục bộ thường xuyên được sử dụng bởi vì đặc trưng này phù hợp để xác định các đối tượng bên trong ảnh, đồng thời không bị ảnh hưởng bởi kích thước, góc quay và độ sáng của hình ảnh cũng như các đối tượng trong ảnh. Ngoài ra, ảnh trên internet thường được kèm theo những ghi chú hoặc mô tả ngắn (gọi chung là mô tả), có giá trị rất lớn trong việc thể hiện nội dung bên trong bức ảnh. Sử dụng đồng thời đặc trưng ảnh và đặc trưng văn bản là một hướng tiếp cận mới và đã được chứng minh hiệu quả trong các nghiên cứu về máy học. Từ thực tế đó, nghiên cứu đề xuất sử dụng kết hợp kỹ thuật gom nhóm để lấy phản hồi tương đồng, với đặc trưng ảnh là đặc trưng cục bộ và đặc trưng văn bản. Nghiên cứu được cài đặt và đánh giá trên tập dữ liệu “Di sản văn hoá phi vật thể khu vực Đồng bằng sông Cửu Long” được thu thập tự động từ internet bằng công cụ Web crawler, kết quả thực nghiệm cho thấy phương pháp được đề xuất đã mang lại hiệu quả tốt trong việc nâng cao hiệu quả phản hồi cũng như kết quả tìm kiếm. Từ khóa: Tìm kiếm ảnh, phân loại ảnh, gom cụm, phản hồi tương đồng, kết hợp đặc trưng. I. GIỚI THIỆU Truy hồi ảnh là một trong những lĩnh vực quan trọng của ngành khoa học máy tính đã đƣợc chú trọng từ thập niên 90 của thế kỷ XX [7, 14]. Truy hồi ảnh không chỉ cần thiết cho các ứng dụng liên quan đến an ninh quốc phòng, y tế, khoa học và giáo dục mà còn cần thiết cho nhu cầu giải trí hàng ngày của con ngƣời [10]. Hiện tại có rất nhiều hệ thống truy hồi ảnh đƣợc phát triển và sử dụng, các phƣơng thức thực hiện cũng hết sức đa dạng nhƣ nhập từ khoá, sử dụng hình ảnh để tìm kiếm. Hầu hết kết quả trả về là một danh sách các hình ảnh đƣợc sắp xếp dựa trên một tiêu chuẩn nhất định, chẳng hạn nhƣ hình ảnh giống với hình ảnh cần tìm nhất đƣợc xếp trƣớc tiên. Vấn đề đặt ra là tiêu chuẩn để sắp xếp kết quả trả về cho ngƣời dùng, đôi khi hình ảnh ngƣời dùng thật sự cần không nằm ở đầu danh sách kết quả, ngƣời dùng có thể phải xem đến trang kết quả thứ hai hoặc thứ ba mới thấy hình ảnh cần thiết. Trong khi đó tâm lý chung của ngƣời dùng khi tìm kiếm là thƣờng chỉ xem khoảng 10 kết quả đầu, ít khi xem đến trang kết quả thứ hai. Hƣớng giải quyết vấn đề này rất đa dạng [1], trong đó nổi bật là kỹ thuật lấy phản hồi tƣơng đồng từ phía ngƣời dùng và mở rộng truy vấn. Có rất nhiều phƣơng pháp để tăng hiệu quả lấy phản hồi tƣơng đồng, tiêu biểu là kỹ thuật gom nhóm kết quả trả về trƣớc khi hiển thị cho ngƣời dùng phản hồi [8, 9, 12]. Bên cạnh đó, trong bài toán phân loại ảnh (có liên quan mật thiết với bài toán tìm kiếm ảnh vì cùng dựa trên cơ sở đặc trƣng ảnh) việc kết hợp các loại đặc trƣng để tăng hiệu quả cũng đƣợc chú trọng, bởi vì hình ảnh trên internet thƣờng kèm theo các văn bản ngắn mô tả nội dung bên trong hình ảnh [10, 17]. Nội dung của nghiên cứu là tập trung vào sử dụng kỹ thuật gom nhóm hình ảnh để lấy phản hồi tƣơng đồng từ phía ngƣời dùng. Đồng thời sử dụng hai loại đặc trƣng của hình ảnh là: đặc trƣng ảnh (kiểu dáng các đối tƣợng trong ảnh) và đặc trƣng văn bản (mô tả đi kèm theo ảnh). Hƣớng tới làm tăng hiệu quả phản hồi tƣơng đồng và kết quả tìm kiếm, góp phần khẳng định giá trị đặc trƣng văn bản trên tập dữ liệu thực nghiệm. II. CÁC NGHIÊN CỨU LIÊN QUAN Phản hồi tƣơng đồng là phƣơng pháp dựa trên sự xác nhận của ngƣời dùng về một hoặc nhiều kết quả tìm kiếm, từ đó điều chỉnh lại truy vấn ban đầu (truy vấn gốc) để nâng cao hiệu quả tìm kiếm. Trong nghiên cứu “Evaluating Document Clustering for Interactive Information Retrieval” [12] tác giả Anton Leuski đã đƣa sử dụng phƣơng pháp gom nhóm tài liệu để lấy phản hồi tƣơng đồng từ phía ngƣời dùng. Đồng thời tác giả cũng khẳng định việc lấy phản hồi trên nhóm và mở rộng truy vấn mang lại hiệu quả cao hơn so với phƣơng pháp tổ chức kết quả bằng danh sách tài liệu đã đƣợc sắp xếp. Ở một khía cạnh khác, trong nghiên cứu “Cluster-Based Retrieval of Images by Unsupervised Learning” [9], nhóm tác giả Yixin Chen, James Z. Wang và Robert Krovetz sử dụng kỹ thuật gom nhóm (Hierarchical Clustering) để 226 KẾT HỢP KỸ THUẬT GOM NHÓM VÀ PHẢN HỒI TƢƠNG ĐỒNG TRONG TÌM KIẾM ẢNH gom nhóm ảnh và lấy phản hồi tƣơng đồng trên nhóm sau đó mở rộng truy vấn dựa trên kết quả ...
Nội dung trích xuất từ tài liệu:
Kết hợp kỹ thuật gom nhóm và phản hồi tương đồng trong tìm kiếm ảnh Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Huế, ngày 07-08/6/2019 DOI: 10.15625/vap.2019.00029 KẾT HỢP KỸ THUẬT GOM NHÓM VÀ PHẢN HỒI TƯƠNG ĐỒNG TRONG TÌM KIẾM ẢNH Nguyễn Tí Hon1, Hà Thị Phƣơng Anh2, Phạm Thế Phi3 1 Khoa Phát triển Nông thôn, Trƣờng Đại học Cần Thơ 2 Khoa Công nghệ thông tin, Trƣờng Đại học Bạc Liêu 3 Khoa Công nghệ thông tin và Truyền thông, Trƣờng Đại học Cần Thơ nthon@ctu.edu.vn, htpanh52@gmail.com, ptphi@cit.ctu.edu.vn TÓM TẮT: Tìm kiếm ảnh là lĩnh vực đang nhận được rất nhiều sự quan tâm của cộng đồng khoa học máy tính, xu hướng nghiên cứu hiện nay là kết hợp các thuật toán và các phương pháp trích đặc trưng dữ liệu để làm tăng hiệu quả tìm kiếm. Một trong những phương pháp được sử dụng hiệu quả đó là kỹ thuật phản hồi tương đồng để con người xác định một ảnh kết quả là phù hợp hoặc không phù hợp với ảnh truy vấn thông qua đó điều chỉnh truy vấn gốc sao cho gần hơn các kết quả cần tìm. Bên cạnh đó, người ta còn sử dụng kỹ thuật gom nhóm để làm tăng hiệu quả lấy phản hồi, thay vì mỗi lần phản hồi, người dùng chỉ chọn một ảnh thì với phương pháp này, người dùng sẽ chọn một nhóm ảnh, tất cả ảnh trong nhóm sẽ được coi là tương đồng hoặc không tương đồng. Trong tìm kiếm ảnh, đặc trưng cục bộ thường xuyên được sử dụng bởi vì đặc trưng này phù hợp để xác định các đối tượng bên trong ảnh, đồng thời không bị ảnh hưởng bởi kích thước, góc quay và độ sáng của hình ảnh cũng như các đối tượng trong ảnh. Ngoài ra, ảnh trên internet thường được kèm theo những ghi chú hoặc mô tả ngắn (gọi chung là mô tả), có giá trị rất lớn trong việc thể hiện nội dung bên trong bức ảnh. Sử dụng đồng thời đặc trưng ảnh và đặc trưng văn bản là một hướng tiếp cận mới và đã được chứng minh hiệu quả trong các nghiên cứu về máy học. Từ thực tế đó, nghiên cứu đề xuất sử dụng kết hợp kỹ thuật gom nhóm để lấy phản hồi tương đồng, với đặc trưng ảnh là đặc trưng cục bộ và đặc trưng văn bản. Nghiên cứu được cài đặt và đánh giá trên tập dữ liệu “Di sản văn hoá phi vật thể khu vực Đồng bằng sông Cửu Long” được thu thập tự động từ internet bằng công cụ Web crawler, kết quả thực nghiệm cho thấy phương pháp được đề xuất đã mang lại hiệu quả tốt trong việc nâng cao hiệu quả phản hồi cũng như kết quả tìm kiếm. Từ khóa: Tìm kiếm ảnh, phân loại ảnh, gom cụm, phản hồi tương đồng, kết hợp đặc trưng. I. GIỚI THIỆU Truy hồi ảnh là một trong những lĩnh vực quan trọng của ngành khoa học máy tính đã đƣợc chú trọng từ thập niên 90 của thế kỷ XX [7, 14]. Truy hồi ảnh không chỉ cần thiết cho các ứng dụng liên quan đến an ninh quốc phòng, y tế, khoa học và giáo dục mà còn cần thiết cho nhu cầu giải trí hàng ngày của con ngƣời [10]. Hiện tại có rất nhiều hệ thống truy hồi ảnh đƣợc phát triển và sử dụng, các phƣơng thức thực hiện cũng hết sức đa dạng nhƣ nhập từ khoá, sử dụng hình ảnh để tìm kiếm. Hầu hết kết quả trả về là một danh sách các hình ảnh đƣợc sắp xếp dựa trên một tiêu chuẩn nhất định, chẳng hạn nhƣ hình ảnh giống với hình ảnh cần tìm nhất đƣợc xếp trƣớc tiên. Vấn đề đặt ra là tiêu chuẩn để sắp xếp kết quả trả về cho ngƣời dùng, đôi khi hình ảnh ngƣời dùng thật sự cần không nằm ở đầu danh sách kết quả, ngƣời dùng có thể phải xem đến trang kết quả thứ hai hoặc thứ ba mới thấy hình ảnh cần thiết. Trong khi đó tâm lý chung của ngƣời dùng khi tìm kiếm là thƣờng chỉ xem khoảng 10 kết quả đầu, ít khi xem đến trang kết quả thứ hai. Hƣớng giải quyết vấn đề này rất đa dạng [1], trong đó nổi bật là kỹ thuật lấy phản hồi tƣơng đồng từ phía ngƣời dùng và mở rộng truy vấn. Có rất nhiều phƣơng pháp để tăng hiệu quả lấy phản hồi tƣơng đồng, tiêu biểu là kỹ thuật gom nhóm kết quả trả về trƣớc khi hiển thị cho ngƣời dùng phản hồi [8, 9, 12]. Bên cạnh đó, trong bài toán phân loại ảnh (có liên quan mật thiết với bài toán tìm kiếm ảnh vì cùng dựa trên cơ sở đặc trƣng ảnh) việc kết hợp các loại đặc trƣng để tăng hiệu quả cũng đƣợc chú trọng, bởi vì hình ảnh trên internet thƣờng kèm theo các văn bản ngắn mô tả nội dung bên trong hình ảnh [10, 17]. Nội dung của nghiên cứu là tập trung vào sử dụng kỹ thuật gom nhóm hình ảnh để lấy phản hồi tƣơng đồng từ phía ngƣời dùng. Đồng thời sử dụng hai loại đặc trƣng của hình ảnh là: đặc trƣng ảnh (kiểu dáng các đối tƣợng trong ảnh) và đặc trƣng văn bản (mô tả đi kèm theo ảnh). Hƣớng tới làm tăng hiệu quả phản hồi tƣơng đồng và kết quả tìm kiếm, góp phần khẳng định giá trị đặc trƣng văn bản trên tập dữ liệu thực nghiệm. II. CÁC NGHIÊN CỨU LIÊN QUAN Phản hồi tƣơng đồng là phƣơng pháp dựa trên sự xác nhận của ngƣời dùng về một hoặc nhiều kết quả tìm kiếm, từ đó điều chỉnh lại truy vấn ban đầu (truy vấn gốc) để nâng cao hiệu quả tìm kiếm. Trong nghiên cứu “Evaluating Document Clustering for Interactive Information Retrieval” [12] tác giả Anton Leuski đã đƣa sử dụng phƣơng pháp gom nhóm tài liệu để lấy phản hồi tƣơng đồng từ phía ngƣời dùng. Đồng thời tác giả cũng khẳng định việc lấy phản hồi trên nhóm và mở rộng truy vấn mang lại hiệu quả cao hơn so với phƣơng pháp tổ chức kết quả bằng danh sách tài liệu đã đƣợc sắp xếp. Ở một khía cạnh khác, trong nghiên cứu “Cluster-Based Retrieval of Images by Unsupervised Learning” [9], nhóm tác giả Yixin Chen, James Z. Wang và Robert Krovetz sử dụng kỹ thuật gom nhóm (Hierarchical Clustering) để 226 KẾT HỢP KỸ THUẬT GOM NHÓM VÀ PHẢN HỒI TƢƠNG ĐỒNG TRONG TÌM KIẾM ẢNH gom nhóm ảnh và lấy phản hồi tƣơng đồng trên nhóm sau đó mở rộng truy vấn dựa trên kết quả ...
Tìm kiếm theo từ khóa liên quan:
Phân loại ảnh Kỹ thuật gom nhóm Phương pháp trích đặc trưng dữ liệu Bài toán phân loại ảnh Đặc trưng SIFT Đặc điểm của văn bản Tiếng ViệtTài liệu liên quan:
-
75 trang 70 0 0
-
8 trang 35 0 0
-
Bài tập cá nhân học phần: GIS và viễn thám ứng dụng
17 trang 26 0 0 -
Khả năng ứng dụng phân loại bề mặt lớp phủ bằng thuật toán Support Vector Machine
8 trang 25 0 0 -
Bài giảng Xử lý ảnh số: Chương 2 - TS. Ngô Quốc Việt
60 trang 23 0 0 -
Bài giảng Viễn thám ứng dụng: Chương 2&3 - Phạm Thế Hùng
40 trang 22 0 0 -
Mô hình CNN nhẹ cho bài toán phân loại sâu bệnh trên lúa
5 trang 19 0 0 -
Bài giảng Địa tin học - Phân loại ảnh: Phi giám định và ma trận đánh giá sai số
20 trang 18 0 0 -
Luận văn Thạc sĩ Khoa học máy tính: Phân loại ảnh dựa trên hướng tiếp cận Kernel
61 trang 18 0 0 -
Một thuật toán thủy vân ảnh số mạnh dựa trên DWT, DCT, SVD và đặc trưng SIFT
8 trang 18 0 0