Tóm tắt luận văn Thạc sĩ: Kết hợp so khớp Spatial Pyramid và vecto hỗ trợ SVM trong nhận dạng khung cảnh tự nhiên
Số trang: 14
Loại file: pdf
Dung lượng: 1.46 MB
Lượt xem: 5
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Đề tài nghiên cứu và phân tích xây dựng phần mềm nhận dạng khung cảnh tự nhiên Nội dung chính của luận văn được tổ chức thành 3 chương. Chương 1 Tổng quan giới thiệu bài toán nhận dạng ảnh,các hướng tiếp cận bài toán, mô hình chung của hệ thống nhận dạng và một số ứng dụng của nhận dạng,...
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Kết hợp so khớp Spatial Pyramid và vecto hỗ trợ SVM trong nhận dạng khung cảnh tự nhiên 1 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG ---------------------------------------- NGUYỄN THỊ NGỌC HÀ KẾT HỢP SO KHỚP SPATIAL PYRAMIDVÀ VECTO HỖ TRỢ SVM TRONG NHẬN DẠNG KHUNG CẢNH TỰ NHIÊN Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Người hướng dẫn khoa học: PGS. TS TỪ MINH PHƯƠNG TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2012 2 MỞ ĐẦU Với sự bùng nổ của dữ liệu ảnh, việc nhận dạng ảnh theo cáclớp ngữ nghĩa là một trong những nhu cầu cơ bản cho việc quản lývà truy vấn ảnh dựa trên nội dung. Thêm nữa, nhận dạng ảnh là mộttrong những bài toán cơ bản trong lĩnh vực thị giác máy tính và ứngdụng máy học đã nhận được sự quan tâm của nhiều nhà khoa học trênthế giới. Bài toán nhận dạng ảnh có rất nhiều thách thức từ việc ảnhđược chụp dưới nhiều góc độ khác nhau, điều kiện chiếu sáng khácnhau, sự đa dạng các thể hiện của cùng một lớp ngữ nghĩa cũng nhưsự phức tạp của thông tin nền trong ảnh. Để giải quyết bài toán nhậndạng ảnh có 4 hướng tiếp cận, đó là so khớp mẫu, nhận dạng thốngkê, nhận dạng dựa vào cấu trúc và nhận dạng theo mạng nơron.Trong đó, hướng tiếp cận dựa trên so khớp mẫu được áp dụng rộngrãi và mang lại kết quả cao trong bài toán nhận dạng ảnh nói riêng vàtrong thị giác máy tính nói chung. Biểu diễn một ví dụ đơn lẻ bằng tập các đặc trưng cục bộhoặc các bộ phận bao gồm nó thường rất hữu ích. Ví dụ, trong thịgiác máy tính, một hình ảnh có thể được mô tả bởi các đặc trưng cụcbộ được trích chọn từ các điểm hấp dẫn “nhô ra” (salient interestpoints) của ảnh. Tương tự như vậy trong xử lý ngôn ngữ tự nhiên, cáctài liệu và chủ đề được đặc trưng bởi túi các từ (bag of words). Tuynhiên, việc đánh giá độ giống nhau giữa các mẫu theo phương phápnày là một thách thức khi tập các đặc trưng gồm nhiều yếu tố, cácyếu tố không có thứ tự. Để so sánh tập các đặc trưng này, các nhànghiên cứu thường cố gắng sử dụng những giải pháp phù hợp tốn ít 3chi phí nhất, tuy nhiên đây lại là những tính toán tốn kém và trở nênkhông khả thi khi tập này có kích thước lớn. Những phương pháptrước đây nhận đầu vào là các véctơ với mỗi chiều tương ứng là mộtđặc trưng toàn cục riêng biệt. Nhược điểm của những phương phápnày là không tính tới vị trí tương đối của các đặc trưng, giải quyết vớinhững đặc trưng tương ứng rõ ràng, điều này làm cho việc tính toántốn kém, hạn chế việc sử dụng những đầu vào có phạm vi lớn; Do đóđể cải thiện những nhược điểm này Kristen Grauman và TrevorDarrell đã phát triển phương pháp so khớp phân cấp (PyramidMatching – viết tắt là PM) – một hàm so khớp thời gian tuyến tínhmới thông qua tập các đặc trưng không có thứ tự. Mặc dù vậyphương pháp này vẫn còn nhược điểm đó là bỏ qua thông tin vềkhông gian của bức ảnh; một phương pháp mới ra đời nhằm giảiquyết nhược điểm trên đó là phương pháp so khớp không gian phâncấp (Spatial Pyramid Matching – SPM). Với những lý do nêu trên tôi đã lựa chọn đề tài: “Kết hợp sokhớp spatial pyramid và máy véctơ hỗ trợ SVM trong nhận dạngkhung cảnh tự nhiên” - Mục đích nghiên cứu: Nghiên cứu trích chọn đặc trưng cục bộ bất biến (Scale Invariant Feature Transform – SIFT) Tìm hiểu phương pháp SPM Nghiên cứu phương pháp học máy SVM Xây dựng chương trình demo từ những nghiên cứu và tìm hiểu nói trên. - Đối tượng và phạm vi nghiên cứu: 4 25 Trích chọn đặc trưng SIFT: đây là giải thuật do David KẾT LUẬN VÀ KIẾN NGHỊ G.Lowe đưa ra từ năm 2004. Phương pháp SPM: đây là phát triển từ phương pháp PM Kết luận do Kristen Grauman và Trevor Darrell phát triển. Luận văn định hướng nội dung nghiên cứu vào phương pháp Phương pháp học máy SVM: SVM là một kỹ thuật mới SPM, mô hình kết hợp SPM và phương pháp học máy SVM và ứng và có nhiều triển vọng, được phát triển bởi Vapnik và các dụng vào bài toán nhận dạng khung cảnh tự nhiên. đồng sự tại AT&T Bell Labs. Từ những nghiên cứu trên đây, tôi thấy phương pháp SPM Dựa vào nghiên cứu, phân tích xây dựng phần mềm nhận ...
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Kết hợp so khớp Spatial Pyramid và vecto hỗ trợ SVM trong nhận dạng khung cảnh tự nhiên 1 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG ---------------------------------------- NGUYỄN THỊ NGỌC HÀ KẾT HỢP SO KHỚP SPATIAL PYRAMIDVÀ VECTO HỖ TRỢ SVM TRONG NHẬN DẠNG KHUNG CẢNH TỰ NHIÊN Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Người hướng dẫn khoa học: PGS. TS TỪ MINH PHƯƠNG TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2012 2 MỞ ĐẦU Với sự bùng nổ của dữ liệu ảnh, việc nhận dạng ảnh theo cáclớp ngữ nghĩa là một trong những nhu cầu cơ bản cho việc quản lývà truy vấn ảnh dựa trên nội dung. Thêm nữa, nhận dạng ảnh là mộttrong những bài toán cơ bản trong lĩnh vực thị giác máy tính và ứngdụng máy học đã nhận được sự quan tâm của nhiều nhà khoa học trênthế giới. Bài toán nhận dạng ảnh có rất nhiều thách thức từ việc ảnhđược chụp dưới nhiều góc độ khác nhau, điều kiện chiếu sáng khácnhau, sự đa dạng các thể hiện của cùng một lớp ngữ nghĩa cũng nhưsự phức tạp của thông tin nền trong ảnh. Để giải quyết bài toán nhậndạng ảnh có 4 hướng tiếp cận, đó là so khớp mẫu, nhận dạng thốngkê, nhận dạng dựa vào cấu trúc và nhận dạng theo mạng nơron.Trong đó, hướng tiếp cận dựa trên so khớp mẫu được áp dụng rộngrãi và mang lại kết quả cao trong bài toán nhận dạng ảnh nói riêng vàtrong thị giác máy tính nói chung. Biểu diễn một ví dụ đơn lẻ bằng tập các đặc trưng cục bộhoặc các bộ phận bao gồm nó thường rất hữu ích. Ví dụ, trong thịgiác máy tính, một hình ảnh có thể được mô tả bởi các đặc trưng cụcbộ được trích chọn từ các điểm hấp dẫn “nhô ra” (salient interestpoints) của ảnh. Tương tự như vậy trong xử lý ngôn ngữ tự nhiên, cáctài liệu và chủ đề được đặc trưng bởi túi các từ (bag of words). Tuynhiên, việc đánh giá độ giống nhau giữa các mẫu theo phương phápnày là một thách thức khi tập các đặc trưng gồm nhiều yếu tố, cácyếu tố không có thứ tự. Để so sánh tập các đặc trưng này, các nhànghiên cứu thường cố gắng sử dụng những giải pháp phù hợp tốn ít 3chi phí nhất, tuy nhiên đây lại là những tính toán tốn kém và trở nênkhông khả thi khi tập này có kích thước lớn. Những phương pháptrước đây nhận đầu vào là các véctơ với mỗi chiều tương ứng là mộtđặc trưng toàn cục riêng biệt. Nhược điểm của những phương phápnày là không tính tới vị trí tương đối của các đặc trưng, giải quyết vớinhững đặc trưng tương ứng rõ ràng, điều này làm cho việc tính toántốn kém, hạn chế việc sử dụng những đầu vào có phạm vi lớn; Do đóđể cải thiện những nhược điểm này Kristen Grauman và TrevorDarrell đã phát triển phương pháp so khớp phân cấp (PyramidMatching – viết tắt là PM) – một hàm so khớp thời gian tuyến tínhmới thông qua tập các đặc trưng không có thứ tự. Mặc dù vậyphương pháp này vẫn còn nhược điểm đó là bỏ qua thông tin vềkhông gian của bức ảnh; một phương pháp mới ra đời nhằm giảiquyết nhược điểm trên đó là phương pháp so khớp không gian phâncấp (Spatial Pyramid Matching – SPM). Với những lý do nêu trên tôi đã lựa chọn đề tài: “Kết hợp sokhớp spatial pyramid và máy véctơ hỗ trợ SVM trong nhận dạngkhung cảnh tự nhiên” - Mục đích nghiên cứu: Nghiên cứu trích chọn đặc trưng cục bộ bất biến (Scale Invariant Feature Transform – SIFT) Tìm hiểu phương pháp SPM Nghiên cứu phương pháp học máy SVM Xây dựng chương trình demo từ những nghiên cứu và tìm hiểu nói trên. - Đối tượng và phạm vi nghiên cứu: 4 25 Trích chọn đặc trưng SIFT: đây là giải thuật do David KẾT LUẬN VÀ KIẾN NGHỊ G.Lowe đưa ra từ năm 2004. Phương pháp SPM: đây là phát triển từ phương pháp PM Kết luận do Kristen Grauman và Trevor Darrell phát triển. Luận văn định hướng nội dung nghiên cứu vào phương pháp Phương pháp học máy SVM: SVM là một kỹ thuật mới SPM, mô hình kết hợp SPM và phương pháp học máy SVM và ứng và có nhiều triển vọng, được phát triển bởi Vapnik và các dụng vào bài toán nhận dạng khung cảnh tự nhiên. đồng sự tại AT&T Bell Labs. Từ những nghiên cứu trên đây, tôi thấy phương pháp SPM Dựa vào nghiên cứu, phân tích xây dựng phần mềm nhận ...
Tìm kiếm theo từ khóa liên quan:
Luận văn thạc sĩ Tóm tắt luận văn thạc sĩ Khoa học máy tính Luận văn khoa học máy tính Bài toán nhận dạng khung ảnh tự nhiên Kết hợp so khớp spatial pyramidGợi ý tài liệu liên quan:
-
30 trang 556 0 0
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 476 1 0 -
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 378 6 0 -
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 365 5 0 -
97 trang 329 0 0
-
97 trang 311 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 302 0 0 -
26 trang 288 0 0
-
155 trang 280 0 0
-
26 trang 276 0 0