Danh mục

Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ

Số trang: 139      Loại file: pdf      Dung lượng: 5.70 MB      Lượt xem: 14      Lượt tải: 0    
tailieu_vip

Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án Tiến sĩ Máy tính "Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ" trình bày các nội dung chính sau: Tổng quan về tra cứu dựa trên nội dung; Nâng cao hiệu quả của việc tra cứu ảnh dựa trên nội dung bằng cách kết hợp tối ưu khoảng cách của tra cứu ảnh và phân tích phân biệt tuyến tính; Cải thiện hiệu quả của tra cứu ảnh dựa trên nội dung sử dụng phân hoạch đô thị.
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Thị Lan PhươngMỘT SỐ KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨUẢNH THEO NỘI DUNG DỰA TRÊN ĐỘ ĐO KHOẢNG CÁCH THÍCH NGHI VÀ PHÂN CỤM PHỔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Hà Nội - 2023 BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Thị Lan PhươngMỘT SỐ KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU ẢNH THEO NỘI DUNG DỰA TRÊN ĐỘ ĐO KHOẢNG CÁCH THÍCH NGHI VÀ PHÂN CỤM PHỔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Mã số: 9 48 01 01Xác nhận của Học viện Người hướng dẫn 1 Người hướng dẫn 2Khoa học và Công nghệ PGS.TS. Ngô Quốc Tạo TS. Nguyễn Ngọc Cương Hà Nội - 2023LỜI CAM ĐOAN Nghiên cứu sinh Nguyễn Thị Lan PhươngLỜI CẢM ƠN Hà Nội, ngày tháng 10 năm 2023 Nghiên cứu sinh Nguyễn Thị Lan PhươngMỤC LỤC iiiiiiivv DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT TBIR Text-based image retrieval Tra cứu ảnh dựa trên văn bản CBIR Content-based image retrieval Tra cứu ảnh dựa trên nội dung Image retrieval method using Phương pháp tra cứu ảnh sử IRIC Incremental clustering dụng phân cụm tăng dần Clustering Images Set using Nhóm ảnh được thiết lập bằng CISE Eigenvectors cách sử dụng Eigenvectos INC Incremental Clustering Phân cụm tăng dần CNN convolutional neural networks Mạng nơ ron phức hợp Tra cứu ảnh bằng cách sử dụng Image Retrieval using the khoảng cách khoảng cách tốiODLDA optimal distance and linear ưu và phân tích phân biệt tuyến Discriminant analysis tính Online Algorithm for Scalable Mở rộng thuật toán trực tuyếnOASIS Image Similarity cho sự giống nhau của ảnh DML Distance metric learning Học khoảng cách khoảng cách Discriminative Components Phân tích các thành phần phân DCA Analysis biệt IR Information retrieval Tra cứu thông tin RF Relevance feedback Mức độ trả lời liên quan ST Semantic template Mẫu ngữ nghĩa RGB Red Green Blue Đỏ lục lam CCVs Color coherence vectors Các vectơ liên kết màu Shift-invariant principal Phân tích thành phần chính SPCA component analysis thay đổi – bất biến vi Maximum likelihood Tính toán khả năng xảy ra tốiMLE estimation đa viiviii DANH MỤC HÌNH VẼHình I.1. Sơ đồ tra cứu ảnh dựa vào nội dung .................................................. 8Hình I. 2. PCA cho bài toán phân lớp với 2 lớp ............................................. 35Hình I. 3. Khoảng cách phân kỳ giữa các kỳ vọng và tổng các phương sai ảnhhưởng tới độ tách của dữ liệu. ......................................................................... 38Hình I. 4. Hình ảnh đầu vào (bên trái) và bộ mô tả GIST 512D của nó (bênphải). Nhiều phần nền trong hình ảnh giống nhau về nội dung trực quan dẫnđến sự giống nhau của các khối mô tả. ........................................................... 49Hình I. 5. Lỗi lượng tử hoá cho tập dữ liệu 1M SIFT(a) và 1M GIST (b). .... 52Hình I. 6. Hình ảnh đầu vào (bên trái) và bộ mô tả SIFT được tính toán tại 4điểm chính (bên phải)...................................................................................... 55Hình I. 7. Chất lượng mã hoá cho SIFT (a) và GIST (b) ................................ 59Hình I. 8. Hiệu suất tìm kiếm ANN cho SIFT (a) và GIST (b) ...................... 61Hình II. 1 Một ví dụ về sự mơ hồ và giàu ngữ nghĩa...................................... 69Hình II. 2. Ví dụ về ba bộ ảnh khác nhau được truy xuất với cùng một truy vấntuỳ thuộc vào loại nhiệm vụ CBIR.................................................................. 71Hình II. 3. Sơ đồ của phương pháp đề xuất ODLDA ..................................... 82Hình II. 4. Kiến trúc học biểu diễn dựa vào mô hình CNN được tiền huấn luyện.......................................................................... ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: