Bài viết trình bày một số kết quả đánh giá về chất lượng hình ảnh LF dựa trên phương pháp đánh giá chủ quan, đặc biệt tập trung vào những độ sâu trường ảnh (DOF) khác nhau với trường nhìn khác nhau (FOV).
Nội dung trích xuất từ tài liệu:
Nghiên cứu và phân tích các mô hình đánh giá chất lượng ảnh Light field với chuẩn mã hóa H.266/VVC
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
Nghiên cứu và phân tích các mô hình đánh giá
chất lượng ảnh Light field với chuẩn mã hóa
H.266/VVC
Phí Công Huy1,2, PGS. TS. Trịnh Anh Vũ2, TS. Hoàng Văn Xiêm2
Khoa Đa phương tiện, Học Viện Công Nghệ Bưu Chính Viễn Thông1
Khoa Điện tử Viễn thông, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội2
Email: huypc@ptit.edu.vn, 17028025@vnu.edu.vn, vuta@vnu.edu.vn, xiemhoang@vnu.edu.vn
Tóm tắt - Light-Field (LF) là một dạng dữ liệu về hình ảnh, khai thác dữ liệu ba chiều (3-D), ước lượng chiều sâu
với thông tin phong phú từ nhiều chiều thông tin. Nó cung [5].
cấp đa dạng thông tin về hình ảnh như nội dung 2D, chiều
sâu, vị trí góc nhìn, độ dài tiêu cự, v.v. Do đó, đánh giá LF có lợi thế về sự phong phú của dữ liệu cùng với
chất lượng hình ảnh LF là công việc đầy thách thức. Trong các tính năng tuyệt vời được đề cập ở trên tuy nhiên nó
bài viết này, chúng tôi trình bày một số kết quả đánh giá cũng gặp phải một số vấn đề liên quan tới xử lý tín hiệu
về chất lượng hình ảnh LF dựa trên phương pháp đánh và phần mềm, nguyên nhân chính nằm ở dung lượng dữ
giá chủ quan, đặc biệt tập trung vào những độ sâu trường liệu cao và cấu trúc khác với các bức ảnh 2D thông
ảnh (DOF) khác nhau với trường nhìn khác nhau (FOV). thường. Tuy nhiên, một hình ảnh với dữ liệu nhiều thông
Kết quả đánh giá chất lượng chủ quan được xây dựng dựa tin như LF, nó hứa hẹn sẽ có một tương lai tiềm năng.
trên bộ dữ liệu LF bao gồm 228 hình ảnh từ nguồn EPFL Nó có thể áp dụng vào việc hỗ trợ tối ưu hình ảnh trong
với hai mức lấy nét khác nhau (lấy nét tiền cảnh và lấy nét sản xuất kỹ xảo phim, cho phép những trải nghiệm mới
hậu cảnh). Để có sự đánh giá đa dạng, các thông tin nhiễu trong các ứng dụng hình ảnh, hội nghị từ xa và cải thiện
được bổ sung vào các ảnh LF bằng cách mã hóa hình ảnh nội dung thị giác trong thực tế ảo và gia tăng (VR-AR)
thông qua bộ mã hóa video mới nhất – Versatile Video [6].
Coding (VVC). Kết quả nghiên cứu của bài báo đã cung
cấp những lưu ý về hiệu năng của 2 phương pháp đánh giá Gần đây, hình ảnh LF có thể được áp dụng cho nhiều
phổ biến đó là Pick-signal Noise Ratio (PSNR) và lĩnh vực như công cụ y sinh học như ống soi tai [7], kính
Structure Similarity Index (SSIM) sử dụng cho ảnh LF. hiển vi [8], điều khiển robot dựa trên thị giác [9],
velocimetry [10], v.v. Tuy nhiên, dữ liệu hình ảnh LF là
Từ khóa— Image quality assessment, Light Field image, một loại dữ liệu có cấu trúc phức tạp và kích thước cao
Coding, Benchmarking cần được phân tích và khám phá, cụ thể là trong đánh
giá và biểu diễn chất lượng. Hình ảnh LF có thể bị nhiều
I. GIỚI THIỆU loại nhiễu do các giai đoạn xử lý hình ảnh LF khác nhau
Năm 2015, nhóm những chuyên gia về chuẩn nén như thu thập ở giai đoạn xử lý ban đầu, tái tạo / nén ở
ảnh JPEG đã đưa ra một khái niệm mới đó là JPEG giai đoạn xử lý giữa và kết xuất / hiển thị ở giai đoạn xử
Plenoptic, một định dạng ảnh với dữ liệu thông tin 7-D lý sau này. Do đó, một mô hình đánh giá chất lượng hình
[1]. Plenoptic bao gồm các loại dữ liệu như light field, ảnh LF (LF-IQA) hiệu quả là một nhu cầu rất cần thiết
point cloud, holography…Điều này mở ra những hướng trong thời gian hiện tại, đặc biệt, mô hình này phải kiểm
nghiên cứu rất triển vọng cho các nhà nghiên cứu về xử soát được đặc điểm riêng biệt của LF, ví dụ: lựa chọn
lý tín hiệu và ảnh. điểm nét sau khi chụp.
Light-Field (LF) là sự thể hiện của một tập hợp của Trong các nghiên cứu trước đây, một số mô hình
tất cả các tia sáng được ghi lại ở mọi điểm trong không đánh giá chất lượng hình ảnh (IQA) đã được đề xuất,
gian và ở các hướng; Do đó, dữ liệu LF có thể cung cấp chẳng hạn như Tỷ lệ tín hiệu trên nhiễu đỉnh (PSNR),
dữ liệu với các thông tin phong phú. Nó được biết đến Lỗi bình phương trung bình (MSE) và Chỉ số tương
thông qua hệ thống Image-Based Rendering (IBR) do đồng cấu trúc (SSIM). Tuy nhiên, các mô hình này
Levoy và Hanrahan đề xuất năm 1996 [2]. Trong hai không khai thác đầy đủ các đặc điểm LF, bao gồm thông
thập kỷ qua, đã có một sự cải tiến rất lớn về kỹ thuật LF, tin màu sắc và thông tin hình học của ảnh LF và hình
ví dụ: cách thu thập dữ liệu, kết xuất dữ liệu và kỹ thuật ảnh phân nhóm (EPIs). Đặc biệt, các nghiên cứu gần đây
lấy mẫu. Đặc biệt, nhiều loại máy ảnh chuyên dụng được chưa khám phá đầy đủ sự phức tạp của độ sâu trường
phát triển để ghi lại dữ liệu LF, ví dụ như Lytro LF, Illum ảnh (DOF) từ hình ảnh LF. Các tiêu chuẩn đánh giá
[3], và Raytrix [4]. Các máy ảnh này cung cấp cho chúng khách quan không phản ánh hiết sự biểu đạt phong phú
ta những tính năng tuyệt vời của dữ liệu LF như thay đổi của LF và phản ánh kết quả cảm nhận của mắt người.
điểm nhìn và góc nhìn, lấy nét dữ liệu sau khi ghi hình,
ISBN 978-604-80-5958-3 36
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
Chính vì vây, bài báo này sẽ trình bày ...