Nghiên cứu về các công cụ hỗ trợ mã hóa trong chuẩn mã hóa H.266/VVC với dữ liệu ảnh Light Field
Số trang: 6
Loại file: pdf
Dung lượng: 597.50 KB
Lượt xem: 20
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết "Nghiên cứu về các công cụ hỗ trợ mã hóa trong chuẩn mã hóa H.266/VVC với dữ liệu ảnh Light Field" trình bày một nghiên cứu tổng quát đầu tiên về các công cụ mã hóa của tiêu chuẩn mã hóa video cập nhật - H.266/VVC cho hình ảnh LF. Hầu hết các công cụ mã hóa từ H.266/VVC (ví dụ: SMVD, MIP, IBC, v.v.) được đánh giá trên chuỗi video giả 4D-LF, và được so sánh hiệu suất nén và độ phức tạp. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Nghiên cứu về các công cụ hỗ trợ mã hóa trong chuẩn mã hóa H.266/VVC với dữ liệu ảnh Light Field Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) NGHIÊN CỨU VỀ CÁC CÔNG CỤ HỖ TRỢ MÃ HÓA TRONG CHUẨN MÃ HÓA H.266/VVC VỚI DỮ LIỆU ẢNH LIGHT FIELD Phí Công Huy, Nguyễn Cảnh Châu Học viện Công nghệ Bưu chính Viễn thông huypc@ptit.edu.vn, chaunc@gmail.com Abstract - Các tiêu chuẩn mã hóa video được phát triển để truyền gồm một lượng lớn thông tin về mỗi tia sáng bao gồm vị trí x, và lưu trữ dữ liệu hiệu quả, với nhiều yêu cầu về tốc độ bit, chất y, z, góc Ө, Ø, bước sóng γ, và thời gian t. Dữ liệu ảnh LF có lượng hình ảnh, độ trễ, khả năng truy cập ngẫu nhiên, độ phức kích thước lớn và nói chung có thể được mô tả bằng hàm đa sơ tạp, v.v. Dữ liệu LF là một phương pháp thu thập dữ liệu tổng hợp đồ 7D như sau, LF (x, y, z, Ө, Ø, γ, t) [6]. Với độ phức tạp của cho phép xử lý hậu kỳ hình ảnh đa dạng như trích xuất 3D, thay hàm chức năng này, đặt ra nhiều thách thức trong việc chụp và đổi điểm nhìn và lấy nét sau khi chụp. Hơn nữa, LF cung cấp khả năng thu thập thông tin phong phú, ví dụ, kết cấu, thông tin hình xử lý ảnh trong thực tế, do đó, hàm chức năng trên được giảm học, v.v. Do đó, kỹ thuật nén hiệu quả đóng một vai trò quan trọng xuống thành hàm chức năng 4D. khi sử dụng dữ liệu LF, do lượng dữ liệu lớn. Các chuẩn mã hóa P = L (u, v, s, t) (1) video hiện đại đã xử lý hầu hết các đặc điểm của video phổ biến để trong đó cường độ ánh sáng, P, là một hàm của hình ảnh cải thiện hiệu quả nén như H.264/AVC, H.265/HEVC và khẩu độ phụ (điểm nhìn) (u, v) và vị trí (góc nhìn) (s, t) tương H.266/VVC. Hiện tại, chuẩn mã hóa video mới nhất - H.266/VVC ứng trong hình ảnh khẩu độ phụ. cung cấp hiệu suất so sánh vượt trội so với các tiêu chuẩn khác, Mô hình dữ liệu ảnh LF được mô tả như sau, hai mặt phẳng nhưng nó phải trả giá bằng độ phức tạp tính toán cực cao, do một (s, t) và (u, v), lần lượt trình bày dưới dạng tập hợp các máy ảnh số công cụ mã hóa mới được thêm vào (ví dụ: chế độ phân vùng và mặt phẳng tiêu điểm của chúng. Tập hợp các ảnh tạo bởi tam giác (TPM), đơn vị cây mã hóa (CTU) lớn 128 × 128 pixel, v.v.). Tuy nhiên, hiện chưa có một phân tích bao quát về các công khẩu độ phụ được gọi là SAI (Sub-aperture images), là cách thu cụ mã hóa cho chuẩn nén này, để tận dụng tối đa hiệu quả hoạt thập các tia sáng từ mỗi máy ảnh truyền từ mặt phẳng (u, v) đến động của nó, đặc biệt là đối với hình ảnh LF. Do đó, bài báo này một điểm cụ thể trên mặt phẳng (s, t). Do đó, mô hình hai mặt trình bày một nghiên cứu tổng quát đầu tiên về các công cụ mã phẳng này sử dụng mặt phẳng (s, t) để chỉ các kích thước góc, hóa của tiêu chuẩn mã hóa video cập nhật - H.266/VVC cho hình trong khi mặt phẳng (u, v) đề cập đến các kích thước không ảnh LF. Hầu hết các công cụ mã hóa từ H.266/VVC (ví dụ: SMVD, gian. MIP, IBC, v.v.) được đánh giá trên chuỗi video giả 4D-LF, và được so sánh hiệu suất nén và độ phức tạp. Về các tiêu chuẩn mã hóa video cập nhật, H.266/VVC [7] là tiêu chuẩn mã hóa video mới nhất, được ITU-T và ISO/IEC Keywords: Light field, plenoptic, super-pixel, coding standards, cùng xuất bản. Vào tháng 7 năm 2020, bộ mã hóa VVC được compression efficiency, complexity. công bố là chuẩn nén video thế hệ tiếp theo. Chuẩn nén video này được thiết kế để đáp ứng hiệu quả và linh hoạt để đáp ứng I. GIỚI THIỆU nhu cầu truyền thông hiện đại bằng cách cải thiện hiệu suất nén, Dữ liệu LF gần đây đã được giới thiệu và áp dụng cho nhiều cho phép giao tiếp hiệu quả và lưu trữ nội dung video khổng lồ. lĩnh vực, như kính soi tai [1] trong y sinh học, kính hiển vi [2], Trong bối cảnh này, nén dữ liệu LF dựa trên H.266/VVC là chủ điều khiển robot dựa trên thị giác [3] và đo vận tốc [4], bởi vì đề nghiên cứu rất được quan tâm gần đây. Nhiều bài báo đề xuất cấu trúc đặc biệt của máy ảnh LF. Máy ảnh LF không chỉ ghi và đánh giá hiệu suất nén của LF với codec H.266/VVC. Ví dụ, lại cường độ ánh sáng mà còn ghi lại hướng ánh sáng đến cảm V. Avramelos và cộng sự [9] ban đầu cung cấp nén hình ảnh LF biến của máy, dựa trên các thấu kính nhỏ được thêm vào ống bằng H.266/VVC bằng cách so sánh hiệu suất mã hóa của ba kính chính trước cảm biến máy ảnh [5, 6]. Do đó, dữ liệu ảnh thế hệ tiêu chuẩn nén video mới nhất, tức là H.264/AVC [10], LF có cấu trúc phức tạp và tính kích thước lớn, và rất cần được H. 265/HEVC [8] và H.266/VVC [7]. Gần đây, H. Amirpour và phân tích và khám phá. cộng sự [11] trình bày một nghiên cứu tương tự về so sánh hiệu Dữ liệu LF trình bày tập hợp các tia sáng truyền theo mọi suất của bộ mã hóa video trong nén hình ảnh LF, tập trung vào hướng góc tại mọi điểm trong không gian 3D [6], và do ...
Nội dung trích xuất từ tài liệu:
Nghiên cứu về các công cụ hỗ trợ mã hóa trong chuẩn mã hóa H.266/VVC với dữ liệu ảnh Light Field Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) NGHIÊN CỨU VỀ CÁC CÔNG CỤ HỖ TRỢ MÃ HÓA TRONG CHUẨN MÃ HÓA H.266/VVC VỚI DỮ LIỆU ẢNH LIGHT FIELD Phí Công Huy, Nguyễn Cảnh Châu Học viện Công nghệ Bưu chính Viễn thông huypc@ptit.edu.vn, chaunc@gmail.com Abstract - Các tiêu chuẩn mã hóa video được phát triển để truyền gồm một lượng lớn thông tin về mỗi tia sáng bao gồm vị trí x, và lưu trữ dữ liệu hiệu quả, với nhiều yêu cầu về tốc độ bit, chất y, z, góc Ө, Ø, bước sóng γ, và thời gian t. Dữ liệu ảnh LF có lượng hình ảnh, độ trễ, khả năng truy cập ngẫu nhiên, độ phức kích thước lớn và nói chung có thể được mô tả bằng hàm đa sơ tạp, v.v. Dữ liệu LF là một phương pháp thu thập dữ liệu tổng hợp đồ 7D như sau, LF (x, y, z, Ө, Ø, γ, t) [6]. Với độ phức tạp của cho phép xử lý hậu kỳ hình ảnh đa dạng như trích xuất 3D, thay hàm chức năng này, đặt ra nhiều thách thức trong việc chụp và đổi điểm nhìn và lấy nét sau khi chụp. Hơn nữa, LF cung cấp khả năng thu thập thông tin phong phú, ví dụ, kết cấu, thông tin hình xử lý ảnh trong thực tế, do đó, hàm chức năng trên được giảm học, v.v. Do đó, kỹ thuật nén hiệu quả đóng một vai trò quan trọng xuống thành hàm chức năng 4D. khi sử dụng dữ liệu LF, do lượng dữ liệu lớn. Các chuẩn mã hóa P = L (u, v, s, t) (1) video hiện đại đã xử lý hầu hết các đặc điểm của video phổ biến để trong đó cường độ ánh sáng, P, là một hàm của hình ảnh cải thiện hiệu quả nén như H.264/AVC, H.265/HEVC và khẩu độ phụ (điểm nhìn) (u, v) và vị trí (góc nhìn) (s, t) tương H.266/VVC. Hiện tại, chuẩn mã hóa video mới nhất - H.266/VVC ứng trong hình ảnh khẩu độ phụ. cung cấp hiệu suất so sánh vượt trội so với các tiêu chuẩn khác, Mô hình dữ liệu ảnh LF được mô tả như sau, hai mặt phẳng nhưng nó phải trả giá bằng độ phức tạp tính toán cực cao, do một (s, t) và (u, v), lần lượt trình bày dưới dạng tập hợp các máy ảnh số công cụ mã hóa mới được thêm vào (ví dụ: chế độ phân vùng và mặt phẳng tiêu điểm của chúng. Tập hợp các ảnh tạo bởi tam giác (TPM), đơn vị cây mã hóa (CTU) lớn 128 × 128 pixel, v.v.). Tuy nhiên, hiện chưa có một phân tích bao quát về các công khẩu độ phụ được gọi là SAI (Sub-aperture images), là cách thu cụ mã hóa cho chuẩn nén này, để tận dụng tối đa hiệu quả hoạt thập các tia sáng từ mỗi máy ảnh truyền từ mặt phẳng (u, v) đến động của nó, đặc biệt là đối với hình ảnh LF. Do đó, bài báo này một điểm cụ thể trên mặt phẳng (s, t). Do đó, mô hình hai mặt trình bày một nghiên cứu tổng quát đầu tiên về các công cụ mã phẳng này sử dụng mặt phẳng (s, t) để chỉ các kích thước góc, hóa của tiêu chuẩn mã hóa video cập nhật - H.266/VVC cho hình trong khi mặt phẳng (u, v) đề cập đến các kích thước không ảnh LF. Hầu hết các công cụ mã hóa từ H.266/VVC (ví dụ: SMVD, gian. MIP, IBC, v.v.) được đánh giá trên chuỗi video giả 4D-LF, và được so sánh hiệu suất nén và độ phức tạp. Về các tiêu chuẩn mã hóa video cập nhật, H.266/VVC [7] là tiêu chuẩn mã hóa video mới nhất, được ITU-T và ISO/IEC Keywords: Light field, plenoptic, super-pixel, coding standards, cùng xuất bản. Vào tháng 7 năm 2020, bộ mã hóa VVC được compression efficiency, complexity. công bố là chuẩn nén video thế hệ tiếp theo. Chuẩn nén video này được thiết kế để đáp ứng hiệu quả và linh hoạt để đáp ứng I. GIỚI THIỆU nhu cầu truyền thông hiện đại bằng cách cải thiện hiệu suất nén, Dữ liệu LF gần đây đã được giới thiệu và áp dụng cho nhiều cho phép giao tiếp hiệu quả và lưu trữ nội dung video khổng lồ. lĩnh vực, như kính soi tai [1] trong y sinh học, kính hiển vi [2], Trong bối cảnh này, nén dữ liệu LF dựa trên H.266/VVC là chủ điều khiển robot dựa trên thị giác [3] và đo vận tốc [4], bởi vì đề nghiên cứu rất được quan tâm gần đây. Nhiều bài báo đề xuất cấu trúc đặc biệt của máy ảnh LF. Máy ảnh LF không chỉ ghi và đánh giá hiệu suất nén của LF với codec H.266/VVC. Ví dụ, lại cường độ ánh sáng mà còn ghi lại hướng ánh sáng đến cảm V. Avramelos và cộng sự [9] ban đầu cung cấp nén hình ảnh LF biến của máy, dựa trên các thấu kính nhỏ được thêm vào ống bằng H.266/VVC bằng cách so sánh hiệu suất mã hóa của ba kính chính trước cảm biến máy ảnh [5, 6]. Do đó, dữ liệu ảnh thế hệ tiêu chuẩn nén video mới nhất, tức là H.264/AVC [10], LF có cấu trúc phức tạp và tính kích thước lớn, và rất cần được H. 265/HEVC [8] và H.266/VVC [7]. Gần đây, H. Amirpour và phân tích và khám phá. cộng sự [11] trình bày một nghiên cứu tương tự về so sánh hiệu Dữ liệu LF trình bày tập hợp các tia sáng truyền theo mọi suất của bộ mã hóa video trong nén hình ảnh LF, tập trung vào hướng góc tại mọi điểm trong không gian 3D [6], và do ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu Hội nghị Quốc gia lần thứ 25 Hội nghị Điện tử - Truyền thông - Công nghệ Thông tin Chuẩn mã hóa H.266/VVC Dữ liệu ảnh Light Field Tiêu chuẩn mã hóa video Hình ảnh đa tiêu điểmGợi ý tài liệu liên quan:
-
Phương pháp tạo ra văn bản tiếng Việt có đề tài xác định
7 trang 273 0 0 -
Thiết kế bộ lọc thông dải hốc cộng hưởng đồng trục cho băng C
8 trang 206 0 0 -
Thực hiện thuật toán ChaCha20 - Poly1305 trên phần cứng ứng dụng bảo mật hệ thống IoT
7 trang 143 0 0 -
Áp dụng phương pháp học máy để phát hiện tấn công DDoS trong môi trường thực nghiệm mạng SDN
5 trang 101 0 0 -
Phương pháp đảm bảo độ trễ dịch vụ trong mạng điện toán biên di động phân tầng
6 trang 90 0 0 -
7 trang 66 0 0
-
Nghiên cứu thiết kế bộ khuếch đại tạp âm thấp băng tần S dùng cho đài ra đa ELM-2288ER
5 trang 61 0 0 -
Đề xuất cải tiến lược đồ độ đo trong lý thuyết tập thô
2 trang 39 0 0 -
Điều khiển thiết bị bay không người lái giám sát môi trường thông qua học sâu tăng cường
6 trang 33 0 0 -
Nâng cao hiệu quả định vị trong nhà sử dụng học máy kết hợp
7 trang 31 0 0