Ước lượng độ sâu ảnh sử dụng phương pháp ánh sáng cấu trúc
Số trang: 8
Loại file: pdf
Dung lượng: 779.02 KB
Lượt xem: 8
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết đề xuất một mẫu sáng mức xám sử dụng trong hệ thống ánh sáng cấu trúc nhằm ước lượng độ sâu và tái tạo hình ảnh 3D của bề mặt vật thể. Mẫu sáng được đề xuất gồm bốn phần tử cơ bản có tính chất đối xứng, với một giải thuật giải mã đơn giản có thể giải mã ảnh thu được từ camera với độ chính xác cao.
Nội dung trích xuất từ tài liệu:
Ước lượng độ sâu ảnh sử dụng phương pháp ánh sáng cấu trúcNghiên cứu khoa học công nghệ ƯỚC LƯỢNG ĐỘ SÂU ẢNH SỬ DỤNG PHƯƠNG PHÁP ÁNH SÁNG CẤU TRÚC Nguyễn Thúy Bình1*, Võ Lê Cường2 Tóm tắt: Bài báo đề xuất một mẫu sáng mức xám sử dụng trong hệ thống ánh sáng cấu trúc nhằm ước lượng độ sâu và tái tạo hình ảnh 3D của bề mặt vật thể. Mẫu sáng được đề xuất gồm bốn phần tử cơ bản có tính chất đối xứng, với một giải thuật giải mã đơn giản có thể giải mã ảnh thu được từ camera với độ chính xác cao. Các điểm tương ứng giữa ảnh chụp và ảnh mẫu sáng được xác định và độ sâu ảnh được ước lượng dựa vào nguyên lý tam giác (triangulation principle). Ngoài ra, nhằm tăng độ phân giải trong việc giải mã ảnh, một mẫu sáng gồm 8 phần tử cơ bản tạo nên bởi 4 phần tử trên kết hợp với 2 mức sáng khác nhau được đề xuất.Từ khóa: Thị giác máy tính, Ước lượng độ sâu, Xây dựng ảnh 3D, Ánh sáng cấu trúc. 1. ĐẶT VẤN ĐỀ Ước lượng độ sâu ảnh là một hướng nghiên cứu với nhiều tiềm năng và đượccác nhà khoa học trên thế giới đặc biệt quan tâm trong những năm gần đây. Vấn đềước lượng độ sâu ảnh được ứng dụng trong nhiều lĩnh vực khác nhau, có thể kểđến: cảm biến từ xa, nhận dạng đối tượng, công nghiệp giám sát và các hệ thốngrobot tự động. Phương pháp ước lượng độ sâu ảnh sử dụng ánh sáng cấu trúc đượcđánh giá là một trong các phương pháp đạt được độ chính xác và độ phân giải cao.Hệ thống ánh sáng cấu trúc gồm một hoặc nhiều camera, và một máy chiếu(projector). Mẫu sáng được mã hóa theo các phương pháp khác nhau và được chiếulên bề mặt của vật thể. Sau đó, camera có nhiệm vụ thu ảnh của vật thể trong điềukiện được chiếu sáng. Kỹ thuật ánh sáng cấu trúc được chia thành ba nhóm phươngpháp cơ bản [1-3]: Ghép kênh theo thời gian (time multiplexing), mã hóa trực tiếp(direct coding), và mã hóa dựa vào các điểm lân cận (neighbor coding). Vớiphương pháp ghép kênh theo thời gian, một tập hợp các mẫu sáng được chiếu liêntiếp lên bề mặt của vật thể. Phương pháp này đạt được độ phân giải và độ chínhxác cao, tuy nhiên không áp dụng được trong trường hợp vật thể chuyển động.Phương pháp mã hóa trực tiếp mặc dù cũng đạt được độ phân giải cao nhưng lạichịu ảnh hưởng nhiều của nhiễu. Với các phương pháp thuộc nhóm cuối cùng, mỗiký tự kết hợp với bốn ký tự liền kề để tạo nên một từ mã duy nhất trên mẫu sáng.Nhóm phương pháp này có thể áp dụng với cả các đối tượng tĩnh và động, thuậttoán giải mã đơn giản và ít chịu ảnh hưởng của nhiễu. Trên thế giới đã có nhiều nghiên cứu giải quyết bài toán ước lượng độ sâu điểmảnh theo hướng tiếp cận xây dựng từ mã dựa trên các giá trị lân cận [4-7]. Mộttrong những nghiên cứu quan trọng nhất được Griffin đề xuất năm 1992 [8]. Trongphương pháp này, một ma trận sinh được tạo nên bởi các con số (1, 2, 3, 4,…). Vịtrí của mỗi phần tử được định nghĩa bởi một từ mã được tạo nên bởi chính phần tửđó và bốn phần tử lân cận. Mỗi từ mã này được xác định là duy nhất trong ma trậnsinh. Mỗi phần tử của ma trận được thay thế bởi một ký hiệu khác nhau, ví dụ:hình vuông, hình tròn, hình vành khăn, ... Đã có một số nghiên cứu phát triển theohướng này. Năm 1998, Davies và Nixon đề xuất một mẫu sáng gồm các đốm trònmàu để ước lượng độ sâu của bề mặt vật thể di chuyển [9]. Sau đó, Morano [10]Tạp chí Nghiên cứu KH&CN quân sự, Số 47, 02 - 2017 85 Kỹ thuật điều khiển & Điện tửđưa ra mẫu sáng được tạo nên bởi các sơ đồ con hoàn hảo (perfect sub-map) gồmnhững ký tự hình tròn có màu sắc khác nhau. Mẫu sáng màu sẽ bị ảnh hưởng củanhiễu nếu các đối tượng có màu sắc giống với màu của mẫu sáng. Một hướngnghiên cứu nhằm loại bỏ nhiễu khi chiếu lên vật thể màu là tạo nên các mẫu sángmức xám (grey level pattern). Trong nghiên cứu của Griffin, ông cũng đã đề xuấtmẫu sáng gồm năm ký tự khác nhau. Tuy nhiên, mẫu sáng này chưa được đưa rathực nghiệm với một hệ thống ánh sáng cấu trúc thực tế. Bài báo này đề xuất mộtmẫu sáng mức xám gồm các ký tự đối xứng. Với mẫu sáng được đề xuất, ảnh thuđược từ camera có thể dễ dàng được giải mã. Các cặp điểm tương ứng giữa ảnh thuđược và ảnh mẫu sáng được xác định là cơ sở để ước lượng độ sâu của bề mặt vậtthể so với gốc tọa độ tại camera. Bài báo được bố trí theo thứ tự sau: Phần 1. Đặtvấn đề; Phần 2. Hiệu chuẩn camera và máy chiếu; Phần 3. Mã hóa mẫu sáng vàgiải mã ảnh thu được; Phần 4. Thực nghiệm và kết luận. 2. HIỆU CHUẨN CAMERA VÀ MÁY CHIẾU Hình 1 mô tả các bước cơ bản nhằm ước lượng độ sâu điểm ảnh với phươngpháp ánh sáng cấu trúc. Trước hết, cần phải hiệu chuẩn hệ thống nhằm đưa ra cáctham số nội và tham số ngoại của camera và máy chiếu. Trong bài báo này, chúngtôi sử dụng phương pháp hiệu chuẩn của Zhang [11]. Quá trình hiệu chuẩn cần 15-20 ảnh với các góc đ ...
Nội dung trích xuất từ tài liệu:
Ước lượng độ sâu ảnh sử dụng phương pháp ánh sáng cấu trúcNghiên cứu khoa học công nghệ ƯỚC LƯỢNG ĐỘ SÂU ẢNH SỬ DỤNG PHƯƠNG PHÁP ÁNH SÁNG CẤU TRÚC Nguyễn Thúy Bình1*, Võ Lê Cường2 Tóm tắt: Bài báo đề xuất một mẫu sáng mức xám sử dụng trong hệ thống ánh sáng cấu trúc nhằm ước lượng độ sâu và tái tạo hình ảnh 3D của bề mặt vật thể. Mẫu sáng được đề xuất gồm bốn phần tử cơ bản có tính chất đối xứng, với một giải thuật giải mã đơn giản có thể giải mã ảnh thu được từ camera với độ chính xác cao. Các điểm tương ứng giữa ảnh chụp và ảnh mẫu sáng được xác định và độ sâu ảnh được ước lượng dựa vào nguyên lý tam giác (triangulation principle). Ngoài ra, nhằm tăng độ phân giải trong việc giải mã ảnh, một mẫu sáng gồm 8 phần tử cơ bản tạo nên bởi 4 phần tử trên kết hợp với 2 mức sáng khác nhau được đề xuất.Từ khóa: Thị giác máy tính, Ước lượng độ sâu, Xây dựng ảnh 3D, Ánh sáng cấu trúc. 1. ĐẶT VẤN ĐỀ Ước lượng độ sâu ảnh là một hướng nghiên cứu với nhiều tiềm năng và đượccác nhà khoa học trên thế giới đặc biệt quan tâm trong những năm gần đây. Vấn đềước lượng độ sâu ảnh được ứng dụng trong nhiều lĩnh vực khác nhau, có thể kểđến: cảm biến từ xa, nhận dạng đối tượng, công nghiệp giám sát và các hệ thốngrobot tự động. Phương pháp ước lượng độ sâu ảnh sử dụng ánh sáng cấu trúc đượcđánh giá là một trong các phương pháp đạt được độ chính xác và độ phân giải cao.Hệ thống ánh sáng cấu trúc gồm một hoặc nhiều camera, và một máy chiếu(projector). Mẫu sáng được mã hóa theo các phương pháp khác nhau và được chiếulên bề mặt của vật thể. Sau đó, camera có nhiệm vụ thu ảnh của vật thể trong điềukiện được chiếu sáng. Kỹ thuật ánh sáng cấu trúc được chia thành ba nhóm phươngpháp cơ bản [1-3]: Ghép kênh theo thời gian (time multiplexing), mã hóa trực tiếp(direct coding), và mã hóa dựa vào các điểm lân cận (neighbor coding). Vớiphương pháp ghép kênh theo thời gian, một tập hợp các mẫu sáng được chiếu liêntiếp lên bề mặt của vật thể. Phương pháp này đạt được độ phân giải và độ chínhxác cao, tuy nhiên không áp dụng được trong trường hợp vật thể chuyển động.Phương pháp mã hóa trực tiếp mặc dù cũng đạt được độ phân giải cao nhưng lạichịu ảnh hưởng nhiều của nhiễu. Với các phương pháp thuộc nhóm cuối cùng, mỗiký tự kết hợp với bốn ký tự liền kề để tạo nên một từ mã duy nhất trên mẫu sáng.Nhóm phương pháp này có thể áp dụng với cả các đối tượng tĩnh và động, thuậttoán giải mã đơn giản và ít chịu ảnh hưởng của nhiễu. Trên thế giới đã có nhiều nghiên cứu giải quyết bài toán ước lượng độ sâu điểmảnh theo hướng tiếp cận xây dựng từ mã dựa trên các giá trị lân cận [4-7]. Mộttrong những nghiên cứu quan trọng nhất được Griffin đề xuất năm 1992 [8]. Trongphương pháp này, một ma trận sinh được tạo nên bởi các con số (1, 2, 3, 4,…). Vịtrí của mỗi phần tử được định nghĩa bởi một từ mã được tạo nên bởi chính phần tửđó và bốn phần tử lân cận. Mỗi từ mã này được xác định là duy nhất trong ma trậnsinh. Mỗi phần tử của ma trận được thay thế bởi một ký hiệu khác nhau, ví dụ:hình vuông, hình tròn, hình vành khăn, ... Đã có một số nghiên cứu phát triển theohướng này. Năm 1998, Davies và Nixon đề xuất một mẫu sáng gồm các đốm trònmàu để ước lượng độ sâu của bề mặt vật thể di chuyển [9]. Sau đó, Morano [10]Tạp chí Nghiên cứu KH&CN quân sự, Số 47, 02 - 2017 85 Kỹ thuật điều khiển & Điện tửđưa ra mẫu sáng được tạo nên bởi các sơ đồ con hoàn hảo (perfect sub-map) gồmnhững ký tự hình tròn có màu sắc khác nhau. Mẫu sáng màu sẽ bị ảnh hưởng củanhiễu nếu các đối tượng có màu sắc giống với màu của mẫu sáng. Một hướngnghiên cứu nhằm loại bỏ nhiễu khi chiếu lên vật thể màu là tạo nên các mẫu sángmức xám (grey level pattern). Trong nghiên cứu của Griffin, ông cũng đã đề xuấtmẫu sáng gồm năm ký tự khác nhau. Tuy nhiên, mẫu sáng này chưa được đưa rathực nghiệm với một hệ thống ánh sáng cấu trúc thực tế. Bài báo này đề xuất mộtmẫu sáng mức xám gồm các ký tự đối xứng. Với mẫu sáng được đề xuất, ảnh thuđược từ camera có thể dễ dàng được giải mã. Các cặp điểm tương ứng giữa ảnh thuđược và ảnh mẫu sáng được xác định là cơ sở để ước lượng độ sâu của bề mặt vậtthể so với gốc tọa độ tại camera. Bài báo được bố trí theo thứ tự sau: Phần 1. Đặtvấn đề; Phần 2. Hiệu chuẩn camera và máy chiếu; Phần 3. Mã hóa mẫu sáng vàgiải mã ảnh thu được; Phần 4. Thực nghiệm và kết luận. 2. HIỆU CHUẨN CAMERA VÀ MÁY CHIẾU Hình 1 mô tả các bước cơ bản nhằm ước lượng độ sâu điểm ảnh với phươngpháp ánh sáng cấu trúc. Trước hết, cần phải hiệu chuẩn hệ thống nhằm đưa ra cáctham số nội và tham số ngoại của camera và máy chiếu. Trong bài báo này, chúngtôi sử dụng phương pháp hiệu chuẩn của Zhang [11]. Quá trình hiệu chuẩn cần 15-20 ảnh với các góc đ ...
Tìm kiếm theo từ khóa liên quan:
Thị giác máy tính Ước lượng độ sâu Xây dựng ảnh 3D Ánh sáng cấu trúc Tạo hình ảnh 3D của bề mặt vật thểTài liệu liên quan:
-
Bài giảng Học sâu và ứng dụng - Bài 7: Một số ứng dụng học sâu trong thị giác máy (Phần 1)
64 trang 199 0 0 -
Giáo trình Thị giác máy tính và ứng dụng: Phần 2
92 trang 175 0 0 -
9 trang 92 0 0
-
Độ chính xác nhận dạng trong mô hình Faster R-CNN khi có nhiễu
5 trang 61 0 0 -
11 trang 43 0 0
-
Giáo trình Mạng nơ ron học sâu và ứng dụng: Phần 2
53 trang 41 0 0 -
Cải tiến một số thuật toán heuristic giải bài toán clique lớn nhất
9 trang 40 0 0 -
Giáo trình Thị giác máy tính và ứng dụng: Phần 1
70 trang 39 0 0 -
Ứng dụng mô hình học sâu thích ứng trong bài toán phát hiện phương tiện giao thông
9 trang 35 0 0 -
Nhận dạng hình trạng bàn tay sử dụng thuật toán YOLOv7
7 trang 33 0 0