Tham khảo tài liệu multibooks - tổng hợp it - pc part 14, công nghệ thông tin, kỹ thuật lập trình phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả
Nội dung trích xuất từ tài liệu:
MultiBooks - Tổng hợp IT - PC part 14 Nói cách khác, tính chất đồng nhất sử dụng hàm cơ sở f và mức nhiễu cực đại cho phép h. Việc xem xét mức bw của tế bào (x, y) là tương đương với kết quả của hàm f nếu |bw-level(x, y) –f(x, y)| Error! 1 2 3 4 Cột Hàng 1 0.1 0.25 0.5 0.5 2 0.05 0.30 0.6 0.6 3 0.35 0.30 0.55 0.8 4 0.6 0.63 0.85 0.90Hãy xem xét hàm dự báo đồng nhất Error!. Hàm dự báo đồng nhất này cho biết vùng R được xem như đồng nhất nếu tồn tại rsao cho mỗi tế bào trong vùng có mức bw là v thoả mãn |v-r| £ 0.03Theo cách phân lớp này, dễ dàng thấy rằng ta có 5 vùng hình thành từ phân đoạnảnh trên theo Error!như trên hình 3.5. R1={(1,1), (1,2)} R2={(1,3), (2,1), (2,2),(2,3)} R3={(3,1),(3,2),(3,3),(4,2),(4,2)} R4={(3,4),(4,3),(4,4)} R5={(1,4),(2,4)}Dưới đây là phương pháp đơn giản tìm kiếm phân đoạn ảnh theo dự báo đồng nhấtH:1. Bẻ gẫy: Bắt đầu bằng toàn bộ ảnh. Nếu là đồng nhất, thực hiện xong và ảnhchính là đoạn hợp lệ. Nếu không, chia ảnh thành 2 phần và thực hiện lặp cho đếnkhi ta tìm ra R1,...,Rn các vùng đồng nhất và thoả mãn mọi điều kiện (trừ điều kiện4) trong định nghĩa thuộc tính đồng nhất.2. Trộn: Kiểm tra xem những Ri nào có thể trộn vào nhau. Kết thúc bước này tacó các đoạn hợp lệ R’1,...,R’k của ảnh, trong đó k£n và mỗi R’i là hợp nhất của mộtvài Rj.Giải thuật cài đặt các bước trên có thể mô tả dễ dàng bằng ba hàm và hàm chính cótên segment như sau:Giải thuật 3.1 function segment(I:image) SOL=0; check_split(I); merg(SOL); end function function check_split(R) if H(R)=”true” then addsol(R) else {X=split(R); check_split(X.part1); check_split(X.part2); } end function procedure addsol(R) SOL=SOLÈ{R} end procedure function merge(S) while S¹Æ do { Pick some Cand in S; merged=false; S=S-{Cand}; Enumerate S as C1,...,Ck; while i £ k do {if adjacent(Cand, Ci) then {Cand=Cand È Ci; S=S-{Ci}; merged=true; } else {i=i+1; if merged then S=SÈ{Cand}; merged=false; } }}; end function3.4 Truy vấn trên cơ sở tương tựTại đây ta đã nghiên cứu kỹ thuật lấy ảnh làm đầu vào, cho lại phiên ảnh nén củaảnh đầu vào nhờ biến đổi ảnh DCT, DFT hay wavelet. Câu hỏi cần trả lời là: Cáchnào có thể xác định nội dung của phân đoạn (hay ảnh phân đoạn) tương tự với ảnhkhác (hay tập ảnh khác) hay không?Có nhiều trường hợp ứng dụng, khi có CSDL ảnh lớn, người sử dụng mong muốntruy vấn như “Đây là ảnh của một người. Hãy cho biết đó là ai?”.Có hai tiệm cận chính đến truy vấn ảnh trên cơ sở tương tự.1. Tiệm cận thước đo: Trong tiệm cận này ta giả sử rằng có thước đo khoảngcách d để so sánh hai đối tượng ảnh. Hai đối tượng ảnh càng gần nhau thì chúngcàng tương tự nhau. Vấn đề truy vấn trên cơ sở tương tự có thể được phát biểu nhưsau: Cho trước ảnh vào i, hãy tìm láng giềng gần nhất của i trong tập ảnh. Cho đếnnay, tiệm cận thước đo được sử dụng nhiều nhất trong các CSDL ảnh.2. Error!Tiệm cận biến đổi: Tiệm cận thước đo giả sử rằng quan niệm tương tự là “cố định”;có nghĩa rằng, trong bất kỳ ứng dụng nào, chỉ một quan niệm tương tự được sửdụng để làm chỉ mục dữ liệu (mặc dù nhiều ứng dụng sử dụng nhiều quan niệmtương tự khác nhau). Tương tự câu châm ngôn “Cái đẹp nằm trong mắt của ngườixem” thì cũng đúng với “Cái tương tự nằm trong mắt của người xem”. Thí dụ vớihai ảnh, người này cho rằng hai con vật giống nhau (hai con khỉ), nhưng chuyêngia động vật cho rằng hai ảnh khác nhau: con đười ươi (hình 3.6a) và con tinh tinh(hình 3.6b). Tương tự với xâu ký tự “AI” và “intelligence”. Dưới con mắt ngườilàm tin học thì chúng tương đương, nhưng với các chuyên gia sinh học thì AI lại làArtificial Insemination (thụ tinh nhân tạo)...Do vậy, người sử dụng phải chỉ ra cái gì được coi là tương tự, thay cho việc đểtoàn bộ công việc cho hệ thống.3.4.1 Tiệm cận thước đoGiả sử ta xem xét tập đối tượng Obj với các đặc tính pixel p1,...,pn . Mỗi đối tượngo được xem như tập S(o) của bộ (n+2) (n+2 tuple)có khuôn dạng sau: (xcoord, ycoord, v1,...,vn)trong đó, vi là giá trị của thuộc tính pi kết hợp với tọa độ pixel (x, y). Rõ ràng, S(o)chứa (w x h) của bộ (n+2), trong đó w là độ rộng và h là độ cao của chữ nhật kếthợp với o.Thông thường, một đối tượng là toàn bộ ảnh hay đoạn ảnh. Thí dụ, cho trướcCSDL ảnh mặt người. Nó bao gồm ảnh của nhiều người chụp dưới các điều kiệnkhác nhau thì một đối tượng có thể bao ...