Như chỉ ra trong hình 1.1-a chương Một, nhận dạng ảnh là giai đoạn cuối cùng của các hệ thống xử lý ảnh. Nhận dạng ảnh dựa trên nền tảng lý thuyết nhận dạng (pattern recognition) nói chung và đã được đề cập trong nhiều sách về nhận dạng. Ở đây, ta không nhắc lại mà chỉ trình bày mang tính chất giới thiệu một số khái niệm cơ bản và các phương pháp thường được sử dụng trong kỹ thuật nhận dạng. Và cuối cùng sẽ đề cập đến một trường hợp cụ thể về nhận dạng đó...
Nội dung trích xuất từ tài liệu:
Xử lý ảnh - chương 7
Ch¬ng B¶y: nhËn d¹ng ¶nh
7
nhËn d¹ng ¶nh
Pattern recognition
Nh chØ ra trong h×nh 1.1-a ch ¬ng Mét, nhËn d¹ng ¶nh lµ giai ®o¹n cuèi
cïng cña c¸c hÖ thèng xö lý ¶nh. NhËn d¹ng ¶nh dùa trªn nÒn t¶ng lý thuyÕt nhËn
d¹ng (pattern recognition) nãi chung vµ ®· ® îc ®Ò cËp trong nhiÒu s¸ch vÒ nhËn
d¹ng. ë ®©y, ta kh«ng nh¾c l¹i mµ chØ tr×nh bµy mang tÝnh chÊt giíi thiÖu mét sè
kh¸i niÖm c¬ b¶n vµ c¸c ph¬ng ph¸p thêng ®îc sö dông trong kü thuËt nhËn d¹ng.
Vµ cuèi cïng sÏ ®Ò cËp ®Õn mét trêng hîp cô thÓ vÒ nhËn d¹ng ®ã lµ nhËn d¹ng
ch÷ viÕt, mét vÊn ®Ò ®· vµ ®ang ®îc quan t©m nhiÒu.
Trong lý thuyÕt nhËn d¹ng nãi chung vµ nhËn d¹ng ¶nh nãi riªng cã 3 c¸ch tiÕp
cËn kh¸c nhau:
- NhËn d¹ng dùa vµo ph©n ho¹ch kh«ng gian.
- NhËn d¹ng cÊu tróc.
- NhËn d¹ng dùa vµo kü thuËt m¹ng n¬ ron.
Hai c¸ch tiÕp cËn ®Çu lµ c¸c kü thuËt kinh ®iÓn. C¸c ®èi t îng ¶nh quan s¸t
vµ thu nhËn ®îc ph¶i tr¶i qua giai ®o¹n tiÒn xö lý nh»m t¨ng c êng chÊt lîng, lµm
næi c¸c chi tiÕt (ch¬ng 4), tiÕp theo lµ trÝch chän vµ biÓu diÔn c¸c ®Æc tr ng (ch-
¬ng 5 vµ ch¬ng 6), vµ cuèi cïng míi qua giai ®o¹n nhËn d¹ng. C¸ch tiÕp cËn thø
ba hoµn toµn kh¸c. Nã dùa vµo c¬ chÕ ®o¸n nhËn, l u trò vµ ph©n biÖt ®èi tîng
m« pháng theo ho¹t ®éng cña hÖ thÇn kinh con ng êi. Do c¬ chÕ ®Æc biÖt, c¸c
®èi tîng thu nhËn bëi thÞ gi¸c ng êi kh«ng cÇn qua giai ®o¹n c¶i thiÖn mµ chuyÓn
ngay sang giai ®o¹n tæng hîp, ®èi s¸nh víi c¸c mÉu ®· l u tr÷ ®Ó nhËn d¹ng. §©y lµ
c¸ch tiÕp cËn cã nhiÒu høa hÑn. C¸c c¸ch tiÕp cËn trªn sÏ tr×nh bµy chi tiÕt trong
c¸c phÇn díi ®©y.
NhËp m«n xö lý ¶nh sè - §HBK Hµ néi 164
Ch¬ng B¶y: nhËn d¹ng ¶nh
7.1 tæng quan vÒ nhËn d¹ng
NhËn d¹ng lµ qu¸ tr×nh ph©n lo¹i c¸c ®èi tîng ®îc biÓu diÔn theo mét m«
h×nh nµo ®ã vµ g¸n cho chóng vµo mét líp (g¸n cho ®èi t îng mét tªn gäi) dùa theo
nh÷ng quy luËt vµ c¸c mÉu chuÈn. Qu¸ tr×nh nhËn d¹ng dùa vµo nh÷ng mÉu häc
biÕt tríc gäi lµ nhËn d¹ng cã thµy hay häc cã thµy (supervised learning); trong tr-
êng hîp ngîc l¹i gäi lµ häc kh«ng cã thµy (non supervised learning). Chóng ta sÏ
lÇn lît giíi thiÖu c¸c kh¸i niÖm nµy.
7.1.1 Kh«ng gian biÓu diÔn ®èi tîng, kh«ng gian diÔn dÞch
Kh«ng gian biÓu diÔn ®èi tîng
C¸c ®èi tîng khi quan s¸t hay thu thËp ® îc, thêng ®îc biÓu diÔn bëi tËp c¸c
®Æc trng hay ®Æc tÝnh. Nh trong trêng hîp xö lý ¶nh, ¶nh sau khi ®îc t¨ng cêng
®Ó n©ng cao chÊt lîng, ph©n vïng vµ trÝch chän ®Æc tÝnh nh ®· tr×nh bµy trong
c¸c ch¬ng tõ ch¬ng Bèn ®Õn ch¬ng S¸u, ®îc biÓu diÔn bëi c¸c ®Æc trng nh biªn,
miÒn ®ång nhÊt, v...,v. Ngêi ta thêng ph©n c¸c ®Æc trng nµy theo c¸c lo¹i nh:
®Æc trng t« p«, ®Æc trng h×nh häc vµ ®Æc trng chøc n¨ng. ViÖc biÓu diÔn ¶nh
theo ®Æc trng nµo lµ phô thuéc vµo øng dông tiÕp theo.
ë ®©y ta ®a ra mét c¸ch h×nh thøc viÖc biÓu diÔn c¸c ®èi t îng. Gi¶ sö ®èi
tîng X (¶nh, ch÷ viÕt, dÊu v©n tay, v...,v) ® îc biÓu diÔn bëi n thµnh phÇn (n ®Æc
trng): X = {x1, x2,..., xn}; mçi xi biÓu diÔn mét ®Æc tÝnh. Kh«ng gian biÓu diÔn ®èi
tîng thêng gäi t¾t lµ kh«ng gian ®èi tîng X ®îc ®Þnh nghÜa:
X = {X1, X2,..., Xm}
trong ®ã mçi Xi biÓu diÔn mét ®èi tîng. Kh«ng gian nµy cã thÓ lµ v« h¹n. §Ó tiÖn
xem xÐt chóng ta chØ xÐt tËp X lµ h÷u h¹n.
Kh«ng gian diÔn dÞch
Kh«ng gian diÔn dÞch lµ tËp c¸c tªn gäi cña ®èi t îng. KÕt thóc qu¸ tr×nh
nhËn d¹ng ta x¸c ®Þnh ®îc
tªn gäi cho c¸c ®èi tîng trong tËp kh«ng gian ®èi tîng hay nãi lµ ®· nhËn d¹ng ®îc
®èi tîng Mét c¸ch h×nh thøc gäi Ω lµ tËp tªn ®èi tîng:
Ω = {w1, w2,...,wk} víi wi, i = 1, 2,..., k lµ tªn c¸c ®èi tîng
NhËp m«n xö lý ¶nh sè - §HBK Hµ néi 165
Ch¬ng B¶y: nhËn d¹ng ¶nh
Qu¸ tr×nh nhËn d¹ng ®èi tîng f lµ mét ¸nh x¹ f: X ---> Ω víi f lµ tËp c¸c quy luËt
®Ó
®Þnh mét phÇn tö trong X øng víi mét phÇn tö trong Ω . NÕu tËp c¸c quy luËt vµ
tËp tªn c¸c ®èi tîng lµ biÕt tríc nh trong nhËn d¹ng ch÷ viÕt (cã 26 líp tõ A ®Õn Z),
ngêi ta gäi lµ nhËn d¹ng cã thµy. Tr êng hîp thø hai lµ nhËn d¹ng kh«ng cã thµy. § -
¬ng nhiªn trong trêng hîp nµy viÖc nhËn d¹ng cã khã kh¨n h¬n.
7.1.2 M« h×nh vµ b¶n chÊt cña qu¸ tr×nh nhËn d¹ng
7.1.2.1 M« h×nh
ViÖc chän lùa mét qu¸ tr×nh nhËn d¹ng cã liªn quan mËt thiÕt ®Õn kiÓu
m« t¶ mµ ngêi ta sö dông ®Ó ®Æc t¶ ®èi t îng. Trong nhËn d¹ng, ng êi ta ph©n
chia lµm 2 hä lín:
- Hä m« t¶ theo tham sè
- Hä m« t¶ theo cÊu tróc.
C¸ch m« t¶ ®îc lùa chän sÏ x¸c ®Þnh m« h×nh cña ®èi tîng. Nh vËy, chóng ta sÏ cã
2 lo¹i m« h×nh: m« h×nh theo tham sè vµ m« h×nh cÊu tróc.
• M« h×nh tham sè sö dông mét vÐct¬ ®Ó ®Æc t¶ ®èi t îng. Mçi phÇn tö cña
vÐct¬ m« t¶ mét ®Æc tÝnh cña ®èi t îng. ThÝ dô nh trong c¸c ®Æc trng chøc
n¨ng, ngêi ta sö dông c¸c hµm c¬ së trùc giao ®Ó biÓu diÔn. Vµ nh vËy ¶nh sÏ
®îc biÓu diÔn bëi mét chuçi c¸c hµm trùc giao. Gi¶ sö C lµ ® êng bao cña ¶nh
vµ C(i,j) lµ ®iÓm thø i trªn ®êng bao, i = 1, 2,..., N (®êng bao gåm N ®iÓm).
Gi¶ sö tiÕp :
N
1
∑
x0 = xi
N i =1
N
1
∑
y0 = yi
N i =1
lµ to¹ ®é t©m ®iÓm. Nh vËy, moment trung t©m bËc p, q cña ®êng bao lµ:
N
1
∑
µpq = (xi-x0)p(yi-y0)q (7.1)
N i =1
NhËp m«n xö lý ¶nh sè - §HBK Hµ néi 166
Ch¬ng B¶y: nhËn d¹ng ¶nh
VÐct¬ tham sè tr ...