Procesarea și recunoașterea imaginilor în sistemele de securitate preventivă: un tutorial. Lista literaturii folosite

Unul dintre obiectivele principale ale vederii computerizate în procesarea imaginilor este interpretarea conținutului din imagine. Pentru a face acest lucru, este necesar să se separe calitativ fundalul de obiecte. Segmentarea împarte o imagine în părțile sale componente sau obiectele. Separă obiectul de fundal, astfel încât imaginile să poată fi procesate cu ușurință și conținutul acestuia să poată fi identificat. În acest caz, evidențierea contururilor într-o imagine este un instrument fundamental pentru segmentarea calitatii imagini. Acest articol încearcă să studieze performanța algoritmilor de extracție a marginilor utilizați în mod obișnuit pentru segmentarea ulterioară a imaginii, precum și compararea acestora folosind instrument software MATLAB.

Introducere

Segmentarea imaginii este un pas uriaș pentru analiza imaginii. Împarte o imagine în părțile sau obiectele sale componente. Nivelul de detaliu al zonelor separate depinde de problema rezolvată. De exemplu, atunci când obiectele de interes nu mai păstrează integritatea și sunt împărțite în părți componente mai mici, procesul de segmentare ar trebui oprit. Algoritmii de segmentare a imaginii se bazează cel mai adesea pe discontinuitatea și similitudinea valorilor din imagine. Abordarea discontinuității de luminanță se bazează pe modificări bruște ale valorilor de intensitate, în timp ce asemănarea se bazează pe împărțirea imaginii în zone care sunt similare conform unui număr de criterii predefinite. Astfel, alegerea algoritmului de segmentare a imaginii depinde direct de problema care trebuie rezolvată. Detectarea marginilor este o parte a segmentării imaginii. În consecință, eficacitatea rezolvării multor probleme de procesare a imaginilor și de viziune pe computer depinde de calitatea limitelor extrase. Izolarea lor într-o imagine poate fi clasificată ca algoritmi de segmentare care se bazează pe discontinuități de luminozitate.

Procesul de detectare a discontinuităților precise de luminozitate într-o imagine se numește proces de extracție a marginilor. Golurile sunt schimbări bruște într-un grup de pixeli care sunt granițele obiectelor. Algoritmul clasic de detectare a marginilor implică convoluția imaginii folosind un operator care este sensibil la diferențe mari de luminozitate din imagine și returnează zero atunci când trece prin zone omogene. Disponibil acum cantitate uriașă algoritmi de detectare a marginilor, dar niciunul dintre ei nu este universal. Fiecare dintre algoritmii existentiîși rezolvă propria clasă de probleme (adică identifică calitativ granițele unui anumit tip). Pentru a determina algoritmul adecvat de detectare a marginilor, este necesar să se ia în considerare parametri precum orientarea și structura marginii, precum și prezența și tipul de zgomot în imagine. Geometria operatorului stabilește direcția caracteristică în care este cel mai sensibil la granițe. Operatorii existenți sunt proiectați să găsească limite verticale, orizontale sau diagonale. Izolarea limitelor obiectelor este o sarcină dificilă în cazul unei imagini foarte zgomotoase, deoarece operatorul este sensibil la schimbările de luminozitate și, prin urmare, zgomotul va fi, de asemenea, considerat ca un obiect din imagine. Există algoritmi care pot elimina semnificativ zgomotul, dar, la rândul lor, deteriorează semnificativ marginile imaginii, distorsionându-le. Și deoarece majoritatea imaginilor procesate conțin zgomot, algoritmii de reducere a zgomotului sunt foarte populari, dar acest lucru afectează calitatea contururilor selectate.

De asemenea, la detectarea contururilor obiectelor, apar probleme precum găsirea contururilor false, poziționarea contururilor, lipsa contururilor adevărate, interferența sub formă de zgomot, timp mare de calcul etc. Prin urmare, scopul este de a examina și compara multe procesate. imagini și analiza calității algoritmilor în diferite condiții.

Acest articol încearcă să revizuiască cei mai populari algoritmi de selecție a contururilor pentru segmentare, precum și implementarea lor în mediul software MATLAB. A doua secțiune prezintă definițiile fundamentale care sunt utilizate în literatură. Al treilea oferă explicații teoretice și matematice ale diferitelor abordări computerizate pentru extracția contururilor. Secțiunea a patra oferă o analiză comparativă a diferiților algoritmi, însoțită de imagini. Secțiunea a cincea conține o prezentare generală a rezultatelor obținute și o concluzie.

Segmentarea imaginii

Segmentarea imaginii este procesul de împărțire a unei imagini digitale în mai multe regiuni sau seturi de pixeli. De fapt, aceasta este o împărțire în diverse obiecte care au aceeași textură sau culoare. Rezultatul segmentării este un set de regiuni care acoperă întreaga imagine împreună și un set de contururi extrase din imagine. Toți pixelii din aceeași regiune sunt similari în anumite caracteristici, cum ar fi culoarea, textura sau intensitatea. Zonele adiacente diferă unele de altele prin aceleași caracteristici. Diverse abordări pentru găsirea granițelor între regiuni se bazează pe neomogenități în nivelurile de intensitate a luminozității. Astfel, alegerea metodei de segmentare a imaginii depinde de problema care trebuie rezolvată.

Metodele bazate pe zonă se bazează pe continuitate. Acești algoritmi împart întreaga imagine în subregiuni în funcție de anumite reguli, de exemplu, toți pixelii dintr-un anumit grup trebuie să aibă o anumită valoare de gri. Acești algoritmi se bazează pe modele comune de valori ale intensității în grupuri de pixeli învecinați.

Segmentarea pragului este cel mai simplu tip de segmentare. Pe baza acesteia, zonele pot fi clasificate în funcție de un interval de bază de valori care depind de intensitatea pixelilor imaginii. Thresholding convertește imaginea de intrare în binară.

Metodele de segmentare bazate pe detectarea regiunilor găsesc direct modificări bruște ale valorilor intensității. Astfel de metode se numesc metode de limită. Detectarea marginilor este o problemă fundamentală în analiza imaginilor. Tehnicile de extragere a marginilor sunt utilizate în mod obișnuit pentru a găsi nereguli într-o imagine în tonuri de gri. Detectarea discontinuităților într-o imagine în tonuri de gri este cea mai importantă abordare în detectarea marginilor.

Algoritmi de detectare a marginilor

Limitele obiectelor dintr-o imagine reduc foarte mult cantitatea de date care trebuie procesate, economisind în același timp informatii importante despre obiectele din imagine, forma, dimensiunea, cantitatea acestora. Caracteristica principală Tehnica de detectare a marginilor este capacitatea de a extrage o linie precisă cu o orientare bună. Literatura descrie mulți algoritmi care vă permit să detectați limitele obiectelor, dar nicăieri nu există o descriere a modului de evaluare a rezultatelor procesării. Rezultatele sunt evaluate pur individual și depind de domeniul de aplicare a acestora.

Detectarea marginilor este un instrument fundamental pentru segmentarea imaginii. Astfel de algoritmi convertesc imaginea de intrare într-o imagine cu contururile obiectelor, în principal în tonuri de gri. În procesarea imaginilor, în special în sistemele de viziune computerizată, se iau în considerare modificări importante ale nivelului de luminozitate în imagine, parametrii fizici și geometrici ai obiectului din scenă folosind extragerea conturului. Acesta este un proces fundamental care conturează obiectele, dobândind astfel unele cunoștințe despre imagine. Detectarea marginilor este cea mai populară abordare pentru detectarea discontinuităților semnificative.

O limită este o modificare locală a luminozității unei imagini. Ele se desfășoară de obicei de-a lungul marginii dintre două zone. Bordurile pot fi folosite pentru a obține cunoștințe de bază despre o imagine. Funcțiile lor de achiziție sunt utilizate de algoritmi avansați de viziune pe computer și în domenii precum procesarea imaginilor medicale, biometria și altele asemenea. Detectarea marginilor este o zonă activă de cercetare, deoarece facilitează analiza la nivel înalt a imaginilor. Există trei tipuri de întreruperi în imaginile semiton: punct, linie și chenar. Măștile spațiale pot fi folosite pentru a detecta toate cele trei tipuri de neomogenități.

Literatura tehnică oferă și descrie număr mare algoritmi de identificare a contururilor și limitelor. Această lucrare discută cele mai populare metode. Acestea includ: operatorul Roberts, Sobel, Prewitt, Kirsch, Robinson, algoritmul Canny și algoritmul LoG.

Operator Roberts

Operatorul Roberts de selecție a limitelor a fost introdus de Lawrence Roberts în 1964. Efectuează calcule simple și rapide ale dimensiunii spațiale bidimensionale dintr-o imagine. Această tehnică pune accent pe regiuni cu frecvență spațială mare care corespund adesea marginilor. O imagine semiton este furnizată la intrarea operatorului. Valoarea pixelului imaginii de ieșire în fiecare punct implică o anumită valoare a gradientului spațial al imaginii de intrare în același punct.

Operator Sobel

Operatorul Sobel a fost introdus de Sobel în 1970. Această metodă de detectare a marginilor folosește aproximarea derivată. Acest lucru permite detectarea marginilor acolo unde gradientul este cel mai mare. Această metodă detectează numărul de gradienți dintr-o imagine, evidențiind astfel regiunile cu frecvență spațială mare care corespund limitelor. În general, aceasta a dus la găsirea mărimii absolute estimate a gradientului în fiecare punct din imaginea de intrare. Acest operator constă din două matrice de dimensiunea 3×3. A doua matrice diferă de prima doar prin faptul că este rotită cu 90 de grade. Acesta este foarte asemănător cu operatorul Roberts.

Detectarea limitelor cu această metodă este mult mai simplă din punct de vedere computațional decât metoda Sobel, dar duce la un zgomot mai mare în imaginea rezultată.

Operatorul Prewitt

Detectarea limitelor de către acest operator a fost propusă de Prewitt în 1970. Direcția corectă în acest algoritm a fost de a estima mărimea și orientarea graniței. Chiar dacă detectarea marginilor este o sarcină foarte intensivă, această abordare dă rezultate foarte bune. Acest algoritm se bazează pe utilizarea măștilor 3 cu 3, care iau în considerare 8 direcții posibile, dar direcțiile drepte dau cele mai bune rezultate. Toate măștile de convoluție sunt calculate.

Operatorul Kirsha

Detectarea marginilor prin această metodă a fost introdusă de Kirsch în 1971. Algoritmul se bazează pe utilizarea unei singure mască, care este rotită în opt direcții principale: nord, nord-vest, vest, sud-vest, sud, sud-est, est și nord-est. Măștile arată așa:

Valoarea limită este definită ca valoarea maximă găsită folosind masca. Direcția definită de mască dă valoarea maximă. De exemplu, masca k 0 corespunde unei limite verticale, iar masca k 5 corespunde unei limite diagonale. De asemenea, puteți observa că ultimele patru măști sunt de fapt aceleași cu primele, sunt o imagine în oglindă despre axa centrală a matricei.

Cameramanul lui Robinson

Metoda lui Robinson, introdusă în 1977, este similară cu metoda Kirsch, dar este mai simplu de implementat datorită utilizării coeficienților 0, 1 și 2. Măști al acestui operator simetric față de axa centrală umplută cu zerouri. Este suficient să obțineți rezultatul procesării primelor patru măști, restul se poate obține inversând primele.

Valoarea maximă obținută după aplicarea tuturor celor patru măști pixelului și împrejurimilor acestuia este considerată mărimea gradientului, iar unghiul gradientului poate fi aproximat ca unghiul liniilor cu zerouri din mască care dau răspunsul maxim.

Selectarea conturului folosind metoda Marr-Hildreth

Metoda Marr-Hildreth (1980) este o tehnică de detectare a marginilor în imaginile digitale care detectează curbe continue oriunde sunt vizibile schimbări rapide și bruște ale luminozității unui grup de pixeli. Aceasta este o metodă destul de simplă, funcționează prin convoluția unei imagini cu o funcție LoG sau ca o aproximare rapidă cu DoG. Zerourile din rezultatul procesat corespund contururilor. Algoritmul detectorului de margini constă din următorii pași:

  • estompați imaginea folosind metoda Gaussiană;
  • aplicarea operatorului Laplace la o imagine neclară (de multe ori primii doi pași sunt combinați într-unul singur);
  • Efectuăm un ciclu de calcule și ne uităm la schimbarea semnului în rezultatul rezultat. Dacă semnul s-a schimbat de la negativ la pozitiv și valoarea modificării valorii este mai mare decât un anumit prag specificat, atunci definiți acest punct ca limită;
  • Pentru a obține rezultate mai bune, pasul folosind operatorul Laplace poate fi efectuat prin histerezis, așa cum este implementat în algoritmul Canny.

Selectarea conturului folosind metoda LoG

Algoritmul de extracție a conturului Laplacian-Gauss a fost propus în 1982. Acest algoritm este derivata a doua, definită ca:

Se realizează în două etape. În primul pas, netezește imaginea și apoi calculează funcția Laplace, ceea ce duce la formarea de contururi duble. Definirea contururilor se reduce la găsirea zerourilor la intersecția granițelor duble. Implementarea pe computer a funcției Laplace se realizează de obicei prin următoarea mască:

Laplacianul folosește de obicei pixelul aflat pe partea întunecată sau deschisă a graniței.

Detectorul de limite Canny

Canny edge detector este unul dintre cei mai populari algoritmi de detectare a marginilor. A fost propus pentru prima dată de John Canny în teza sa de master în 1983 și este încă superior multor algoritmi dezvoltați ulterior. Un pas important în acest algoritm este eliminarea zgomotului de pe contururi, care poate afecta semnificativ rezultatul, menținând în același timp limitele cât mai mult posibil. Acest lucru necesită o selecție atentă a valorii de prag atunci când se procesează cu această metodă.

Algoritm:

  • estomparea imaginii originale f(r, c) folosind funcția gaussiană f^(r, c). f^(r, c)=f(r,c)*G(r,c,6);
  • caută un gradient. Limitele sunt marcate acolo unde gradientul capătă valoarea maximă;
  • suprimarea non-maximelor. Doar maximele locale sunt marcate ca limite;
  • limitele rezultate sunt determinate prin suprimarea tuturor muchiilor care nu sunt asociate cu limitele definite.

Spre deosebire de operatorii Roberts și Sobel, algoritmul Canny nu este foarte sensibil la zgomotul imaginii.

Rezultate experimentale

Această secțiune prezintă rezultatele algoritmilor descriși anterior pentru detectarea limitelor obiectelor dintr-o imagine.

Toți algoritmii descriși au fost implementați în mediul software MATLAB R2009a și testați pe o fotografie a universității. Scopul experimentului este de a obține o imagine procesată cu contururi perfect definite. Imaginea originală și rezultatele prelucrării acesteia sunt prezentate în Figura 1.

Figura 1 - Imaginea originală și rezultatul diverșilor algoritmi de extracție a conturului


La analiza rezultatelor obținute au fost relevate următoarele modele: operatorii Roberts, Sobel și Prewitt dau rezultate foarte diferite. Marr-Hildreth, LoG și Canny au găsit contururile obiectului aproape în același mod, Kirsch și Robinson au dat același rezultat. Dar observând rezultatele obținute, putem concluziona că algoritmul Canny face față cu un ordin de mărime mai bine decât alții.

Concluzii

Procesarea imaginilor este un domeniu în creștere rapidă în disciplina viziunii computerizate. Creșterea sa se bazează pe realizări înalte în procesarea digitală a imaginilor, dezvoltarea procesoarelor de calculator și a dispozitivelor de stocare a informațiilor.

În acest articol s-a încercat studierea în practică a metodelor de identificare a contururilor obiectelor pe baza discontinuităților în luminozitatea unei imagini semitonuri. Performanța relativă a fiecăreia dintre metodele prezentate în acest articol a fost studiată folosind instrumentul software MATLAB. Analiza rezultatelor procesării imaginii a arătat că metode precum Marr-Hildreth, LoG și Canny dau rezultate aproape identice. Dar totuși, la procesarea acestei imagini de testare, cele mai bune rezultate pot fi observate după rularea algoritmului Canny, deși în alte condiții o altă metodă poate fi mai bună.

Chiar și ținând cont de faptul că problema detectării marginilor într-o imagine este destul de bine acoperită în literatura tehnică modernă, rămâne totuși o sarcină destul de laborioasă, deoarece detectarea marginilor de înaltă calitate depinde întotdeauna de mulți factori care influențează rezultatul.

Lista literaturii folosite

1. Canny J.F. (1983) Găsirea marginilor și liniilor în imagini, teză de master, MIT AI Lab.
2. Canny J.F. (1986) O abordare computațională a detectării marginilor, IEEE Transaction on Pattern Analysis and Machine Intelligence, 8, pp. 679-714.
3. Courtney P, Thacker N.A. (2001) Caracterizarea performanței în viziunea computerizată: rolul statisticilor în testare și proiectare, capitol în: Imaging and Vision Systems: Theory, Assessment and Applications, Jacques Blanc-Talon și Dan Popescu (eds.), NOVA Science Books.
4. Hanzi Wang (2004) Statistici robuste pentru computer Vision: Model Fitting, Image Segmentation and Visual Motion Analysis, teză de doctorat, Universitatea Monash, Australia.
5. Huber P.J. (1981) Statistici robuste, Wiley New York.
6. Kirsch R. (1971) Determinarea computerizată a structurii constitutive a imaginilor biologice, Computers and Biomedical Research, 4. - P. 315–328.
7. Lakshmi S, Sankaranarayanan V. (2010) Un studiu al tehnicilor de detectare a marginilor pentru abordări de calcul cu segmentare, Tehnici de calcul soft asistate de computer pentru imagistică și aplicații biomedicale. — P. 35-41.
8. Lee K., Meer P. (1998) Robust Adaptive Segmentation of Range Images, IEEE Trans. Pattern Analysis and Machine Intelligence, 20(2). — P. 200-205.
9. Marr D, Hildreth E. (1980) Theory of Edge Detection, Proc. Societatea Regală din Londra, B, 207. - P. 187–217.
10. Marr D. (1982) Vision, Freeman Publishers.
11. Marr P., Doron Mintz. (1991) Robust Regression for Computer Vision: A Review, International Journal of Computer Vision, 6(1). — P. 59-70.
12. Orlando J. Tobias, Rui Seara (2002) Image Segmentation by Histogram Thresholding Using Fuzzy Sets, IEEE Transactions on Image Processing, Vol.11, No.12. - P. 1457-1465.
13. Punam Thakare (2011) A Study of Image Segmentation and Edge Detection Techniques, International Journal on Computer Science and Engineering, Vol. 3, No.2. — P. 899-904.
14. Rafael C., Gonzalez, Richard E. Woods, Steven L. Eddins (2004) Digital Image Processing Using MATLAB, Pearson Education Ptd. Ltd, Singapore.
15. Ramadevi Y. (2010) Segmentarea și recunoașterea obiectelor folosind tehnici de detectare a marginilor, International Journal of Computer Science and Information Technology, Vol. 2, No.6. — P. 153-161.
16. Roberts L. (1965) Machine Perception of 3-D Solids, Optical and Electro-optical Information Processing, MIT Press.
17. Robinson G. (1977) Edge detection by compas gradient masks, Computer graphics and image processing, 6. - P. 492-501.
18. Rousseeuw P. J., Leroy A. (1987) Robust Regression and outlier detection, John Wiley & Sons, New York.
19. Senthilkumaran N., Rajesh R. (2009) Tehnici de detecție a marginilor pentru segmentarea imaginilor - Un studiu asupra abordărilor soft computing, Jurnalul Internațional de Tendințe Recente în Inginerie, Voi. 1, nr. 2. - P. 250-254.
20. Sowmya B., Sheelarani B. (2009) Color Image Segmentation Using Soft Computing Techniques, International Journal of Soft Computing Applications, Issue 4. - P. 69-80.
21. Umesh Sehgal (2011) Tehnici de detectare a marginilor în procesarea digitală a imaginilor folosind Fuzzy Logic, Jurnalul Internațional de Cercetare în IT și Management, Vol.1, Issue 3. - P. 61-66.
22. Yu, X, Bui, T.D. & et al. (1994) Robust Estimation for Range Image Segmentation and Reconstruction, IEEE trans. Pattern Analysis and Machine Intelligence, 16(5). — P. 530-538.

Invenţia se referă la mijloace pentru prelucrarea imaginilor digitale. Rezultatul tehnic este de a crește acuratețea identificării limitelor imaginilor structurate complex datorită formării unui set de imagini filtrate direcțional din imaginea inițială semiton prin procesare locală cu un operator morfologic compus. În metodă, operatorul specificat este format din elemente de formare a structurii liniare cu parametri de orientare diferiți față de rasterul imaginii de lungime egală, fiecare imagine filtrată este obținută prin interacțiunea elementului de formare a structurii liniare al operatorului morfologic compozit cu originalul. imagine, luminozitatea pixelilor din imaginea filtrată se obține prin efectuarea a trei operații morfologice pentru fiecare pixel al interacțiunii imaginii originale a imaginii originale cu un element de formare a structurii liniare. 6 bolnav.

Desene pentru brevetul RF 2510897

Prezenta invenţie se referă la domeniul prelucrării digitale a imaginilor. Segmentarea, adică selectarea zonelor omogene în imaginea digitală originală, este una dintre cele mai importante sarcini în sistemele de viziune computerizată, care sunt utilizate în multe industrii științifice, tehnice și de producție: medicină, metalografie, fotografie aeriană, robotică, defecte. sisteme de detectare, securitate și aplicare a legii și altele.

Imaginile raster reale obținute din matrice CCD ale camerelor video pot conține zone umbrite și supraexpuse. Aceeași imagine poate conține obiecte luminoase pe un fundal întunecat și, dimpotrivă, obiecte întunecate pe un fundal deschis, cu diferite grade de umbrire. Rezultatul este o imagine complex structurată, a cărei împărțire în segmente este o sarcină ambiguă. În acest caz, pentru a îmbunătăți calitatea segmentării, este necesară utilizarea tehnologiilor de selecție a segmentelor bazate pe modelarea proceselor de segmentare implementate în analizatorul vizual uman.

Astăzi sunt multe cunoscute diverse metode segmentare, printre care se numără metode care utilizează informații despre conectivitatea zonelor: zone de creștere, combinarea zonelor după o regulă dată, împărțirea și unirea zonelor, segmentarea pe bazine hidrografice morfologice, aplicații ale metodelor teoriei grafurilor.

Metoda de cultivare a suprafețelor în cea mai simplă implementare a sa [Gonzalez R.S. Prelucrare digitală imagini [Text] / R.S Gonzalez, R.E. - M.: Tehnosfera, 2005. - 1072 p. - ISBN 5-94836-028-8. - P.875] poate fi descris după cum urmează:

În imaginea originală sunt selectate puncte (centre de cristalizare), probabil aparținând zonelor selectate, de exemplu, acestea pot fi puncte cu nivelul maxim de luminozitate;

În continuare, din aceste puncte începe creșterea regiunilor, adică îmbinarea punctelor învecinate cu punctele deja existente ale regiunii, în timp ce se folosește un anumit criteriu al proximității lor, de exemplu, o diferență de luminozitate specificată de un anumit valoarea pragului;

Oprirea creșterii zonelor pe baza unei anumite condiții, de exemplu, abaterea maximă a luminozității punctelor noi din zonă de la nivelul de luminozitate al centrului de cristalizare sau aria maximă a segmentelor.

Dezavantajul acestei metode este că pixelii aceluiași segment pot avea niveluri de luminozitate, a căror diferență o depășește pe cea specificată a priori, iar în alte fragmente ale aceleiași imagini poate apărea situația inversă, când se vor identifica pixeli din segmente diferite. ca pixeli ai aceluiași segment, deoarece diferențele lor de niveluri de luminozitate nu depășesc valoarea specificată a priori.

O altă metodă, apropiată de cea anterioară, este algoritmul de fuziune a regiunilor / M.Baatz, A.Schape. - Jurnal de Fotogrammetrie și Teledetecție. Volumul 58. Numărul 3-4. - Herbert Wichmann Verlag, 2004, p. 239-258]. Se bazează pe ideea că pixelii imaginii originale sunt în esență zone omogene, dar în același timp au dimensiuni la fel de minime. În acest caz, metoda de segmentare trebuie să realizeze îmbinarea regiunilor învecinate care sunt cele mai apropiate într-un anumit parametru (de exemplu, culoare sau textură), determinată pe baza analizei distanței (eterogenitate, o funcție a costului de îmbinare), până când este satisfăcută (sau încălcată). ) o anumită condiție specificată (de exemplu, cu privire la dimensiunea segmentelor sau numărul acestora). Pentru a acestui algoritm Problema determinării centrelor de cristalizare dispare complet, dar problema determinării momentului finalizării procesului de fuziune devine deosebit de urgentă. În această implementare, ca și în multe altele, acest lucru se realizează folosind restricții privind dimensiunea și numărul de segmente, ceea ce reduce foarte mult flexibilitatea metodei.

Informațiile de textura sunt adesea folosite la creșterea și îmbinarea zonelor / Shaw M.; Bhaskar R.; Ugarriza L.G. ; Sabre E.; Amuso V.]. Cu toate acestea, utilizarea informațiilor privind textura în timpul creșterii este limitată de faptul că, pentru analiza texturii (de obicei, calculul diferitelor caracteristici descrise în statisticile matematice), de regulă, este deja necesar să existe o zonă mai mare de un pixel, care este imposibil în timpul creșterii (adăugarea unui singur pixel în zonă).

Aproape de cea afirmată este metoda de segmentare / Mantao X., Qiyong G., Hongzhi L., Jiwu Z.], care constă în mod fundamental din două etape: creșterea și fuziunea ulterioară a segmentelor. Regiunile în creștere în acest caz sunt utilizate pentru a efectua suprasegmentarea inițială, iar fuzionarea regiunilor, bazată pe metodele teoriei grafurilor, urmărește atingerea stării optime finale de segmentare. Determinarea centrilor de cristalizare în această metodă se întâmplă în modul automat pe baza unei imagini gradient obtinuta din cea originala folosind operatorul masca Kirsch. Utilizarea unei imagini gradient aici face posibilă rezolvarea destul de universală a problemei detectării automate a centrelor de cristalizare, deoarece minimele funcției de imagine gradient vor corespunde punctelor cu o vecinătate maxim omogenă (centre potențiale de creștere a segmentelor). Cu toate acestea, dezavantajul utilizării operatorului Kirsch în această situație este limitarea sa spațială (se analizează vecinătatea de doar 3x3 pixeli), în timp ce la căutarea centrelor de cristalizare ar fi util să se examineze vecinătatea unui punct la scară mare pentru a putea luați în considerare modificările de joasă frecvență ale funcției de luminozitate a imaginii și, astfel, efectuați o determinare ulterioară mai precisă a centrelor de creștere. Abordarea este lipsită de acest dezavantaj [Minchenkov M.V. Un algoritm pentru segmentarea automată a imaginilor raster bazat pe creșterea clusterelor de la maximele valorii R [Resursa electronică] / M.V. - Proceedings of the Graphicon 2004 Conference - Mod de acces: /2004/ Proceedings /Technical_ru/sl.pdf. - p.2], bazat pe un detector Rayleigh al limitelor obiectelor de zonă, care utilizează zone de analiză de diferite dimensiuni.

Dezavantajul comun al tuturor metodele de mai sus este o regulă strictă pentru finalizarea procesului de îmbinare, pe baza numărului de segmente din imagine sau a dimensiunilor acestora. Această condiție reduce drastic versatilitatea metodei pentru o anumită configurație.

Izolarea contururilor obiectelor pe imagini raster semitonuri se poate face împreună cu selectarea obiectelor în sine. Pentru aceasta, metodele de segmentare a pragului sunt de obicei utilizate pe baza valorii medii a luminozității pixelului, de exemplu [brevet RF nr. 2325044 „Metoda gradient pentru identificarea contururilor obiectului pe o matrice semitonală bitmap»] se propune o metodă de gradient de evidențiere a contururilor obiectelor pe o matrice de imagine raster semiton, care constă în calcularea normei sau pătratului normei gradientului modificării luminozității acestora pentru toți pixelii imaginii raster, apoi evidențierea toate elementele de pe o nouă matrice monocromă alb-negru în negru pe fundal alb, în ​​care valoarea normei sau a normei pătrate a gradientului este mai mare decât valoarea de prag, iar configurațiile conectate ale elementelor negre sunt luate ca contururile obiectelor pe o matrice monocromă, pentru metoda aleasă de calcul a gradientului se determină experimental coeficientul, apoi se calculează valoarea de prag a normei pătrate a gradientului ca produs al acestui coeficient cu suma pătratelor mediei valorile modulelor de modificare a luminozității pixelilor învecinați în rânduri și coloane, ale căror valori depășesc nivelurile medii generale ale modificărilor diferite de zero în rânduri și, respectiv, coloane, și între configurațiile conectate ale elementelor negre pe o matrice monocromă , configurațiile în care numărul de elemente de intrare este mai mic de 5 sunt imediat eliminate 7 elemente, pentru configurațiile rămase se calculează gradul mediu de vecinătate - câtul de împărțire a sumei între toate elementele configurației elementelor adiacente acesteia la suma elementelor din configurație, iar acele configurații cu un grad mediu de vecinătate mai mic de 3 sunt aruncate, iar cele rămase sunt acceptate ca obiecte de contur dorite.

Dezavantajele acestei metode includ prea mulți parametri ajustabili empiric, ceea ce nu permite obținerea unor reguli de decizie potrivite pentru imagini din aceeași clasă obținute în condiții diferite sau la niveluri de zgomot diferite. Cu segmente neclare, este aproape imposibil să selectați astfel de parametri.

Cea mai apropiată de metoda revendicată este metoda de procesare a imaginii conform brevetului US N 5351305, publicat pe 27 septembrie 1994, MKI G06K 9/40, în care o multitudine de imagini filtrate direcţional sunt obţinute din imaginea originală prin filtrare în frecvenţă. Imaginea de ieșire este formată prin selectarea fiecărui element de imagine fie dintr-una dintre imaginile filtrate direcțional, fie din imaginea originală, în funcție de prezența sau absența unei limite de contrast adiacent elementului selectat (procesat) al imaginii originale. În acest caz, prezența unei limite de contrast pentru un element de imagine selectat este determinată prin calcularea vectorului propriu și comparând lungimea acestuia cu o valoare de prag predefinită. Dacă nu există o limită, elementul corespunzător al imaginii de ieșire este luat egal cu elementul corespunzător al imaginii de intrare. Dacă există o limită, elementul corespunzător al imaginii de ieșire este considerat a fi egal cu elementul corespunzător al imaginii filtrate direcțional în care direcția de filtrare este cea mai apropiată de direcția de delimitare definită.

În metoda de procesare a imaginii descrisă mai sus, la determinarea limitei imaginii, este posibil ca lungimea vectorului propriu pentru elementele de imagine învecinate să se modifice în apropierea unei valori de prag. În acest caz, poate apărea o amplificare selectivă a zgomotului, cauzată de eșantionarea pixelilor adiacenți din imagini diferite (originale și filtrate direcțional), rezultând o calitate a imaginii de ieșire degradată.

În plus, imaginile sursă cu niveluri diferite de zgomot necesită valori de prag semnificativ diferite, în timp ce această metodă nu prevede modificări adaptive ale acestei valori de prag, ceea ce duce la imposibilitatea procesării de înaltă calitate a imaginilor cu niveluri diferite de zgomot.

În prezența unei granițe, elementele imaginii de ieșire sunt eșantionate din doar una dintre imaginile filtrate direcțional, ceea ce duce la suprimarea completă a tuturor detaliilor imaginii sursă care diferă ca direcție față de limita detectată, chiar și în cazul în care aceste detalii sunt clar vizibile în imaginea sursă.

Obiectivul tehnic al metodei propuse este de a crește acuratețea identificării limitelor segmentelor de imagini structurate complex și, ca urmare, de a îmbunătăți calitatea segmentării (o mai bună corespondență cu percepția umană a imaginii), precum și de a crește gradul de automatizare a procesului de analiză și clasificare a segmentelor de imagine.

Sarcina este realizată prin crearea unui set de imagini filtrate direcțional din imaginea inițială de semitonuri prin procesare locală cu un operator morfologic compus. Imaginea de ieșire este formată din imagini filtrate obținute prin prelucrarea imaginii originale cu un operator morfologic compus. În acest caz, un operator morfologic compozit este format din elemente formatoare de structură liniare de lungime egală V, dar cu parametri de orientare diferiți în raport cu rasterul imaginii. Fiecare imagine filtrată este obţinută prin interacţiunea elementului formator de structură liniară al operatorului morfologic compozit cu imaginea originală F. Luminozitatea pixelilor din imaginea filtrată se obţine după cum urmează. Când plasează centrul elementului de formare a structurii liniare la pixelul p cu coordonatele ij ale imaginii originale F, elementul de formare a structurii liniare B p () selectează trei subseturi din setul de pixeli ai imaginii F:

1) ;

unde V>q,s>1; s l,k>1; k>l.

După definirea celor trei subseturi, se calculează valoarea totală a luminozității pixelilor din subseturile A1:S1 și A2:S2. Apoi se calculează diferența D=S1-S2. Noua valoare a luminozității pixelilor este determinată de formule recurente, în setul A2: lk = lk +D și în setul A3: qs = qs -D.

După ce masca operatorului morfologic compozit trece toți pixelii imaginii originale F, adică după determinarea imaginilor filtrate pentru toate elementele de formare a structurii liniare ale operatorului morfologic compozit, imaginea finală G este determinată prin însumarea luminozității lui pixelii imaginilor filtrate cu aceleași coordonate, iar luminozitatea minimă a pixelului imaginii finale este determinată Gmin și luminozitatea maximă a imaginii finale Gmax și deplasați și normalizați-o conform formulei

.

Figura 1 prezintă o diagramă a algoritmului care implementează metoda prezentată.

Figura 2 prezintă o continuare a diagramei algoritmului care implementează metoda prezentată.

Figura 3 prezintă un exemplu de element care formează o structură liniară a unui operator morfologic compozit B( , V) cu =1, V=3, =3.

Figura 4 prezintă un exemplu de procesare a unei imagini binare cu un operator morfologic compus prezentat în Figura 3 conform diagramei algoritmice prezentate în Figurile 1 și Figura 2.

Figura 5 prezintă un exemplu de procesare a unei imagini binare cu un operator morfologic compus prezentat în Figura 3 conform diagramei algoritmice prezentate în Figurile 1 și Figura 2.

FIG. 6 prezintă un exemplu de procesare a imaginilor prezentate în FIG. 4 utilizând detectorul Prewitt.

Metoda se realizează conform diagramei algoritmice prezentate în Fig.1 și Fig.2. În blocul 1, pixelii imaginii raster semitonuri originale F sunt introduși în computer, dimensiunea verticală este N, iar dimensiunea orizontală este M. În blocul 2, se formează un operator morfologic compozit, incluzând elemente de formare a structurii liniare ale lungimea V. Blocul 3 organizează un ciclu în funcție de elementele structurale ale operatorului morfologic compozit . Ca rezultat al acestui ciclu, obținem imagini filtrate direcțional.

Figura 3 prezintă un exemplu de formare a unui operator morfologic compus. Pe acesta este evidențiat în unități un element structurant al operatorului morfologic compozit, corespunzător direcției de filtrare =1 pentru V=3 și =3.

Pentru fiecare valoare din blocurile 4-19, se determină o imagine F(), filtrată după direcție. Esența filtrării direcționale este următoarea. Când plasează centrul elementului de formare a structurii liniare la pixelul p cu coordonatele ij ale imaginii originale F, elementul de formare a structurii liniare B p () selectează trei subseturi din setul de pixeli F:

1) ;

unde V>q,s>1; s l,k>1; k>l.

Fiecare operator morfologic compus produce o triadă de seturi A1, A2 și A3 pentru fiecare valoare a parametrului și pixelul p. Submulțimea A1 este o submulțime de elemente ale mulțimii F care se află pe elementul care formează structura B(). Submulțimea A2 este o submulțime de elemente ale mulțimii F care se află deasupra sau la stânga elementului care formează structura B(). Submulțimea A3 este o submulțime de elemente ale mulțimii F care se află sub sau în dreapta elementului care formează structura B(). Considerăm că există posibilitatea ca fiecare element care formează structura al unui operator morfologic compozit să fie un element al graniței segmentului. Apoi, luminozitatea medie a pixelilor de pe ambele părți ale graniței segmentului ar trebui să difere una de cealaltă. Comparația acestor luminozități poate confirma sau infirma ipoteza. Elementele de imagine F, care se află pe ambele părți ale graniței segmentului, definesc subseturile A2 și A3.

În blocurile 6-9, se determină suma S1 a luminozității pixelilor submulțimii A2 pentru elementul de formare a structurii liniare B p (). În acest caz, parametrii ciclurilor k și l din blocurile 7 și 8 iau următoarele valori, în funcție de parametrul pixelului cu coordonatele ij:

0: k=i-int(V/2), i-1; l=j-int(V/2), j-int(V/2)+V-1;

1: k=i-int(V/2), i+int(V/2)-1; l=j-int(V/2), j+int(V/2)+V-1-k;

2: k=i-int(V/2), i+int(V/2); l=j-int(V/2), j-1;

3: k=i-int(V/2)-1, i+int(V/2); l=k-1, j+int(V/2)-1.

În blocurile 10-12, suma S2 a luminozităților pixelilor din setul A3 este determinată pentru elementul de formare a structurii liniare B p (). În acest caz, parametrii ciclurilor s și q din blocurile 10 și 11 iau următoarele valori, în funcție de parametrul pixelului cu coordonatele ij:

0: s=i-1, i+int(V/2); q=j-int(V/2), j-int(V/2)+V-1; j+int(V/2);

3: s=i-int(V/2), i+int(V/2); q=j-int(V/2)-1, k-1.

În blocul 13, se calculează parametrul D=S1-S2, care determină cât de semnificativă este diferența de luminozitate a pixelilor setului A2 și setului A3. Pentru a acumula această semnificație, parametrul D este adăugat la luminozitatea pixelilor setului A2, iar parametrul D este scăzut din luminozitatea pixelilor setului A3. Aceste proceduri sunt implementate în blocurile 14-16 și 17-19. respectiv.

În blocurile 20-26, se determină imaginea de ieșire G Pentru a face acest lucru, se însumează luminozitatea în pixeli cu aceleași coordonate din imaginile filtrate rezultate (blocurile 20-23). Elementele maxime Gmax și minime Gmin ale imaginii rezultate sunt determinate și apoi deplasate și normalizate conform formulei

.

Procesul de procesare a imaginilor de testare folosind metoda propusă este ilustrat în Figurile 4-6. Figura 4a prezintă o imagine binară de test care are o limită clară de segmente, cu un spectru situat în regiunea frecvențelor spațiale inferioare. Figura 4b prezintă această imagine după prelucrare cu un operator morfologic compozit, implementat conform algoritmului din Figurile 1 și Figura 2 și cu elementele care formează structura prezentate în Figura 3.

Figura 5a prezintă o imagine binară de test care are o limită clară de segmente, cu un spectru situat în regiunea frecvențelor spațiale înalte. Figura 5b prezintă această imagine după prelucrare cu un operator morfologic compozit, implementat conform algoritmului din Figurile 1 și Figura 2 și cu elementele de formare a structurii prezentate în Figura 3.

Să realizăm o evaluare comparativă la nivel de expert a eficienței detectării marginilor de către operatorul morfologic compozit propus și operatorul bazat pe detectorul de margini Prewitt. FIG. 6a prezintă imaginea (FIG. 4a) obţinută după ce a fost procesată de detectorul de margine Prewitt, iar FIG.

Imaginea de testare din Fig. 4a se referă la imagini al căror spectru se află în regiunea frecvențelor spațiale inferioare. Imaginea de testare din Fig. 5a se referă la imagini al căror spectru se află în regiunea frecvențelor spațiale înalte. Astfel, putem obține caracteristici comparative ale procesării imaginii cu diferite spectre spațiale.

La evaluarea expertă a calității segmentării, s-a luat în considerare intervalul dinamic dintre luminozitatea medie a pixelilor imaginii originale (fondul) și luminozitatea medie a pixelilor la limita reală a segmentului din imaginile procesate. S-a presupus că cu cât acest interval dinamic este mai mare, cu atât procesul de segmentare este mai rezistent la influența interferenței.

Analiza rezultatelor experimentale la prelucrarea imaginilor de test folosind operatorul morfologic propus a arătat că limitele segmentelor au forma unei „pălărie mexicană”, indiferent de frecvențele spațiale pe care le ocupă imaginea, ceea ce mărește semnificativ intervalul dinamic la limitele segmentul și astfel crește imunitatea la zgomot a procesului de segmentare.

FORMULA INVENŢIEI

O metodă de segmentare a imaginilor de semitonuri raster structurate complex, bazată pe operatori morfologici compuși, care constă în faptul că din imaginea semitonală inițială, prin procesare locală cu un operator morfologic compus, se formează un set de imagini, filtrate în direcție și ieșirea imaginea este obtinuta din imagini filtrate, caracterizata prin aceea ca operatorul morfologic compus format din elemente formatoare de structura liniara cu parametri de orientare diferiti fata de rasterul imaginii de lungime egala V și fiecare imagine filtrată este obținută prin interacțiunea elementului de formare a structurii liniare al operatorului morfologic compozit cu imaginea originală F, în care luminozitatea pixelilor din imaginea filtrată este obţinută prin efectuarea pentru fiecare pixel p imaginea originală F trei operații morfologice de interacțiune a imaginii originale F cu un element liniar formator de structură B p (), în urma căruia se obțin trei submulțimi

1) ;

unde V>q , s>1; s l,k>1; k>l; după ce se determină valoarea luminozității totale a pixelilor din subseturile A1: S1 și A2: S2, apoi calculați diferența D=S1-S2, noua valoare a luminozității pixelului este determinată folosind formule recurente în mulțimea A2: f lk =f lk +D și în mulțimea AS: f qs =f qs -D, după care se procedează la determinarea următoarelor trei subseturi din următorul pixel p din imaginea originală, după determinarea imaginilor filtrate pentru toate elementele liniare formatoare de structură ale operatorului morfologic compozit, imaginea finală G se determină prin însumarea luminozității pixelilor imaginilor filtrate cu aceleași coordonate, a luminozității minime a imaginii finale. pixelii imaginii Gmin și luminozitatea maximă a imaginii finale Gmax sunt determinate și este deplasată și normalizată conform formulei

Sistemele de detectare a marginilor neliniare folosesc combinații neliniare de valori ale luminozității pixelilor pentru a oferi contrast înainte de limita de prag. Majoritatea metodelor limitează procesarea la o fereastră de dimensiune sau .

Roberts a propus următoarea operație neliniară simplă de diferențiere discretă bidimensională pentru a contrasta și a evidenția diferențele:

.(17.4.10)

O altă operație de diferențiere spațială, care necesită mai puține calcule, este definită de formulă

Se poate arăta cu ușurință că

Notând care dintre cele patru elemente de imagine situate în apropierea punctului detectat care are cea mai mare valoare a luminozității, se pot obține informații despre orientarea aproximativă a diferenței. Orez. Figura 17.4.8 ilustrează funcționarea operatorilor Roberts.


Orez. 17.4.8. Exemple de identificare a diferențelor folosind detectoare Roberts.

Sobel a propus utilizarea unui operator neliniar cu o fereastră de elemente pentru contrast. În fig. Figura 17.4.9 prezintă denumirile elementelor ferestrei pe care le-a folosit. Pentru a contrasta diferențele, se calculează valoarea

, (17.4.13a)

Valorile sunt luminozitatea elementelor ferestrei prezentate în Fig. 17.4.9. Rezultatele detectării diferențelor utilizând operatorul Sobel sunt prezentate în Fig. 17.4.10.

Un alt operator neliniar cu aceeași fereastră de elemente pentru diferențe contrastante a fost propus de Kirsch.

Orez. 17.4.9. Desemnarea elementelor pentru operatori pentru selectarea diferențelor cu o fereastră de dimensiune .

Acest operator este definit de următoarea expresie:

, (17.4.14a)

, (17.4.14b)

Indicii termenilor sunt calculați modulo 8. În esență, operatorul Kirsch oferă valoarea maximă a gradientului de direcție într-un anumit punct al imaginii fără a lua în considerare valoarea lui . Exemple de detectare a diferențelor folosind operatorul Kirsch sunt prezentate în Fig. 17.4.11.

Wallis a propus o metodă neliniară de detectare a marginilor bazată pe procesarea imaginilor homomorfe. Conform acestei metode, un punct este pe margine dacă valoarea logaritmului luminozității în acest punct depășește valoarea medie a logaritmilor luminozității celor mai apropiate patru elemente învecinate cu o valoare fixă. Elementul de imagine de contrast este definit ca

sau, echivalent,

. (17.4.15b)

Compararea cu valorile pragului superior și inferior este echivalentă cu compararea fracției din paranteze de expresie (17.4.156) cu un prag modificat. Prin urmare, nu este necesar să se calculeze exact valorile logaritmului. Principalul avantaj al detectorului de margine logaritmică, pe lângă ușurința de calcul, este că nu este sensibil la schimbările multiplicative ale nivelului de luminozitate. Orez. 17.4.12 ilustrează funcționarea unui detector de margine logaritmică.

Orez. 17.4.10. Exemple de identificare a diferențelor folosind operatorul Sobel.

Orez. 17.4.11. Exemple de identificare a diferențelor folosind operatorul Kirsch.

Metoda contrastului logaritmic, definită prin expresia (17.4.15), poate fi considerată ca contrast liniar folosind operatorul Laplace (17.4.5a) al unei imagini ale cărei niveluri ale elementelor sunt egale cu logaritmii de luminozitate. Alte metode de contrast pot fi, de asemenea, reprezentate cu ușurință ca o secvență de operații neliniare element cu element cu contrast liniar suplimentar al diferențelor și limitarea pragului.

Orez. 17.4.12. Exemple de identificare a diferențelor folosind operatorul Laplace logaritmic.

Rosenfeld a dezvoltat o metodă neliniară pentru creșterea contrastului și evidențierea diferențelor, bazată pe calcularea produsului unui set de anumite mărimi. Această metodă utilizează un operator de mediere unidimensională rând cu rând. Media curentă

unde și este un număr întreg, calculat pentru fiecare element de imagine. Această operație se efectuează pt până la o anumită limită superioară dorită. Apoi, pentru fiecare element de imagine, se calculează produsul

Este clar că factorii corespunzători mediei de ordin superior indică limite destul de largi pentru localizarea diferenței și produc o anumită suprimare a zgomotului, în timp ce factorii de mediere de ordin inferior localizează diferența mai precis, dar, în același timp, măștile sunt mult mai mari. mai sensibil la zgomot. În același timp, se poate presupune că produsul mediilor de diferite ordine ar trebui să asigure detectarea și localizarea fiabilă a diferențelor adevărate. Rațiunea lui Rosenfeld pentru această ipoteză este după cum urmează.

Orez. 17.4.13. Exemple de constrângere convențională de prag și o constrângere cu suprimare de către vecinii dominanti pentru cazul operatorului Sobel: a - constrângere de prag convențională; b - secțiune mărită a imaginii a, care conține țeava pistolului; d - aceeași zonă cu un coeficient de suprimare egal cu 1,5; d - aceeași zonă cu un coeficient de suprimare egal cu 1,2.

Mărimea tinde să detecteze și să localizeze cu precizie diferențele majore în timp ce suprimă zgomotul. Acest lucru se poate explica prin faptul că produsul este mare doar atunci când toți factorii sunt mari și, pe măsură ce ne îndepărtăm de punctul de scădere, factorii cu indici mici scad mai întâi, iar apoi cei cu indici mari.

În plus, Rosenfeld a propus o procedură de prag neliniară pentru a izola diferențele mari, distincte, care sunt înconjurate de altele mai mici. Această procedură, pe care o vom numi în continuare „suprimarea de către vecinii dominanti”, este efectuată prin scanarea câmpului de diferențe contrastante cu o fereastră mică. Valoarea din centrul ferestrei este suprimată (setată la zero) ori de câte ori nu este cea mai mare dintre toate mostrele din acea fereastră. Apoi se efectuează pragurile normale. O altă variantă a acestui tratament este de a permite suprimarea numai dacă există elemente în fereastră ale căror valori sunt mult mai mari decât valorile lui . Suprimarea vecinului dominant, urmată de algoritmul de prag, este destul de eficientă la detectarea marginilor atunci când este combinată cu o metodă de contrast care oferă o oarecare netezire a zgomotului. În fig. 17.4.13 oferă exemple care ilustrează funcționarea algoritmului de suprimare de către vecinii dominanti cu limitarea ulterioară a pragului.

Pentru imaginile discrete, calculul derivatelor parțiale se reduce la calcularea diferenței de luminozitate a pixelilor vecini în diferite moduri, adică, de fapt, la filtrarea spațială. elemente individualeși măsura omogenității, care determină asemănarea elementelor înrudite între ele. Elementele pot fi fie puncte individuale, fie agregate ale acestora, unite după principiul proximității oricăror proprietăți. În acest din urmă caz, segmentarea unei imagini complexe se transformă într-un proces ierarhic. Dacă luminozitatea este selectată ca caracteristică a omogenității, atunci pentru o imagine discretă, pixelii conectați care au aceeași luminozitate sau similară sunt grupați într-o zonă omogenă. În acest din urmă caz, rezultatul segmentării va fi determinat de alegerea nivelului pragului de proximitate. Pentru imaginile binare, condiția de proximitate în luminozitate este banală și decizia dacă un pixel aparține unui segment se face pe baza analizei conectivității.

Conceptul de „conectare” a pixelilor specifică o regulă formală care determină ce pixeli sunt considerați învecinați. Cel mai adesea, pentru fiecare pixel, fie o zonă de patru pixeli adiacente acestuia într-un rând și coloană, fie o zonă de opt pixeli cei mai apropiați, inclusiv pixeli diagonali dintr-un cartier de 3 ´ 3, este considerată conectată, deși uneori 73 și altele mai complexe sunt folosite definiții ale conectivității. Formal, un set de pixeli P care formează un segment se numește opt-conectați dacă între oricare dintre două elemente a și b există o succesiune de elemente (ek О P)k = 0,...,K astfel încât Fig. 7.1. Definiția e0 = a; eK = b și pentru orice k, 0

Măștile de busolă Kirsch sunt încă un alt tip de mască derivată care sunt utilizate pentru detectarea marginilor. Acest operator este cunoscut și sub numele de mască de direcție. În acest operator luăm o mască și o rotim în toate cele opt direcții ale busolei pentru a obține marginile celor opt direcții. Vom folosi OpenCV funcţie filtru 2D pentru a aplica operatorul Kirsch la imagini. Poate fi găsit sub Imgproc

pachet. Sintaxa sa este dată mai jos −

Filter2D(src, dst, depth, kernel, anchor, delta, BORDER_DEFAULT);

Argumentele funcției sunt descrise mai jos − Sr.Nr.
1

Argument

2

Este imaginea sursă.

3

Este imaginea destinației.

4

Este adâncimea dst. O valoare negativă (cum ar fi -1) indică faptul că adâncimea este aceeași cu sursa.

5

Este nucleul care trebuie scanat prin imagine.

6

Este poziția ancorei în raport cu miezul acesteia. Punctul de locație (-1, -1) indică centrul în mod implicit.

7

Este o valoare care trebuie adăugată fiecărui pixel în timpul convoluției. Implicit este 0.

BORDER_DEFAULT

În afară de metoda filter2D(), există și alte metode oferite de clasa Imgproc. Sunt descrise pe scurt −

Argumentele funcției sunt descrise mai jos − Metodă și descriere
1

cvtColor(Mat src, Mat dst, cod int, int dstCn)

Convertește o imagine dintr-un spațiu de culoare în altul.

2

dilate (Mat src, Mat dst, Mat kernel)

Dilată o imagine folosind un element structurant specific.

3

equalizeHist(Mat src, Mat dst)

Egalizează histograma unei imagini în tonuri de gri.

4

filter2D(Mat src, Mat dst, int depth, Mat kernel, Point anchor, double delta)

Conduce o imagine cu nucleul.

5

GaussianBlur(Mat src, Mat dst, Size ksize, double sigmaX)

Estompează o imagine folosind un filtru gaussian.

6

integral (Mat src, Mat sum)

Calculează integrala unei imagini.

Exemplu

Următorul exemplu demonstrează folosirea clasei Imgproc pentru a aplica operatorul Kirsch la o imagine în tonuri de gri.

Import org.opencv.core.Core; import org.opencv.core.CvType; import org.opencv.core.Mat; import org.opencv.highgui.Highgui; import org.opencv.imgproc.Imgproc; convoluție publică de clasă ( public static void main(String args) ( încercați ( int kernelSize = 9; System.loadLibrary(Core.NATIVE_LIBRARY_NAME); Mat source = Highgui.imread("grayscale.jpg", Highgui.CV_LOAD_IMAGE_GRAYSCALE); Mat destination = new Mat(source.rows(),source.cols(),source.type()); Mat kernel = new Mat(kernelSize,kernelSize, CvType.CV_32F) ( ( put(0,0,-3); put( 0,1,-3; put(1,2,-3); ; Imgproc.filter2D(source, destination, -1, kernel destination ) catch (Excepție e) ( System.out.println("Eroare: " + e.getMessage()); ) );