6. ANALIZA IMAGINILOR DIGITALE

 

 

O imagine este o functie de intensitatea luminoasa, f(x,y) unde f este luminozitatea unui punct (x,y) iar x si y reprezinta coordonatele spatiale ale elementului imaginii, (prescurtat, în lb. engleza, "pixel = picture element"). Prin definitie se alege originea imaginii, cu coordonatele (0,0), în coltul stânga sus al imaginii.

In analiza imaginilor digitale, un dispozitiv de achizitie converteste imaginea într-un numar discret de pixeli. Fiecarui (x,y) i se atribuie o valoare a culorii si luminozitatii. Stocarea datelor se face în matrici de tip întreg.

O imagine digitala are urmatoarele proprietati:

 Rezolutia unei imagini este numarul de linii si coloane al matricii în care este stocata imaginea.

 Definitia unei imagini (engl. "pixel depth") indica numarul de culori sau nuante de gri care pot fi distinse într-o imagine. Definitia mai înseamna numarul de biti folositi pentru codificarea intensitatii fiecarui pixel. Pentru o definitie n, un pixel poate lua 2n valori diferite. Spre exemplu, pentru n=8 un pixel poate lua 256 valori diferite, în domeniul 0,255, pentru n=16 un pixel poate lua 65536 valori diferite în domeniul 0, 65535 sau -32768, 32767.

 Numarul de plane ale unei imagini este numarul de matrici care compun imaginea. O imagine în niveluri de gri sau pseudo-color este compusa dintr-un singur plan, pe când o imagine color (engl. "true color") este compusa din trei plane (rosu, verde si albastru, RGB (engl. "Red, Green, Blue" )).

In imaginile cu nuante de gri, cele trei valori ale unui pixel, atribuite culorilor rosu, verde, albastru, sunt combinate pentru a conduce la o singura valoare. Aceasta valoare este reconvertita în rosu/vesde/albastru la afisajul pe monitor. Acesta conversie este efectuata de o tabela de echivalare a nuantelor de gri cu culorile, numita paleta sau, în limba engleza, "Look Up Table" (LUT).

In cazul imaginilor în culori (true color) intensitatile pentru culorile de baza rosu/verde/albastru sunt codificate de trei valori diferite. Imaginea este o combinatie a trei matrici de pixeli corespunzatoare celor trei componente.

Exista deci, patru tipuri de imagine:

 alb-negru (b/w), cu un bit per pixel

 în nuante de gri, 8 sau 16 biti per pixel

 color (32 biti, câte 8 pentru fiecare culoare de baza plus înca opt pentru asa numitul canal alfa)

 complexe.

Pentru toate tipurile de imagini exista mai multe formate de stocare, dupa firma sau asociatia profesionala care le-a definit (TIFF, GIF, JPG, BMP, TGA, DICOM, etc.). Pentru primele cinci tipuri, interconversia se poate face convenabil folosind programul MicroSoft-Photoeditor.

Tipul alb/negru este îndeosebi util pentru grafice. O imagine în nuante de gri poate fi transformata într-o imagine alb-negru prin operatia de prag (engl. "threshold") în care se ia ca referinta o anumita nuanta. Valorilor mai mari decât valoarea de prag le este atribuita valoarea 1 iar celorlalte valoarea 0.

Imaginile complexe constau din doua plane, unul real si altul complex si provin din transformarea Fourier a imaginilor în nuante de gri. Pentru imaginile complexe avem doua reprezentari echivalente:

 parte reala + parte imaginara sau

 amplitudine + faza.

Pentru o rezolutie identica, o imagine în culori ocupa de 4 ori volumul unei imagini în nuante de gri pe 8 biti, iar o imagine complexa de opt ori volumul unei imagini în nuante de gri.

Un fisier imagine este compus dintr-un antet (engl. "header") urmat de valorile pentru fiecare pixel. In functie de formatul fisierului, antetul contine informatii despre rezolutia pe orizontala si verticala, definitia imaginii calibrarea fizica si paleta de culori originala.

Cele mai multe functii de analiza si procesare se aplica imaginilor în nuante de gri pe 8 biti. Imaginile color pot fi procesate prin manipularea individuala a fiecarui plan (componenta de culoare).

Imaginile color pot fi descrise în trei moduri diferite dar echivalente:

 RGB (engl. "Red, Green, Blue") adica prin culorile de baza (rosu/verde/albastru),

 HSV (engl. "Hue, Saturation, Value") adica prin nuanta, saturatie si valoare,

 HSL (engl. "Hue, Saturation, Lightness") adica nuanta, saturatie, luminozitate.

Fig. 6.1. Vecinatatea 3x3 a unui pixel.

In fig. 6.1. am definit vecinatatea unui pixel dintr-o imagine ca pe o matrici sau un set de matrici, care aparent descriu un cadru dreptunghiular. Totusi, unii algoritmi de procesare pot prelucra vecinatatea hexagonala a unui pixel. In cazul vecinatatii hexagonale, fiecare vecin se afla la o distanta d de pixelul central.

Notiunea de vecinatate (cadru) a unui pixel este importanta pentru functiile de procesare numite operatii de vecinatate, care permit alterarea valorii unui pixel în functie de valorile vecinilor. Aceste operatii includ filtre spatiale, care altereaza intensitatea unui pixel relativ la variatiile de intensitate ale vecinilor precum si transformari morfologice, care extrag si altereaza structura unui obiect al imaginii.

VI.1. UTILIZAREA PALETEI

 

 

Folosind paleta de culori, se pot produce reprezentari vizuale diferite ale unei imagini fara alterarea valorilor pixelului. Paletele pot fi folosite pentru generarea unor efecte cum ar fi negativarea sau colorarea artificiala. In ultimul caz, paletele sunt folositoare pentru detalierea constituentelor particulare ale unei imagini în care numarul de culori este limitat.

Studiul imaginilor folosind palete diferite este important în evidentierea regiunilor cu intensitate speciala, identificarea variatiilor lente sau abrupte de intensitate precum si a detaliilor care altfel ar fi pierdute în imaginea cu nuante de gri.

In cazul rezolutiei pe 8 biti, sa atribuim valoarea 0 pentru negru si 255 pentru alb. Negativul se obtine atribuind 255 pentru negru si 0 pentru alb. Gradatia culorilor se poate face folosind gradatii liniare sau neliniare de exemplu pornind de la rosu spre albastru. Alte palete pot reflecta gradatii de gri liniare sau neliniare, de exemplu de la rosu la albastru, de la maroniu la maroniu închis, etc.

Valoarea nivelului de gri al unui pixel poate fi privita ca o adresa, care se gaseste în trei tabele, corespunzatoare culorilor de baza (rosu/verde/albastru). Acest set de trei tabele de conversie defineste paleta în care diferite proportii de rosu/verde/albastru sunt amestecate pentru a produce o culoare în intervalul [0,255].

Paleta în nuante de gri are o gradatie uniforma a nivelelor de gri pentru fiecare culoare de baza. Ponderea culorilor de baza (rosu/verde/albastru) este egala.

In functie de aplicatie, se pot defini mai multe palete. Fiecare program de aplicatie are un set predefinit de palete, care pot fi modificate în functie de necesitati.

Fig. 6.2. Histograma unei imagini.

Histograma unei imagini, Fig. 6.2, indica distributia cantitativa a pixelilor pentru fiecare nivel de gri. Ea da o descriere generala a aspectului imaginii si ajuta în identificarea diferitelor componente cum ar fi fondul, obiectele si zgomotul. Histograma imaginii este o functie H definita pe o scala a nivelelor de gri [0,k,255] astfel încât numarul de pixeli egali cu nivelul de gri k sa fie:

H(k)=nk (6.1)

unde nk este numarul de pixeli din imagine cu nivelul de gri k iar nk =n este numarul total de pixeli ai unei imagini.

Pentru o histograma sunt disponibile doua reprezentari: liniara si cumulativa, corespunzand respectiv distributiei nivelelor de gri si functiei de repartitie a nivelelor de gri. In ambele cazuri, pe abscisa sunt reprezentate nivelele de gri între 0 si 255.

Pentru o histograma liniara, densitatea este:

Hlinear(k)=nk (6.2)

unde Hlinear(k) este numarul de pixeli cu valoarea k. Densitatea de probabilitate este:

Plinear(k)=nk/n (6.3)

unde Plinear(k) este probabilitatea ca un pixel sa aiba valoarea k.

Histograma cumulativa este data de:

unde Hcumul(k) este numarul de pixeli cu valoarea mai mica sau egala cu k. Densitatea de probabilitate este data de:

unde Pcumul(k) este probabilitatea ca valoarea unui pixel sa fie mai mica sau egala cu k.

Intervalele de nivele de gri cu o densitate semnificativa releva prezenta în imagine a unor componente semnificative cu domeniile de nivel de gri aferente. In exemplul anterior, histograma arata prezenta a trei componente majore.

Histogramele în culori corespund unei imagini în culori si se exprima ca histogramele celor trei componente primare, în oricare dintre formatele RGB, HSL sau HSV.

Scala verticala a histogramei poate fi liniara sau logaritmica. In cazul scalei logaritmice, sunt scoase în evidenta valorile minore ale nivelurilor de gri în dauna nivelurilor mari.

Transformarile asupra tabelei nuantelor de gri (engl. LUT="Look Up Table") sunt functii de baza în prelucrarea imaginilor, folosite pentru îmbunatatirea contrastului si luminozitatii unei imagini prin modificarea dinamicii intensitatii regiunilor cu contrast insuficient. Transformarile LUT pot evidentia detalii în ariile ce contin o informatie semnificativa în dauna altor zone. Aceste functii include: egalizarea histogramei, inversarea histogramei, corectiile gama, inversarea corectiilor gama, corectiile logaritmice si corectiile exponentiale. O transformare a paletei (LUT) transforma nuantele de gri din imaginea sursa în valori diferite pentru imaginea transformata:

Valoarea transformata=F(valoarea sursa) (6.6)

unde functia F poate fi liniara sau neliniara, continua sau discontinua sau definita pe un interval arbitrar. Pentru o rezolutie pe 8 biti, LUT are 256 valori.

Fig. 6.3. Egalizarea histogramei din fig. 6.2.

Functia de egalizare, Fig. 6.3, altereaza nivelurile de gri astfel încât valorile pixelilor sa fie distribuite uniform în intervalul de definitie ([0,255] pentru reprezentarea pe 8 biti). Functia asociaza un numar egal de pixeli pe intervale constante de nivel de gri si foloseste la maximum nuantele disponibile. Aceasta transformare este folosita pentru a îmbunatati contrastul imaginilor în care intervalele pentru nivelurile de gri nu sunt folosite. Dupa egalizare, histograma cumulativa a unei imagini are întotdeuna un profil liniar.

Inversarea consta în oglindirea histogramei în jurul nivelului de gri 128.

Corectiile invers-gama si logaritmice sunt folosite pentru imagini alb-negru acestea extind domeniul nuantelor de gri cu numar de ordine mic (nuante deschise) si îl comprima pe cel al nuantelor închise.

Corectiiile gama, putere si exponentiala extind domeniul nuantelor închise si îl restrâng pe cel al nuantelor deschise. Cu cât eponentul folosit în corectiile gama si putere este mai mare, cu atât corectia este mai puternica. Corectia exponentiala are un efect mai accentuat decât cea de tip putere.

Obs.:Corectia gama, se refera la caracterizarea curbei senzitometrice a unui film fotografic, tipic exponentiala în domeniul vizibil.

VI.2. REPREZENTAREA TRIDIMENSIONALA (3D)

 

 

Fig. 6.4.(a) Imaginea originala pentru porii observati într-o banda de teflon.

Fig. 6.4.(b). reprezentarea 3D pentru porii observati într-o banda de teflon.

Reprezentarea tridimensionala (fig. 6.4. (b)) este o metoda de vizualizare prin care nivelurile de gri sunt reprezentate ca o coordonata z (înaltime), într-un sistem cartezian xyz. Se utilizeaza conceptul grafic de scena, în care sunt disponibile: elementele scenei (suprafata de reprezentat), o camera de luat vederi si diferitele surse de lumina. Este simulat traseul razelor de lumina de la sursa pâna la camera de luat vederi.

VI.3. OPERATORI UTILIZATI IN PRELUCRAREA IMAGINILOR

 

Operatorii aritmetici si logici pot fi folositi în conjuctie cu mastile pentru a combina si compara imaginile. Ei mai pot fi folositi pentru operatia de prag (engl. "threshold") precum si pentru modificarea contrastului si stralucirii imaginilor.

Fig. 6.5. Utilizarea operatorilor logici pentru doua imagini.

O operatie aritmetica sau logica între imagini este o transformare pixel cu pixel. Daca a este o imagine cu rezolutie XY, b o imagine cu rezolutie XY si Op un operator, atunci imaginea rezultat n este :

pn = (pa)(Op)(pb) (6.7)

unde pn este valoarea pixelului din imaginea n, iar (pa) si (pb) valorile pixelilor corespunzatori din imaginile a si b.

Operatorii aritmetici sunt:

Operatorii logici sunt:

Operatorii logici sunt operatori la nivel de bit. Ei dau posibilitatea manipularii la nivel de bit a nivelurilor de gri codificate pe un octet. In cazul imaginilor pe 8 biti, operatorii logici sunt folositi în principal pentru a combina imaginile în nuante de gri cu masti compuse din pixeli cu valori între 0 si 255.

VI.4. FILTRAJUL SPATIAL

 

 

Filtrul spatial altereaza valorile pixelilor tinând cont de variatiile intensitatii luminoase a vecinilor. Aceste filtre pot fi sensibile la prezenta sau absenta variatiilor de intensitate si pot servi unor scopuri diverse, cum ar fi detectarea contururilor dupa o directie specifica, reducerea zgomotului, evidentierea detaliilor si netezirea (engl. "smoothing").

Filtrele spatiale pot fi divizate în:

In cazul unei vecinatati a pixelului, data de o matrice 33, valoarea pixelului central deriva din valoarea celor 8 vecini. O matrice a vecinilor de 55 conduce la 24 de vecini, o matrice de 77 specifica 48 vecini s.a.m.d.

Un filtru liniar atribuie lui Pij o valoare care este o combinatie liniara a valorilor vecinilor:

P(i,j) = P(i,j-1) + P(i-1,j) + 2P(i,j) + P(i+1,j) + P(i,j)+1 (6.8a)

Un filtru neliniar atribuie lui Pij o valoare care nu este o combinatie liniara a valorilor vecinilor, de exemplu:

P(i,j) = max(P(i-1,j-1) , P(i+1,j-1) ,P(i-1,j+1) , P(i+1,j+1)) (6.8b)

Clasificarea filtrelor cunoscute pâna acum este urmatoarea:

  Filtre trece-sus Filtre trece-jos
Filtre liniare Gradient, Laplacean Netezire, Gaussian
Filtre neliniare Gradient, Roberts, Sobel, Prewitt, de diferentiere, sigma Median, de ordinul n, trece-jos

VI.5. FILTRE LINIARE SAU DE CONVOLUTIE

 

 

Convolutia este o operatie matematica care înlocuieste fiecare pixel prin suma ponderata a vecinilor. Matricea care defineste vecinatatea pixelului contine ponderile atribuite fiecarui pixel. Aceasta matrice se numeste sâmbure de convolutie (engl. "convolution kernel"). Pentru fiecare pixel Pij din imagine, sâmburele este centrat în Pij. Fiecare pixel vecin din masca este multiplicat cu coeficientul corespunzator din sâmbure.

Pixelului Pij îi este atribuita valoarea unde a variaza între (i-1) si (i+1) iar b variaza între (j-1) si (j+1). N este factorul de normare egal maximul dintre sau 1. In final, daca noua valoare Pij este negativa, este luata 0. Daca noua valoare este mai mare decât 255 (reprezentarea pe 8 biti) se ia 255.

Deci, cu cât valoarea absoluta a coeficientului Kab este mai mare, cu atât pixelul Pab contribuie mai mult la noua valoare Pij. Daca coeficientul Kab este nul, vecinul Pab nu contribuie la noua valoare Pij. De exemplu, daca sâmburele de convolutie este:

atunci:

Daca sâmburele este:

atunci:

Daca sâmburele contine atât valori pozitive cât si negative, functia de transfer este echivalenta cu o derivare ponderata si produce un filtru trece-sus cu efectul de accentuare a contururilor (engl. "sharpening"). Filtrele tipice trece-sus includ filtrele gradient si Laplace.

Daca toti coeficientii sâmburelui sunt pozitivi, functia de transfer este echivalenta cu o sumare ponderata si produce un filtru trece-jos, echivalent cu o netezire (engl. "softening" sau "smoothing"). Filtre tipice trece-jos sunt netezirea si filtrul Gaussian.

VI.5.1. Sâmburi predefiniti

Filtrul gradient foloseste un sâmbure de forma:

si permite evidentierea variatiilor de intensitate dupa o directie specifica care are efectul de a marca contururile si detaliile morfologice (engl. "texture").

Filtrul gradient are doua efecte, dupa cum coeficientul central din sâmbure este 1 sau 0:

Grosimea tusei cu care se evidentiaza conturul este cu atât mai mare cu cât matricea vecinilor are un ordin mai mare.

Fig. 6.6. Aplicarea filtrului Prewitt pentru imaginea din fig. 6.4.(a).

Filtrele Prewitt pentru evidentierea muchiilor:

Fig. 6.7. Aplicarea filtrului Sobel pentru imaginea din fig. 6.4. (a).

Filtrelele Sobel sunt asemanatoare cu filtrele Prewitt dar scot în evidenta usoare variatii ale intensitatii dupa o directie particulara careia i se atribuie o pondere mai mare:

Filtrul Laplace scoate în evidenta variatiile de intensitate luminoasa în jurul unui pixel. Filtrul extrage contururile obiectelor si deci detaliile pot fi urmarite mai bine. Spre deosebire de filtrul gradient, este omnidirectional. Sâmburele are forma:

unde a,b,c, si d sunt întregi.

Filtrul Laplace are doua efecte diferite, extragerea sau evidentierea conturului obiectelor, dupa cum coeficientul central este egal sau mai mare decât suma valorilor absolute ale coeficientilor exteriori.

Filtrul de netezire atenueaza variatiile intensitatii luminoase în vecinatatea unui pixel; estompeaza forma generala a obiectelor si îndeparteaza detaliile. Sâmburele este identic cu cel al filtrului Laplace. a,b,c si d sunt întregi iar x ia valoarea 0 sau 1.

Deoarece toti coeficientii din sâmbure sunt pozitivi, fiecare pixel central este o medie ponderata a vecinilor. Cu cât este mai mare ponderea vecinilor, cu atât vor inluenta mai mult noua valoare a pixelului central. Efectul este mai puternic pentru x=0 decât pentru x=1.

Filtrul Gaussian atenueaza variatiile intensitatii luminoase în vecinatatea unui pixel. Este asemanator filtrului de netezire, dar estomparea contururilor este mai putin accentuata. In acet caz, x>1.

Filtrele neliniare înlocuiesc valoarea fiecarui pixel cu o functie neliniara a vecinilor.

Filtrul Prewit neliniar este un filtru trece-sus care extrage contururile exterioare ale obiectelor. Evidentiaza variatiile de intensitate dupa axele verticala si orizontala.

Filtrul Sobel neliniar este de asemenea un filtru trece-sus care extrage contururile exterioare ale obiectelor. Evidentiaza variatiile de intensitate dupa axele verticala si orizontala. Spre deosebire de filtrul Prewitt sunt atribuite ponderi mai mari vecinilor de pe verticala si orizontala. Diferenta este sesizabila atunci când se urmaresc pixeli izolati.

Filtrul gradient neliniar evidentiaza contururile unde apare o variatie de intensitate dupa axa verticala:

Filtrul Roberts evidentiaza contururile atunci când apare o variatie dupa diagonalele matricii vecinilor. Noua valoare a pixelului devine valoarea maxima în modul între vecinii din colturile matricii vecinatatii.

Filtrul de diferentiere produce contururi continue prin evidentierea fiecarui pixel pentru care apare o variatie fata de trei vecini din coltul stânga sus al matricii vecinilor:

Filtrul sigma este tot un filtru trece sus care evidentiaza contururile si detaliile prin atribuirea valorii unui pixel ca valoarea medie a vecinilor, daca aceasta variatie nu este semnificativa. Se ia o decizie în functie de valoarea medie M si abaterea standard S.

Daca P(ij)-M> S atunci P(ij) = P(ij) altfel P(ij) = M (6.19)

Filtrul trece-jos reduce detaliile si estompeaza contururile atribuind unui pixel valoarea medie a vecinilor, daca aceasta variatie este mare.

Daca P(ij)-M< S atunci P(ij) = P(ij) altfel P(ij) = M (6.20)

Filtrul median este tot un filtru trece jos. El atribuie fiecarui pixel valoarea medie a vecinilor îndepartând eficient pixelii izolati si reducând detaliile. Acest filtru nu reduce totusi contururile obiectelor (Pij este media în seria Pmn).

Fig. 6.8. Aplicarea filtrului median pentru imaginea din fig. 6.4.(a).

Filtrul de ordinul N este o generalizare a filtrului median: Pij este valoarea N în seria Pmn unde Pmn sunt sortati în ordine crescatoare.

VI.6. FILTRE DE FRECVENTA

 

 

Filtrele de frecventa altereaza valorile pixelilor în functie de periodicitatea si distributia spatiala a variatiei întensitatii luminoase a imaginii. Se foloseste transformarea Fourier rapida si de aceea dimensiunea imaginii trebuie sa fie NM unde N si M sunt respectiv de forma 2pN si 2pM.

Filtre nu pot fi aplicate direct unei imagini ci numai reprezentarii în frecventa data de aplicarea transformarii Fourier:

Frecventele spatiale observate în transformata Fourier a imaginii pot fi filtrate iar apoi prin transformare Fourier inversa se reface imaginea filtrata.

Pentru transformata Fourier a imaginii, avem doua reprezentari:

Se poate trece de la reprezentarea standard la ce optica prin permutarea celor patru cadrane ale imaginii.

Filtrul de frecventa trece-sus ajuta la izolarea unor variatii abrupte de intensitate, corespunzând muchiilor, contururilor, detaliilor si zgomotului. Sunt îndepartate frecventele joase prezente în planul (uv) al frecventelor. Este suprimata informatia referitoare la variatii lente ale intensitatii luminoase. In imaginea reconstruita sunt evidentiate detaliile iar aspectul general este atenuat.

Atenuarea trece-sus este data filtrul:

Unde C(f0)=1 si C(fmax)=0

Trunchierea trece-sus îndeparteaza frecventele mai mici decât o valoare de prag, fc.

Filtrul de frecventa trece-jos evidentiaza variatiile lente ale intensitatii luminoase corespunzatoare obiectelor si fondului. Sunt atenuate frecventele înalte din planul transformatei Fourier. In imaginea reconstruita sunt atenuate zgomotul, detaliile si contururile.

Atenuarea trece-jos se aplica întregului domeniu de frecvente, iar coeficientul C este dat de:

unde C(f0)=1 si C(fmax)=0.

Trunchierea trece-jos îndeparteaza frecventele mai mari decât o valoare de prag, fc.

Filtrele masca îndeparteaza frecventele continute într-o masca specificata de utilizator, al carui efect este dependent de definitia data.

VI.7. ANALIZA MORFOLOGICA

 

 

Transformarile morfologice extrag si altereaza structura obiectelor dintr-o imagine. Aceste transformari pot fi folosite pentru gasirea obiectelor necesare în analiza cantitativa, observarea geometriei unor regiuni, extragerea celor mai simple forme pentru modelare si identificare. Pe de alta parte, transformarile morfologice pot fi folosite la dilatarea sau reducerea obiectelor, umplerea golurilor, închiderea incluziunilor, netezirea muchiilor, etc. Ele pot fi divzate în doua mari categorii:

Alegerea pragului consta în segmentarea paletei imaginii în doua regiuni, una cu valoarea 1, corespunzatoare obiectului, cealalta cu valoarea 0, corespunzatoare fondului.

O problema frecventa în segmentarea imaginii în obiect+fond cu ajutorul pragului apare când contururile nu sunt bine definite. Aceasta implica o analiza atenta a profilului de intensitate în zona de interes. Pentru imaginile în culori, alegerea pragului se face separat pentru fiecare componenta de culoare.

Metoda centrului de greutate (engl. "clustering, barycenter"). In aceasta tehnica, imaginea este sortata aleator într-un numar definit de clase corespunzator fazelor percepute în imagine. Nuantelor de gri le este determinat centrul de greutate, iar procedeul este repetat pâna când valoarea obtinuta este centrul de greutate al fazei percepute.

 

6.7.1. Tehnica elementului structural

 Elementul structural este o masca binara folosita de majoritatea transformarilor morfologice pentru a gasi forma si conturul obiectelor.

Fig. 6.9. Alegerea pragului pentru o imagine în nuante de gri.

 

Fig. 6.10. Utilizarea elementului structural.

Elementul structural (sablon), P0, Fig.6.10, este alterat astfel încât sa devina o functie de vecinii sai. Acestia sunt mascati cu 1 pentru elementul centrat în P0, iar un vecin mascat cu 0 este ignorat. Vecinatatea pixelului poate fi rectangulara sau hexagonala.

Functiile morfologice primare se aplica doar imaginilor binare (1 bit pe pixel), de aceea putem conveni ca pentru un obiect (grup de pixeli învecinati) avem valoarea 1.

Eroziunea elimina pixelii izolati din fond si erodeaza conturul obiectelor relativ la sablonul definit de elementul structural. Pixelii mascati de valoarea 1 a elementului structural îi notam cu Pi (pentru o vecinatate 33, Pi ia valori de la P0 la P8).

Dilatarea este operatia inversa eroziunii, deoarece dilatarea obiectelor este echivalenta cu eroziunea fondului.

Fig. 6.11. Aplicarea functiei de dilatare pentru imaginea din fig. 6.4.(a).

Functia opening (de deschidere) îndeparteaza obiectele foarte mici si netezeste contururile:

Aceasta operatie nu altereaza semnificativ aria sau forma obiectelor, deoarece eroziunea si dilatarea sunt operatii duale (inverese). Dar, obiectele care au disparut la eroziune, nu mai apar la operatia de dilatare, si de aici efectul obtinut.

Functia closing (de închidere) este o dilatare urmata de eroziune:

De asemenea, aceasta operatie nu altereaza semnificativ aria si forma obiectelor. Contururile extinse prin dilatare sunt reduse prin eroziune, dar micile gauri evidentiate la dilatare nu mai reapar dupa eroziune.

Fig. 6.12. Aplicarea functiei contur pentru imaginea din fig. 6.4.(a).

Functia contur exterior (engl. "external edge") face scaderea imaginii sursa din imaginea dilatata.

Contur exterior(i) = dilatare(i) - i = XOR(i, dilatare(i)) (6.26)

Functia contur interior (engl. "internal edge") face scaderea imaginii erodate din imaginea sursa.

Contur interior(i) = i - eroziune(i) = XOR(i, eroziune(i)) (6.27)

Functia de subtiere (engl. "thinning") elimina pixelii localizati în vecinatatea care reproduce sablonul specificat de un element tructural. Functia poate fi folosita pentru îndepartarea pixelilor izolati din fond precum si a unghiurilor drepte de-a lungul contururilor obiectelor. Cu cât obiectul este mai mare, cu atât sablonul devine mai selectiv.

Functia de îngrosare (engl. "thickening") este inversa functiei de subtiere. In imagine sunt adaugati pixeli care corespund sablonului definit de elementul structural. In functie de elementul structural, îngrosarea poate fi folosita pentru umplerea unor mici goluri sau netezirea unghiurilor drepte de-a lungul contururilor obiectelor.

Functia schelet (engl. "skeleton") consta în aplicarea succesiva a operatiilor de subtiere pâna când conturul obiectelor este adus la grosimea de un pixel.

Aria obiectului se exprima în numarul de pixeli continuti de un obiect. Aceasta functie se obtine simplu pornind de la imaginea careia i s-au determinat contururile.

Numararea obiectelor. Cea mai uzuala metoda pentru izolarea obiectelor consta în utilizarea pragului si conversia la obiecte binare. Un obiect digital poate fi caracterizat de un set de caracteristici morfologice si de intensitate: arie, lungime, coordonate, coarda si axe, echivalente de forma, caracteristici de forma, caracteristici densitometrice. Pentru numararea particulelor, se atribuie un numar de identificare fiecarui obiect. Numaratoarea se face pornind de la coltul stânga sus al imaginii.

Profilul liniar se obtine cu instrumentul de selectie liniar si reprezinta variatia intensitatii de-a lungul dreptei de selectie. Este un procedeu util în evidentierea unor secvente repetitive. Maximele si minimele arata variatia intensitatii luminoase de-a lungul dreptei de selectie iar largimea maximelor este proportionala cu dimensiunea obiectului. Spre exemplu, un obiect apare în aceasta reprezentare ca un platou si poate fi masurat. Cu cât este mai bun contrastul, cu atât tranzitia catre fond este mai abrupta. Pe de alta parte, zgomotul induce aparitia mai multor peak-uri înguste.