Dr. Sárközy Ferenc: Térinformatika

Képfeldolgozás I

Ebben a részben tulajdonképpen folytatjuk a képfeldolgozással kapcsolatos ismereteink bővítéset és megismerkedünk néhány matematikai fogalommal, éspedig

a Fourier transzformációval,
a konvolucióval, és
a Laplace - Gauss operátorral.

Néhány újabb ismeret a képfeldolgozásból

Lehet, hogy az alcím kissé furcsának tűnik az olvasónak, ezért megpróbálom néhány szóban megmagyarázni. Képfeldolgozási kérdésekkel nem most találkozunk először. Viszonylag részletesen foglalkoztunk a bináris képekkel végrehajtható legfontosabb képfeldolgozási műveletekkel: a raszter-vektor, vektor-raszter átalakítással. A normálsztereogramm és ortofotó készítéssel kapcsolatban pedig azt is megnéztük, hogy hogyan lehet a tónusos képelemeket eltolva a képeket átalakítani (tulajdonképpen geometriailag torzítani), sőt e művelettel kapcsolatban a szürkeségi értékek interpolációja bizonyos értelemben, a geometriai torzításon túlmenően, a szürkeségi értékeket is bizonyos kismértékű változtatásnak, torzításnak vetette alá. A jelen pontban tárgyalandó témáink olyan módszerek lesznek, melyek valamilyen rendszer szerint megváltoztatják a képek szürkeségi értékeit.

Tulajdonképpen ilyen módszerekkel már az analóg fotográfia is dolgozott, csak sokkal szűkebb tartományra korlátozódó vezérlési lehetőségekkel. Minden amatőr fényképész előtt ismeretes, hogy az expozíciós idő illetve a fotóanyag, valamint a hívási folyamat paramétereinek változtatásával ugyanolyan kamara és megvilágítási viszonyok esetén is különböző keménységű fényképeket lehet készíteni.

A digitális képfeldolgozás alkalmazása esetén azonban a kontrasztosságot szisztematikusan és finoman lehet változtatni. A kontraszt fokozása azt jelenti, hogy növeljük a pixelek szürkeségi értékeinek differenciáit, míg a kontraszt csökkentése csökkenti az eredeti különbségeket.

E módszereknek nagyon sok alkalmazási területe lehet, csak példaképpen említünk néhányat. Ha a kiértékelendő képpár a fényképezés pillanataiban fenálló megvilágítási különbségek következtében kölönböző keménységű, úgy mind interaktív, mind automatikus kiértékelés esetén kedvezőbb, ha először kiegyenlítjük a kontrasztjukat. Gyakran előfordul, hogy különböző véletlen hibák következtében kis kiterjedésű, az objektumtér leképzendő formáival nem magyarázható hirtelen szürkeségi érték változások lépnek fel a képen, melyek kiküszöbölése indokolt. A képkorrelációs eljárások eredményességét segíti a vonalas objektumok képeinek kiemelése az úgynevezett élkiemelés. Ez utóbbi technika alkalmazandó akkor is ha a mesterséges objektumok kiértékelését félautomatikusan vagy automatikusan akarjuk végrehajtani.

Néhány alapfogalom a matematikából

Tekintsük a pixelpontok szürkeségi értékeit megadó kifejezést diszkrét függvénynek a 2 dimmenziós térben és jelüljük sz(x,y)-al. A matematikából ismeretes (lsd. például [8] vagy [9], illetve a konkrét képfeldolgozási alkalmazásokról lsd még [10]), hogy minden periodikus függvény Fourier - sorba fejthető, ami

tulajdonképpen nem más, mint a 2l illetve 2k periódusú függvény helyettesítése

és

frekvenciájú

harmonikus rezgések összegével. Ha a térben (vagy időben) kifejezett független változókkal rendelkező függvény nem periódikus, úgy a sorbafejtés analógiájára a Fourier transzformáltak segítségével alakítható át olyan függvénnyé, mely az eredeti függvény által leírt jelenséget a folytonos (frekvencia) spektrum segítségével fejezi ki a kétdimmenziós hullámszám (rezgészám) vektor függvényében (a hullámszám dimmenziója: 1/hosszegység, a rezgésszám dimmenziója: 1/időegység).

Ha a képfeldolgozási műveleteket közvetlenül az sz(x,y) függvény felhasználásával végezzük, úgy azt mondjuk, hogy a művelet a tér-tartományban megy végbe, ha azonban a szürkeségi függvény Fourier transzformáltjával dolgozunk, a feladat megoldását átvittük a frekvencia - tartományba. Mivel azonban végeredményként mindíg a szürkeségi függvény megváltozott értékeire van szükségünk, a frekvencia tartományból vissza kell térnünk a tér - tartományba. Ezt a feladatot az inverz Fourier transzformáció segítségével oldhatjuk meg.

A következő táblázatban megadjuk a Furier transzformáltak és inverz transzformációk képleteit folyamatos és diszkrét esetre:

	Fourier transzformált	inverz transzformáció
folyamatos
diszkrét

A diszkrét esetben feltételeztük, hogy a kép n sort és ugyancsak n oszlopot tartalmaz, valamint, hogy mind a pixel koordináták (x,y), mind a hullámszámok (u,v) 0-tól (n-1)-ig egyesével változó tehát, egész értékeket vehetnek fel. Sz(u,v)-el a szürkeségi függvény Fourier transzformáltját jelöltük.

A képfeldolgozásban a Fourier transzformáltakat gyakran a konvolúció műveletének egyszerűbb végrehajtására használják fel.

A g(x,y) és f(x,y) folyamatos függvényeknek az (a,b; c,d) intervallum feletti konvolúcióját az alábbi kifejezés definiálja kétdimmenziós esetben:

ahol a * a konvolúció műveleti jele. Diszkrét, kétdimmenziós esetben a sz(x,y) szürkeségi érték függvény valamint valamely másik r(x,y) képfüggvény konvolúciója az alábbi alakot veszi fel:

Mivel esetünkben tulajdonképpen diszkrét sorozatok között kell a műveletet végrehajtani, célszerűbb a független változókat az elemek indexében szerepeltetni. Jelöljük az egyik képfüggvényt leíró sorozat elemeket az alábbi indexes alakkal , a másik képfüggvény jelölése legyen hasonlóan: , a konvolució eredményét pedig jelölje a sorozat. E jelölésekkel a diszkrét konvolúció kifejezése a következő alakra hozható

Ha azonban feltételezzük, hogy a képfüggvény a kép határain túl is folytatódik, úgy az összegzési határokat, a folyamatos függvények analógiájára, a bennünket érdeklő egész tartományra ki kell terjesztenünk, azaz ebben az esetben

A gyakorlatban a konvolúciót a képmátrix szűrésére is szokták használni. Ebben az esetben az r szűrő mátrix egy viszonylag kis (maximum 5x5 -ös mátrix). Ezzel a kis mátrix-szal azonban el kell végezni a konvolúciót minden képpixelre (tulajdonképpen arról van szó, hogy n x n darab tartalmában azonos, a szürkeségi érték mátrixhoz viszonyított indexeiben különböző képfüggvényünk van, s ezekkel és a szürkeségi értékek függvényével kell elvégezni a konvolúciót mégpedig olymódon, hogy minden i,j sorszámú eredeti szürkeségi érték függvény pixelhez hozzárendelünk egy megfelelő elhelyezkedésű szűrő mátrixot). Legyen a szűrő mátrix dimmenziója 2.N+1, akkor aszűrt szürkeségi érték pixel a

kifejezésből számítható. A Furier transzformáltak segítségével a konvolúció végrehajtása egyszerűbb, ugyanis bizonyítható, hogy

azaz a konvolúció műveletét a frekvencia tartományban a megfelelő Furier transzformáltak összeszorzásával végezhetjük.

A Fourier transzformáltak konvolúcióval kapcsolatos alkalmazása mellett szólnunk kell röviden a transzformáltak fizikai tartalmáról. A transzformáltakat leíró kifejezés (lásd a táblázatban) tanulsága szerint a transzformáltak komplex számok, valós és képzetes részből állnak. A valós és képzetes részek négyzetösszegének gyökét Furier vagy frekvencia spektrumnak nevezik. Ez a mennyiség arányos a kérdéses transzformált argumentumában szereplő frekvencia amplitúdójával. A spektrum elemeinek manipulálásával lehetséges a képet alkotó frekvencia összetevők megváltoztatása, s az inverz transzformáció alkalmazásával a megváltoztatott spektrumra, optimális esetben, a kép minőségének kivánt irányú megváltoztatása. Azokra a gyakorlati módszerekre, melyekkel e javítások elérhetők a következő részben térünk ki.

E rövid matematikai összefoglalóban szólnunk kell még néhány szót a Laplace-Gauss rövidítve LoG operátorról.

A Laplace - féle operátor Descartes-féle koordináta rendszerben a következőképpen jelölhető és értelmezhető:

ahol

a nabla operátor, mely valamely térbeli skalár függvénnyel megszorozva a (három) változós skalárfüggvény pontbeli

növekedés-vektorának (grádiensének) három tengelyre eső komponenseit szolgáltatja. Mivel a Laplace-operátor a nabla vektor önmagával történt skaláris szorzataként van meghatározva a vektor operátorból skaláris operátor lett, ugyanis az egység-vektorok (i, j, k) önmagukkal megszorozva az egységet, egymással páronként megszorozva pedig a zérust szolgáltatják. Ha tehát egy háromváltozós

skalár függvényre alkalmazzuk a Laplace-operátort, úgy az eredmény

egy skalár, mely azt mutatja, hogy a függvény változása a vizsgált pont környezetében növekszik-e vagy csökken. Ahol a függvény növekedésből csökkenésbe vagy csökkenésből növekedésbe megy át, ott a fenti kifejezés előjelet vált. Ezeket a helyeket a müszaki gyakorlat 'nullátmeneteknek' hívja. A Laplace-operátor kétdimmenziós alakját széleskörűen alkalmazzák mind a képfeldolgozásban, mind pedig a Digitális Magasságmodellel végrehajtott felület elemzésben.A szürkeségi értékek változási tendenciájának hirtelen megváltozását (növekedésből csökkenésre, csökkenésből növekedésre váltást) azonban nem csak a földi objektumok különböző fényvisszaverési tulajdonságai, hanem véletlen jellegű hatások, összefoglaló névvel a zajok is kiválthatják. Ha feltételezzük, hogy a zajok a kordinátatenglyektől függetlenek és normális eloszlásúak (lsd. pld. [3], [5], [8] vagy [9]), úgy sűrűség függvényük a következő alakban írható fel:

A sűrűség függvényben szereplő szórás esetünkben azt szabályozza, hogy egymástól milyen távol lehetnek a földi objektumok által is indokolt hirtelen szürkeségi érték változások: kis esetén közel lehetnek egymáshoz, nagy esetén csak a távoli változásokat tekintjük indokoltnak, s a szűrés csak a kép durva szerkezetét hagyja meg.

3.48 ábra - Gauss féle szűrő

A sűrűség függvény diszkretizálás után felhasználható a konvolúciós szűrésre is, a szűrés sugarát

határozza meg. A 3.48 ábrán felvázoltuk a szűrő és a kép kölcsönös helyzetét egy pixel környezetében.
Amint az ábráról látható az eloszlás maximális értéke 0.1501/

² az r=0 kezdőpontban van, s ettől a ponttól távolodva körszimmetrikusan a függvény exponenciális szabály szerint csökken. Az eloszlási függvény asszimptotikusan közelíti a zérust. Ha a sűrűség függvény kifejezését 0 és végtelen között integráljuk, úgy a görbe alatti köbtartalom az egységgel egyenlő. Ha diszkretizáljuk az ábrán látható felületet, úgy

=1 esetén az alábbi 9x9-es mátrixot kapjuk (tekintettel a körszimetriára csak a bal felső 5x5-ös mátrixot nyomtattuk ki):

0.000018	0.000556	0.002007	0.032800	0.053378
0.000593	0.019037	0.223040	1.114600	1.768110
0.006977	0.244110	2.741930	15.23560	21.53889
0.032800	1.114600	15.23560	58.08599	96.54403
0.053378	1.768110	21.53889	96.54403	159.1381

.10^-3.

^-2

3.3 táblázat - a Gauss féle szűrő amplitúdó értékei

Amint már említettük, a Gauss-féle szűrővel eltávolíthatjuk a véletlen jellegű (esetleg számunkra érdektelen, egymáshoz túl közel eső) hirtelen szürkeségi érték változásokat, majd a Laplace operátorral kiválaszthatjuk a szűrt képből azokat a pixeleket, melyek környezetében a szűrés ellenére a szürkeségi értékek változásának előjelváltása továbbra is fenáll.

Nagyon sok számítási munkát megspórolhatunk azonban, ha a két műveletet egyszerre hajtjuk végre olymódon, hogy előbb képezzük a Gauss szűrő Laplace operátorát, majd ezzel a módosított szűrővel végezzük el a konvolúciót. A szakirodalom ezt módosított szűrőt nevezi LoG operátornak a Laplacian of Gaussian angol kifejezés rövidítéseként, ami magyarul úgy fordítható, hogy a Gauss-i (szűrő) Laplace-i operátora.

Deriváljuk a Gauss szűrő kifejezését x majd y szerint, az első deriváltak az alábbiak lesznek:

Az x és y szerinti második deriváltak pedig a következő alakot veszik fel:

A Laplace operátort a két második derivált összegeként kapjuk azaz

3.49 ábra - a LoG operátor

A 3.4 táblázatban kiszámoltuk a diszkretizált LoG operátor 9x9-es mátrixának bal felső negyedét a

=1 esetre, a 3.49-es ábrán pedig felvázoltuk az operátor ábráját.

Az eredményül kapott kifejezés fordított sombreró alakú, az r=0 helyen minimummal rendelkezik, az sugarú kör mentén a felület metszi az XY síkot, azaz e körön az operátor értéke zérus.

0.000543	0.012872	0.041258	0.484194	0.747467
0.013641	0.305781	2.484730	8.831589	12.37636
0.126053	2.675484	16.78689	39.36850	43.07855
0.491162	8.625458	39.07723	0.952375	-96.5323
0.747467	12.37636	43.07855	-96.5323	-318.309

.10^-3.

^-2

3.4 táblázat - a LoG operátor amplitúdó értékei

a következő részben a gyakorlati képfeldolgozási módszerekkel ismerkedünk
esetleg visszatérhet az előző részhez
illetve a tartalomjegyzékhez

Megjegyzéseit E-mail-en várja a szerző: Dr Sárközy Ferenc

Az oldal a szerző engedélyével, a GIS Figyelő által formailag módosított változat.

Képfeldolgozás I

Néhány újabb ismeret a képfeldolgozásból

Néhány alapfogalom a matematikából

3.48 ábra - Gauss féle szűrő

3.3 táblázat - a Gauss féle szűrő amplitúdó értékei

3.49 ábra - a LoG operátor

3.4 táblázat - a LoG operátor amplitúdó értékei

a következő részben a gyakorlati képfeldolgozási módszerekkel ismerkedünk esetleg visszatérhet az előző részhez illetve a tartalomjegyzékhez

a következő részben a gyakorlati képfeldolgozási módszerekkel ismerkedünk
esetleg visszatérhet az előző részhez
illetve a tartalomjegyzékhez