Dr. Sárközy Ferenc: Térinformatika
Skalár terek modellezése
Ebben a részben megismerkedünk
- a krigeléssel,
- A skalár terek modellezésének általánosabb megközelítéseivel,
ezen belül
- a spline interpoláció néhány válfajával és
- a skalár terek approximációjával a lokális modelleken alapúló
becslés segítségével.
Eddigi 3 D-s modelljeinkben feltételeztük, hogy egy-egy test,
egy-egy határokkal körülvett térbeli idom, egy-egy n dimenziós Voronoi
(hiper)poliéder belseje homogén.
Ez a feltételezés bizonyos esetekben fizikailag is
többé-kevésbé indokolt (pld. a barlangok esetében), más esetekben csak egy
olyan viszonylag durva közelítés, mely a kisfelbontású globális modelleket
kezelhetővé teszi. Úgy is tekinthetünk ezekre a modellekre mint a finomabb
felbontású modell kiinduló pontjaira. Ha például az a feladatunk, hogy egy
szénmezőben modellezzük a kénkoncentrációt, úgy először magát a szénmezőt mint
homogén objektumot kell modelleznünk, majd ennek határain belül a finomabb
változásokat.
A skalár terek modellezése bizonyos esetekben véglegesnek
tekinthető eredményeket szolgáltat, bizonyos esetekben azonban csak az egy
időpillanatra jellemző kiinduló helyzetet írja le. Az első eset akkor áll elő,
ha statikus vagy lassan változó jelenségeket modellezünk, a második eset
pedig dinamikusan változó jelenségek esetére jellemző. Ez utóbbi esetben
tulajdonképpen vektor térrel modellezhetjük reálisan a jelenséget és skalár tér
modellünk csak első megközelítésnek tekinthető.
Példaképpen a lassú változású terekre a Föld nehézségi erő
potenciáltere szolgálhat, míg a gyorsan változó terekre példákat legkönnyebben
az atmoszféra terei közül választhatunk (hőmérsékleti, légnyomási tér, stb.).
A skalár terek jellemző értékeit, különböző
mintavételezési eljárásokkal határozhatjuk meg. A földalatti terekben
rendszerint fúrásokkal nyerik az adatokat, míg az atmoszférában szondákkal
esetleg helikopterekkel végzik a méréseket. Mind a földalatti mind a föld
feletti mérésekre jellemző, hogy
- a mérések helyei gyakran jelentős hibákkal
terheltek;
- a mért attribútum értékek megbízhatósága egyenetlen;
- a mérési helyek anyagi okokból igen ritkák;
- a mérési helyek az attribútum érték
változásai szempontjából általában véletlenszerűek.
A negyedik sajátosság különleges jelentőséggel
bír a megválasztandó interpolációs módszerek szempontjából. Közismert tény,
hogy a súlyozott számtani közép képzés igen egyszerű s egyben megbízható
módszer, amint erről az előző pontban a lopott területek módszere kapcsán már
szóltunk. Annak a feltétele, hogy súlyozott középértékből megfelelő
interpolációt végezhessünk az, hogy mérési pontjaink a függvény jellemző
pontjaira essenek, meg tudjuk mérni a maximum és minimum helyeket a
töréspontokat stb. A domborzat felmérése során a topográfus látja a terepet és
éppen ezeken a pontokon határozza meg a magasságokat. Ezért lehetséges jó
felmérés alapján jó minőségű digitális magasságmodellt interpolálni súlyozott
számtani középképzéssel is. A skalár terek modellezésénél, amint már
említettük, más a helyzet. Nem ismerjük a jellemző függvény értékeket, s
ezért a mért értékek közepelésén alapuló módszerek nem szolgálhatnak kielégítő
eredménnyel. Illusztráljuk az elmondottakat egy egyszerű egyváltozós
függvénnyel (2.58 ábra).
|
2.58 ábra - a
számtani közép nem mindig jó az interpolálásnál
|
Véleményünk szerint
a természeti folyamatokat leíró skalár terek inkább az utóbbi megközelítéssel
koincidálnak.
|
Ha az xi pontban valamilyen átlagképzéssel interpolált
függvény értéket -vel jelöljük, úgy az átlag képzési módjából
következően , ha viszont egy polinómot illesztünk a mért
pontokhoz, úgy azt kapjuk, hogy .
|
A geostatisztikában általában, a bányászatban
különösen, a feltalálójáról, Krige délafrikai professzorról krigelésnek
nevezett súlyozott átlag képzésen alapuló módszert alkalmazzák az ismeretlen
attribútum értékű pontok attribútum értékeinek meghatározására a más pontokban
mért, azaz ismert, attribútum értékek alapján. A krigelés iránt behatóbban
érdeklődők a módszer viszonylag részletes magyar nyelvű összefoglalását
találhatják Steiner professzor A Geostatisztika Alapjai c.
tankönyvében [20]. A jelen alpont csak a módszer rövid
fölvázolására vállalkozhat elsősorban azzal a céllal, hogy az olvasó
egybevethesse ezt az eljárást az interpoláció általunk javasolt
megközelítésével.
A krigelés úgy kivánja
meghatározni valamely geometriai pont ismeretlen attribútum értékét, hogy olyan
súlyozott átlagot képez a más pontokban ismert (mért) attributum értékekből,
mely szórása minimális.
Ahhoz, hogy az optimális súlyok meghatározhatók legyenek egy variogramm
nevű görbe kiszámítása szükséges az ismert pontok koordinátáinak és attribútum
értékeinek felhasználásával. Meghatározás szerint a variogramm
,
ahol h a mért pontok közötti távolság, n(h)
azoknak a mért pont pároknak a száma melyek egymástól h távolságra
vannak, ZPi pedig a Pi pont
attribútuma.
Anélkül, hogy belebonyolódnánk a részletekbe megjegyezzük,
hogy a h távolság értelmezésében lehetőség van irányítottság figyelembe
vételére is, azaz pld. kétdimenziós esetben, külön variogrammot készíthetünk
Észak-Dél-i és Kelet-Nyugat-i értelmű h távolságokra. Ennek az
eljárásnak akkor van értelme, ha az attribútum értékek távolság függése
azimutálisan különböző.
Ha egy ponthalmazra elkészítjük a variogrammo(ka)t, úgy azt
fogjuk látni, hogy egy bizonyos h távolságon túl a értékek már nem
változnak tovább a h növekedésével. Azt a távolságot, ahol a variogramm
növekedése megszünik hatástávolságnak nevezzük és H-al jelöljük.
A mért eredményekből szerkesztett variogramm nem sima függvény
ezért a numerikus kezelhetőség megkivánja hogy valamilyen kiegyenlítési
eljárással "sima" variogrammot számítsunk. Ehhez azonban az
szükséges, hogy modellezzük valamely függvénnyel a variogramm elméleti alakját,
mivel a kiegyenlítés csak a felvett függvény paramétereit szolgáltatja.
Példaképpen [20] alapján a szférikus modellt mutatjuk be:
.
A fenti kifejezésben a már ismert mennyiségeken kívül, C
jelöli a variogramm maximális (telítettségi) értékét.
Amint azt a bevezetésben már említettük az ismeretlen P0 pont keresett
attribútum értékét Z(P0)-t n darab közeli pont
attribútumainak súlyozott középértékéből kívánjuk meghatározni.
Jelölje si az i.-ik
súlyösszeggel normált pi súlyt (azaz
|
|
, ami azzal a haszonnal jár, hogy a
figyelembe vett normált súlyok összege 1), akkor
|
.
A minimális szórású attribútum becslést szolgáltató normált
súlyok az alábbi mátrix egyenletből határozhatók meg:
,
ahol , a K pedig az úgy nevezett Krige-mátrix:
A súlyok kiszámításához tehát ismerni kell a K mátrix
és a C0 vektor elemeit. Ezeknek az elemeknek a meghatározásához volt
tulajdonképpen szükségünk a simított variogrammra. A cij elemek ( esetben)
a Pi és Pj pontok közötti hij távolság függvényében a variogrammból
számolhatók mivel, , a diagonális elemek (cij az i=j
esetben) pedig C-vel egyenlők. Az elmondottak érvényesek a c0j típusú
vektor elemekre is, ebben az esetben h0j az ismeretlen
attribútumú pont távolsága a j.-ik ismert attribútumú ponttól.
A fölvázolt algoritmus jól szemlélteti a krigelés
népszerűségének a titkát - az egyszerűséget. Nem szabad azonban elfelejtenünk,
hogy az egyszerűség egyből semmivé foszlik, ha anizotrópiát feltételezve
próbáljuk végrehajtani a krigelést. Az anizotrópia feltételezése ugyanis azt
jelenti, hogy a különböző irányokra más és más variogrammot kell szerkeszteni
és K, valamint C0 elemeit ezekből kell kiszámítani.
Kézenfekvő, hogy az anizotrópia az eredeti krigelésben csak korlátozottan
vehető figyelembe és így is csak akkor, ha mind az ismert mind az ismeretlen
pontok valamilyen szabályos síkbeli vagy térbeli tesszellációban helyezkednek
el.
A numerikus matematika tankönyveiben (lsd. pld [21]) három alapvető csoportba sorolják az interpolációs
eljárásokat:
- polinómos
interpolálás;
- trigonometriai
függvényekkel történő interpolálás;
- exponenciális
függvényekkel történő interpolálás.
A függvényekkel történő interpolálás azért csábító, mivel
magában foglalja annak a lehetőségét, hogy viszonylag kevés paraméterrel
írhatjuk le a szóban forgó jelenséget, s így jelentős tárolóhely megtakarítást
érhetünk el. Sajnos a valós világ jelenségei a peremfeltételek összetettsége
következtében gyakran torzult formában követik az alap törvényszerűségeket
leíró függvényeket, ami azzal a következménnyel jár, hogy a kellő pontossággal
közelítő függvénysorok tagszáma s egyben a tárolandó paraméterek száma
jelentősen megnő. Nem szabad ugyanakkor elfelejtenünk, hogy a pontosság relatív
fogalom, feladat és felbontás függő, s ezért eredeti elvárásunk a kis
paraméterszám vonatkozásában sok esetben érvényre juthat. A
függvényinterpoláció jelentősebb problémája az, hogy jelenség-függő, ami a
gyakorlat nyelvére lefordítva azzal a következménnyel jár, hogy egy általános,
függvényinterpoláción alapuló skalártér modellező szoftver szinte végtelen sok
jelenség típusra felkészült szakértői rendszer létrehozását igényli, ami
gyakorlatilag lehetetlen. Optimálisnak az általános modellezés megoldására az
olyan hybrid interpolációs szoftver rendszer tűnik, mely a legfontosabb
természeti jelenségeket függvényinterpolációval modellezi, ugyanakkor a
függvényekkel nem kezelhető jelenségeket polinómos módszerrel közelíti.
Az első szélesen elterjedt 3 D-s modellező kereskedelmi
program-csomag [15], mely a 2 D-s spline
interpoláció 3 D-s kiterjesztését használja, Briggs 1973-ban
kidolgozott eljárásán [22] alapul.
Az eredeti 2 D-s módszer az előre definiált rácspontokban
határozza meg a függvényértékeket anélkül, hogy előbb meghatározná magát a
térbeli változók folytonos függvényét, mely visszaadja a mért értékeket az
adott helyzetű pontokon. A célból, hogy megküzdjön a két dimenziós polinóm
szakaszok illesztési problémáival a szórt elhelyezkedésű észlelési pontokhoz,
Briggs megoldotta a vékony lemez differenciál egyenletét, mely megoldás harmadrendű
spline-hoz vezetett. A numerikus megoldásra differencia egyenletek
szolgáltak, melyek megadták a függvényértékeket a szabályos rácspontokban. Az
eljárás végtermékeként szintvonalas térképet állított elő; a szintvonalak és a
rácsoldalak metszéspontjait négy pontos harmadfokú polinómmal interpolálta, e
metszéspontokat pedig harmadfokú spline-al kötötte össze.
Sajnos a [15] nem tartalmaz semmi
részletet a dimenzió kiterjesztés problémáiról, ennek ellenére
valószínűsíthető, hogy a differencia egyenletek levezetése a 3 D-s esetben is a
közelítő összgörbület négyzetének minimalizálásán alapul.
Mitaova és Mita [23], [24] kidolgozták a variációs feltételek explicit
megoldását az első-, és másodfokú deriváltak direkt becslésével két, három és
négy dimenziós esetekre. A kapott függvény, melyet az összes deriváltat
tartalmazó u.n. 'simasági' funkcionál négyzetének minimalizálásával vezettek
le az alábbi alakkal rendelkezik:
|
,
|
ahol a j index a mért pontokat,
|
|
az ismeretlen együtthatókat, R(x,
x[j]) pedig a bázisfüggvényeket jelöli.
|
A vizsgált esetekre T(x) = a1 = constans.
Három és négy dimenziós esetekben a bázis függvények az alábbiak:
,
ahol
|
|
,
|
|
pedig egy tetszőlegesen választott
'feszültségnek' nevezett paraméter, mely
|
szabályozza a rendszer hajlékonyságát,
|
|
a hibafüggvény.
|
|
A , a1 összesen N+1
ismeretlen paramétert az alábbi N+1 lineáris egyenletből határozhatjuk meg,
amelyekben z[i]-el jelöljük az x[i] pontban mért értéket;
.
Az explicit módszerrel kapcsolatban több kérdés vár további
vizsgálatra.
Mindenek előtt az általános globális módszerek
gyakorlati alkalmazása tűnik problematikusnak a nagy futási idő igény miatt,
mely nagyságrendje egyébként a mért mennyiségek számának köbével arányosan
növekszik.
A [23]-ben a szerzők olyan szegmentált
eljárásra tesznek javaslatot, melyben számos átfedő lokális modellel közelítik
a globális modellt. Sajnos a hivatkozott műben nem találunk utalást arra, hogy
mennyiben függ a közelítés pontossága az átfedés mértékétől, a vizsgált
jelenség sajátosságaitól stb. Ha azonban a módszert GIS függvényként kívánjuk
alkalmazni úgy ki kell dolgozni az adott tűrések függvényében automatikusan
szegmentáló eljárást is.
Ismeretesek olyan klasszikus szegmentáló eljárások is, melyek
globális megoldáshoz vezetnek. Ha az elemzés azt mutatja, hogy lokális
szegmentálással nem lehet kielégíteni a pontossági követelményeket, úgy
alkalmazhatók a globális szegmenteló eljárások, lehetőleg kihasználva a
párhuzamos feldolgozás előnyeit.
A modellezett három és négy dimenziós mezők megjelenítésére
olyan program modulokat használtak, melyek lazán kapcsolódtak a GRASS GIS
program legújabb verziójához. A laza kapcsolatot az indokolta, hogy a kérdéses
GIS szoftver nem rendelkezik a megkívánt térbeli adatstruktúrákkal [24]. Ez a tény ismételten aláhúzza olyan nyílt GIS szoftver
létrehozásának szükségességét, mely rendelkezik kiterjeszthető
adatstruktúrákkal.
A krigelésnél bemutatott lineáris egyenlet rendszer legalább
is külsőleg nagyon hasonlít a fenti rendszerre. Érdekes volna numerikus esetleg
analitikus vizsgálatokat végezni a két rendszer lényegi viszonyát illetően.
A térbeli modellek analízise, különböző térmodellek
egymásrahatása, a vizsgált jelenségek megjelenítése gyakran igényli a kérdéses
attribútum értékek rácspontokban történő megjelenítését. Míg
függvényinterpoláció esetén a rácspontokra levezetett mennyiségek csak közbenső
értékek, addig polynómos interpoláció esetén a rácspontok egyben tárolási
struktúrát is jelenthetnek, ugyanis a rácspontok tárolása mind műveleti mind
tárolási oldalról gazdaságosabbnak mutatkozhat az összes polinóm együttható
tárolásánál és a rácspont értékek sorozatos kiszámításánál.
Felmérve a polinómos interpoláció különleges szerepét a skalár
terek modellezésében az Országos Tudományos Kutatási Alap 685 sz. kutatási
témája keretében az alábbiakban ismertetendő polinómos skalár tér
interpolációs módszert dolgozta ki Gáspár Péter tudományos
munkatárs és a szerző [25].
Legyenek adva az f(r) térbeli skalár függvény ui
értékei az ri pontokban (i=1,...,M). Feladatunk az f(r)
függvényértékek közelítő meghatározása a nem mért r pontokban.
Minden ismert ui értékű ri pontban
képezhetünk egy Gi(r) approximáló függvényt, mely jól közelíti az eredeti
függvényt a pont közelében. A függvény legyen értelmezve az egész globális
modellen és legalább a szomszédos pontokban adjon jó közelítést.
Egy tetszőleges r pontban valamennyi ui,r=Gi(r), (i=1,...,M)
lokális modellből számíthatunk közelítő értéket. Az ui,r értékek
különböző mértékben közelítik f(r) értékét. A közelítés
pontossága attól függ, hogy milyen távol van az r pont a Gi(r)
központi ri pontjától.
Az ui,r értékeket úgy tekinthetjük mint az f(r) függvény
becsléseit a Gi lokális modellek által amiből következik, hogy az ui,r értékek
valószínűségi változók. E változók eloszlása ismeretlen, de néhány statisztikai
jellemzőjük (például a szórásuk) becsülhető. A szórás becslésére az rj ponton
fellépő
eltérések szolgálnak. Ha ismerjük az M számú ui,r érték
valószínűségi jellemzőit, úgy belőlük f(r) várható értéke becsülhető.
A legegyszerűbb becslési módszer a súlyozott számtani közép alkalmazása esetén
,
ahol az si súlyok a szórásokból
számolhatók az alábbiak szerint:
.
Természetesen a bemutatott becslés helyett más típusú becslés
például a robosztus becslés is alkalmazható.
Lokális modellalkotás
A lokális modellek létrehozása a függvényapproximáció szokásos módszereivel
történhet. Legegyszerűbb eljárásként a három ismeretlenes polinómokat
alkalmazhatjuk az alábbiak szerint:
A gyakorlati igényeket a harmadfokú polinómok rendszerint kielégítik. Húsz
együtthatójuk kiszámításához legalább ugyanennyi ismert ponttal kell
rendelkeznünk.
Amikor az ri környezetét közelítő Gi(r)
függvény együtthatóit határozzuk meg az ismert pontokat ugyanebből a
környezetből kell választanunk. A választás alapjául egy referencia távolság vagy
koordináta különbség szolgálhat. Sokkal megbízhatóbb eredményt nyujt, ha a
kérdéses pontokat a VORONOI poliéderek által nyújtott
elsődleges és másodlagos szomszédságból választjuk.
Annak ellenére, hogy rendszerint simító módszereket használunk
az együtthatók meghatározására megkívánhatjuk az ui=Gi(ri) feltétel
teljesülését is az ri
pontban. Gi együtthatóit
általában valamiféle kiegyenlítéssel, rendszerint a legkisebb négyzetek
módszere felhasználásával számoljuk. E számításokban súlyokat is
alkalmazhatunk az ri-től mért távolság függvényében.
A lokálisan approximált Gi(r) függvény
jól közelíti az f(r) függvényt a felhasznált ismert pontok
tartományán belül. Az extrapolációs tartományban azonban a polinómos közelítés
hibája rohamosan nő és a végtelen felé tart.
A szórások és súlyok számítása
A Gi(r) függvények létrehozása után kiszámíthatók a fluktuációk
és a hozzájuk tartozó dij távolságok. Ha szakaszokra osztjuk a
legnagyobb távolságot úgy az alábbiak szerint becsülhetjük meg egy kiválasztott
szakasz átlagos távolságához tartozó szórásnégyzetet:
,
ahol K a vizsgált intervallumba eső távolságok száma. Ha felrakjuk a d,
sd2 érték párokat,
úgy egy kiegyenlítő egyenes segítségével megkaphatjuk a Gi(r)
függvényekkel becsült ui,r értékek átlagos szórásnégyzetét a
távolság függvényében.
Általánosságban a sd2(d) függvény jól becsülhető az alábbi kifejezéssel:
,
ahol a függvény szórása az ismert pontokban, az a,b,c
paraméterek pedig a d, sd2 értékpárokból
számíthatók. Ha korábbi elképzelésünknek megfelelően előírjuk, hogy az ri pontban Gi(r) = ui , úgy c
= 0.
Bizonyos esetekben előfordul, hogy a szórás irányfüggő. Ebben
az esetben az euklideszi távolság helyett a következő távolságfogalmat
használhatjuk:
.
Ebben az esetben a D mátrix elemeit a többi paraméterrel együtt kell
meghatározni. Most már eltekinthetünk a szakaszokra bontástól és
megbecsülhetjük a dij=dji szakaszokhoz tartozó és fluktuációkat,
melyek felhasználásával
.
Ha az ri pontok térbeli eloszlása túlságosan egyenlőtlen úgy a globális függvény
helyett külön szórás függvényt alkalmazhatunk minden lokális
modellhez.
A szórásokból a súlyok az alábbiak szerint számíthatók:
.
A globális modell összeállítása
A lokális modellek alapján a tér valamennyi r pontjában kiszámíthatjuk a
különböző ui,r értékeket és meghatározhatjuk szórásaikat és súlyaikat. Az ui,r; si,r , (i=1,2,...,M)
(sorozat elemei úgy tekinthetők, mint az f(r) mennyiség
meghatározására irányuló különböző pontosságú közvetett mérések.
Következésképpen az várható értéket és szórását valamely
paraméter becslési eljárással határozhatjuk meg. Az ui,r mennyiségek
korreláltsága általában elhanyagolható. A legegyszerűbb becslési eljárás a
legkisebb négyzetek módszerének alkalmazásából következő súlyozott számtani
közép:
.
A módszer hatékonysága növelhető, ha bevezetünk egy T
hatástávolságot, melynél távolabbi pontokra konstruált Gi függvények nem szólnak bele a várható érték képzésbe.
A módszer nyujtotta fM(r) globális
approximálo függvény folyamatos és törésmentes az egész értelmezési
tartományban, második deriváltjai szintén folyamatosak, maga a függvény pedig
kellőképpen sima.
Megjegyzéseit
E-mail-en várja a szerző: Dr Sárközy Ferenc