46. Fejezet - MŰVELETI HIBÁK
Magyar változat: Detrekői Ákos, Budapesti Műszaki Egyetem
A. HIBATERJEDÉS
Alkalmazási példa
Hibaanalízisa
Érzékenységanalízis
B. A HIBÁK KÖVETKEZMÉNYEI
Raszter adatok
Vektor adatok
A digitalizálás hibái
AZ említett problámák kiküszöbölésének stratégiái
Poligonok illesztésének következményei
C. PONTOSSÁGI INFORMÁCIÓK TÁROLÁSA
Raszter adatok
Vektor adatok
A helyzetmeghatározás bizonytalansága
Attribútum tartalmi bizonytalanságok
IRODALOM
ELLENŐRZŐ KÉRDÉSEK
MEGJEGYZÉSEK
46. Fejezet - MŰVELETI HIBÁK
Magyar változat: Detrekői Ákos, Budapesti Műszaki Egyetem
A. HIBATERJEDÉS
- a GIS alkalmazásokban különböző forrásokból származó különböző pontosságú adatokat használnak fel
- milyen befolyást gyakorol az egyes rétegek hibája a végeredményre?
Alkalmazási példa
Feladat: egy adott pontból kiinduló mintegy 150 km hosszú elektromos távvezeték nyomvonalának kijelölése Közép-Nyugat mezőgazdaságilag intenzíven művelt és sűrűn lakott területén
- a vizsgált területet mintegy 30.000 darab 500 m oldalhosszúságú rasztercellával fedték le
- megállapították, hogy mintegy 100 szempontot indokolt figyelembevenni a nyomvonal kijelölésekor, például:
- a mezőgazdasági termőképesség (dollár/ha),
- település (van vagy nincs)
- engedélyezett távvezeték nyomvonalak (van vagy nincs)
- a szempontokat csoportosították és rangsorolták egy O-6 értékű skála alapján
- a rangsoroláskor olyan tényezőket vizsgáltak és vetettek össze, mint a társadalmi és a mezőgazdasági hatás
- a rangsort súlyozott összegként alakították ki:
alkalmasság = w1x1 + w2x2
esetleg egyszerű feltételek előírásával:
alkalmasság = 0 ,ha település = "van"
vagy osztálybasorolással:
alkalmasság = 3 ,ha x1=A és x2=d
alkalmasság = 4 ,ha x1=B és x2=d
Hibaanalízis
- a hibák hatása a rangsoroláskor hogyan jelentkezik
- a hatások erősítik-e egymást, például összeszorzódnak?
- közömbösítik-e egymást?
- az egyes rétegek hibái függetlenek egymástól, vagy kapcsolatosak?
- tételezzük fel, hogy két térképet, amelyek mindegyike 0,90 szinten osztályozott, fedésbe hozunk
- az eddigi vizsgálatok (mindkét térkép azonos pontjainak százalékai alapján) azt mutatják, hogy a levezetett térkép pontossága valamivel jobb, mint 0,90*0,90=0,81;
- ha több térképet hozunk fedésbe, a levezetett eredmény pontossága igen kicsi lehet
- általában a levezetett alkalmassági index pontossága nagyobb érdeklődésre tart számot, mint maguk az egyes fedvények attribútumainak pontossága
- bizonyos műveletek esetén az alkalmasság pontosságát a legkisebb pontosságú réteg határozza meg;
- ez az állítás feltétlenül igaz, ha az alkalmasságot osztályozással, az és művelet kiterjedt alkalmazásával, vagy egyszerű feltételek alapján vizsgálják
- más esetekben viszont az eredmény pontossága lényegesen jobb a legkevésbé pontos réteg pontosságánál;
- ez az eset fordulhat elő, ha az alkalmasságot sulyozott összeg alapján vizsgáljuk, illetve, ha az osztályozás alapján történő vizsgálatkor a vagy műveletet alkalmazzuk,
- például alkalmasság=4 ,ha x1=A vagy x2=d
Érzékenységanalízis
- hogyan határozzuk meg a pontatlanságnak a hatását az eredményre?
- kétféle válasz is szükséges lehet:
- a hibák hatása az alkalmassági térképre,
- a hibák hatása a legjobb nyomvonalra;
- a kétféle válasz lényegesen különbözhet
- hasznos lehet a kérdés más jellegű feltevése:
- milyen pontosságú rétegek szükségesek egy megkívánt pontosságú eredmény eléréséhez?
- az érzékenység arra ad választ, milyen változást okoz az eredményben (az alkalmasságban vagy a nyomvonalban) valamely bemenő adat egységnyi változása,
- könnyen értelmezhető az egységnyi változás a mezőgazdasági termelésben dollárban egy acre területen, viszont mit jelent az egységnyi változás vegetációs osztályban?
- az érzékenység definiálható a következőkre:
1. bemenő adatok:
- mennyire változik meg az eredmény az adatok változásának hatására?
2. súlyok:
- mennyire változik meg az eredmény valamely tényező súlyának változásakor?
- a súlyok hibájának meghatározása az adatok hibájával majdnem azonos jelentőségű
- az érzékenység mérése hatékonyan történhet a teljes mérési tartomány alapján,
- azaz valamely bemenő mennyiség legkisebb mért értékétől a legnagyobb mért értékig mutatott változásának alapján,
- például tételezzük fel a települések rétegét (van-nincs)
- tegyük a települések rétegét =van értékűvé, s végezzük el a legjobb nyomvonal alkalmassági számítását,
- ezután ismételjük meg a számítást =nincs értéknél,
- a különbség felhasználható a település réteg érzékenységének mérésére
- azok a különben fontos rétegek, amelyek az adott területen nem mutatnak jelentős földrajzi változást, az érzékenység definíciója alapján nem lényegesek
- különbséget kell tenni az érzékenység elméleti és gyakorlati jelentősége között;
- valamely réteg elméletileg igen fontos lehet, de a vizsgált területre nem gyakorol hatást
- például a mezőgazdasági termőképesség elvben igen fontos, viszont ha az egész területen azonos értékű, akkor nincs hatása a nyomvonalra
- a valóságban csak viszonylag kevés réteg (az elméleti 100 közül) gyakorol lényeges hatást a végső nyomvonalra;
- a hatékony metodológia érdekében igen fontos ezen rétegek ismerete;
- meg kell vizsgálni mind a döntési szabályokat, mind az értékek sorát annak érdekében, hogy meghatározzák, mely rétegek gyakorolják a legnagyobb hatást az alkalmassági termékre;
- ez az információ jól hasznosítható a szükséges bemenő pontosság meghatározásában
- azaz ha a pontosság növelése nincs hatással az eredményre, akkor szükségtelen költséges részletes felmérések elvégzése
- az érzékenység analízis alkalmas az adatok bizonytalansága hatásának megállapítására is;
- ennek érdekében ki kell számítani és össze kell vetni az elképzelhető szélső értékekhez tartozó eredményeket,
- így elő lehet állítani egy, az eredményhez tartozó "konfidencia intervallumot"
- az érzékenység alkalmas a térbeli felbontás meghatározására is;
- a felbontás növelése jobb eredményeket biztosítana?
- indokolt-e a nagyobb felbontást nyújtó újabb adatgyűjtés többletköltsége?
- növelhetjük-e a térbeli felbontás értékét?
B. A HIBÁK KÖVETKEZMÉNYEI
- a következmények olyan nemkívánatos hatások, amelyek annak eredményei, hogy nagy élességű GIS-t
alkalmazunk alacsony pontosságú térbeli adatok feldolgozásakor;
- általában helyzeti és nem attribútumhibákból származnak
Raszter adatok
- a raszter adatok felbontását a pixelméret megszabja
- minél kisebb az egyes pixelek mérete, annál nagyobb a pontosság, ilyenkor nemkívánatos következmények nem várhatók
Vektor adatok esetén:
- az élesség és a pontosság gyakran különbözik
- jelentős problémák két területen mutatkoznak:
- a digitalizáláskor,
- a poligonok átfedésekor
A digitalizálás hibái
- a digitalizálást végző operátor nem tudja a poligonokat tökéletesen zárni, illetve a vonalak pontos metszését biztosítani;
- elő kell írni egy tűrésértéket, amelyen belül a hiányzó részek, illetve az átfutások javíthatók
- a legtöbb operátor nehézség nélkül tartani tudja a 0,02 inch, illetve a 0,5 mm tűrésértéket
- abban az esetben jelentkeznek problémák, ha a térkép az előbbi értéknél finomabb felbontású részleteket is tartalmaz,
- például poligon igen szűk "szorossal"
- például egymáshoz igen közeli egyenesek esetén melyiket fogjuk (tartsuk) meg?
- például túlfutó szakaszok eltávolítása
- ilyenkor a helyes topológia miatt a vonal előző részeit is figyelni kell
Az említett problémák kiküszöbölésének stratégiái
- lényegében a következő két lehetőség közötti helyes arány kialakítására kell törekednünk:
1. megkérjük az operátort a probléma megoldására, ezzel lassítjuk a digitalizálást;
2. rendszert fejlesztünk ki a megoldáshoz, ez jó szoftvert és központi processzort (CPU) igényel
- minden rendszer saját módszert alakított ki a problémák kiküszöbölésére, vagy csökkentésére;
- a rendszerek egy része sikeresebb a többinél
1. a felhasználótól fotográfiai úton felnagyított térképet kérünk;
- ha a térkép méretarányát célszerűen változtatják, akkor a részletek nagyobbak lesznek a tűrésnél
- igen nehéz vagy lehetetlen gyorsan és olcsón hibátlan nagyításhoz jutni
2. Előírják a felhasználónak az egyes vonalak elkülönített digitalizálását
- például ha a következő vonalat egy ívként digitalizálják, akkor nem jön létre metszés,
- program ilyenkor csak a vonalak végein jelentkező hiányok, túlfutások ellenőrzéséhez kell,
- unalmas az operátornak
3. Előírják a felhasználónak a metszéspontok azonosítását
- más gombot kell lenyomni a metszéspontok digitalizálásakor,
- meg kell várni a rendszer jelzését a sikeres regisztrálásról
4. Rendszert alakítanak ki a metszéspontok folyamatos ellenőrzésére a digitalizáláskor
- gyors, speciális processzort igényel,
- az adatbázis növekedésével növekszik a számítási teher,
- az eredmények folytonos megjelentetése szükséges,
- nem jó importált adatokhoz
5. Szabályokat alakítanak ki a számítógépes döntéshez
- például egy poligon két részét tényleg két poligonnak érzékeli, nem pedig a határvonal összeszűkülésének,
- a poligon alakjára adhatók elvárások
- komoly terhelést jelent a számítógépnek
- a jelenlegi legjobb megoldást a 3. és a 4. stratégia kombinációja jelenti
- általában nagyon hasznos a digitalizálást jelöléssel nyomonkövetni valamely átlátszó fedvényen
- tollal ellátott eszköz igen jó gyakorlati megoldás
Poligonok illesztésének következményei
- a "forgács" poligonok kezelésére szolgáló algoritmusok korábban szerepeltek
- a "forgács" poligonok problémája másik megoldási stratégiáját a poligonok primitívekre bontásának megengedése jelenti
- ez eltérést jelent az adatbázis modelltől, amelyben minden poligon különböző réteg,
- például tételezzük fel,hogy egy facsoportot (poligon) két részre bont egy út (vonal)
- a megosztott rész primitív objektummá válik, amelyet csak egyszer tárolnak az adatbázisban és két magasabbrendű sajátság által megosztott
- a megosztott primitívek használatával elkerülhetők olyan következmények, hogy a facsoport/út vonal a két verzió összehasonlításakor vagy illesztésekor egyszer az út objektumhoz, máskor a facsoport objektumhoz tartozzék
- ahhoz, hogy a megosztott primitíveket a digitalizáláskor azonosítani tudjuk, ugyanazon dokumentumon kell lenniük
- szükséges egy művelet, amely biztosítja a két különböző primitív azonosítását mint elválasztottét és egymás mellé helyezettét
- ezen kívül szükséges egy ellentétes művelet, amely el nem választottként tekinti az egyes primitíveket, ha a vonal egyik változata elmozdul, a másik nem
C. PONTOSSÁGI INFORMÁCIÓK TÁROLÁSA
- hogyan tároljuk a pontossági információkat az adatbázisban?
Raszter adatok
- az egyes cellákhoz tartozó attribútumok bizonytalanságát a cellákhoz rendelt valószínűség attribútumok készletével tárolhatjuk, minden lehetséges osztályhoz egy értéket rendelve,
- távérzékelt adatok esetén ezek az értékek az osztályozásból közvetlenül nyerhetők
- a DTM magasságok bizonytalansága minden elemre közel azonos, így ezt a raszterek összességére metaadatként tárolhatjuk
- a helyzetmeghatározás is gyakorlatilag állandó az egész raszterre
- elég egyszer tárolni az egész térképre
Vektor adatok
- a vektor adatok bizonytalanságainak adatbázisban történő tárolása öt potenciális szinten történhet:
- térkép,
- tárgyosztály,
- poligon,
- él,
- pont
A helymeghatározás bizonytalansága
- a helymeghatározás bizonyos szinthez tartozó pontossága nem feltétlenül utal az egyéb szintek pontosságára
- valamely pont pontossága nem sokat mond egy él pontosságáról,
- hasonlóan, a poligonok szintjéhez tartozó pontosság zavart okozhat a poligonokat megosztó élekkel kapcsolatban
- vonalak és poligonok pontossága, mint a következők
attribútuma tárolható:
- él (például két poligon átmeneti sávjaként),
- objektumok osztálya (például vasutak meghatározási hibája),
- a térkép, mint egész (például a térképen minden vonalat, vagy határt egy meghatározott pontossággal digitalizáltak)
- pontok esetében mind a pont, az osztály, vagy a térkép attribútuma tárolható
Attribútumok bizonytalansága
- valamely objektum attribútumának bizonytalansága a következő módokon tárolható:
- az objektum egy attribútumaként (például a poligon 9O %-a A),
- mint az objektum valamely teljes osztályának attribútuma (például az A típusú talajt az idők folyamán 9O %-ban helyesen azonosították)
IRODALOM
Burrough, P.A., 1986. "Principles of Geographical Information Systems for Land Resources Assessment",
Clarendon, Oxford. Chapter 6 on error in GIS.
Chrisman, N.R., 1983. "The role of quality information in the long-term functioning of a geographic
information system," Cartographica 21:79.
Goodchild, M.F. and S. Gopal, editors, 1989. "The Accuracy of Spatial Databases", Taylor and Francis,
Basingstoke, UK. Edited papers from a conference on error in spatial databases.
ELLENŐRZŐ KÉRDÉSEK
1. Határozza meg a különbséget a hibákkal összefüggő érzékenység elméleti jelentése és gyakorlati hasznosítása között!
2. Képzelje el, hogy valamely település képviselője egy tervezett távvezetékkel kapcsolatos vitában. Milyen érvekkel támadná a távvezeték társaság eljárását?
3. Hasonlítsa össze az ebben az egységben tárgyalt a digitalizáló rendszerekre vonatkozó módszereket az ön által használt rendszerrel! Lát-e valami jelentős előnyét az ön rendszerének?
4. Számos GIS művelet igen érzékeny az adatok kis hibáira is. Mondjon példát ilyen műveletekre, s tegyen javaslatot a hibák célszerű kezelésére!
|