Geo-visualisatie/Inleiding GIS
Deel A: Theorie / Inleiding GIS |
Wat is GIS?
GIS is de afkorting van Geografisch Informatie Systeem. In een GIS kunnen diverse (informatie)lagen over elkaar worden gelegd. Met GIS-technieken kunnen ruimtelijke gegevens worden gegenereerd, gevisualiseerd, bewerkt en geanalyseerd. In het spraakgebruik, ook door GIS-specialisten zelf, wordt met GIS vaak nog in een bredere definitie bedoeld. De visualisatie van een GIS gebeurt meestal in kaartvorm. Zo ontstaan ruimtelijke relaties tussen de verschillende informatielagen, relaties die zonder locatiecomponent niet gemaakt konden worden en die zonder gebruik van een GIS dus verborgen zouden blijven. Elke informatielaag bevat een aantal bij elkaar horende ruimtelijke objecten, zoals wegen, percelen en straatverlichting. Bij de definitie van GIS alléén aan een kaartengenerator denken, is echter veel te beperkt.
Met een GIS kunnen namelijk ook ruimtelijke analyses worden uitgevoerd met die informatielagen. Sterker, sommige cartografen vinden nog steeds dat een GIS helemaal geen goede kaarten kan maken. GIS is in de jaren tachtig ook
ontstaan als meer een ruimtelijk, analytisch rekensysteem dan als een 'kaartengenerator'. Een hoogtekaart kan bijvoorbeeld om worden gerekend naar een hellingpercentagekaart. En vijf kaarten bij elkaar – locaties van supermarkten, wegen, aantal inwoners, gemiddeld inkomen per adres of wijk en de grondprijs – kunnen omgerekend worden naar een geschiktheidskaart voor de beste plekken voor een nieuwe supermarkt.
In plaats van dat GIS als 'techniek' wordt gedefinieerd, wordt GIS ook vaak gebruikt voor een afdeling van een bedrijf, of een proces, inclusief 'data-, hard-, soft-, org- en humanware'. GIS wordt ook wel eens als synoniem gebruikt voor de complete geo-informatie voorziening. Daar valt dan ook onder de inwinning (het beheer) van geo-informatie en de ontsluiting met behulp van zogenaamde viewers aan werknemers of klanten. Soms worden vreemd genoeg ook landmeetkundige activiteiten, de landmeters zelf en vastgoedafdelingen van gemeentes tot GIS en de afdeling GIS gerekend.
GIS-software maakt per definitie gebruik van een geo-informatie, en als het goed is, is die geo-informatie samenhangend ingebed in een GIS-model / de processen die een GIS moet ondersteunen voor een onderzoeksdoel of organisatie ('orgware').
Volgens T. Wade en S. Sommer is een GIS het geheel van software en data om informatie te tonen en / of te beheren op basis van hun geografische locaties, ruimtelijke analyses te kunnen uitvoeren en ruimtelijke processen te kunnen modelleren.[1]
Volgens J. Maantay en J. Ziegler[2] zou in elke willekeurige definitie van GIS nooit de GIS-gebruiker mogen ontbreken, omdat deze essentiële expertkennis toevoegt, door het bedienen ervan, door de selectie van geo-informatie, de keuze van de GIS-functionaliteit en de representatie van het resultaat.
Uit het voorgaande blijkt dat er geen eenduidigheid is over de definitie van GIS. Afhankelijk van de betrokkenheid, de kennis of het doel zijn de vele definities wel in drie soorten in te delen (zie figuur):
- de ruimste GIS-definities omvatten 'alles': human-, org-, data- soft- en hardware
- de meer gebruikelijke GIS-definities omvatten minimaal de dataware en de software
- de meer beperkte definitie omvat alleen het aangeschafte software pakket.
Die laatste definitie is letterlijk (te) beperkt te noemen, omdat de software die de fabrikant levert niets kan zonder data en een logisch model (de gebruikelijkere definities) en iemand die het GIS kan bedienen met de juiste GIS-tools (de bredere definities).
Merk op dat de werkelijkheid niet tot een GIS behoort, zoals dat met geen enkel informatiesysteem het geval zal kunnen zijn. In de module Communicatie zal hier verder op worden ingegaan, omdat daardoor kennis over het datamodel onontbeerlijk is. Conclusies over de werkelijkheid kunnen alléén getrokken worden indien men weet welk datamodel (met alle beperkingen van dien) gebruikt is om die werkelijkheid in een kaart / GIS te zetten.
Wat kan met een GIS?
De belangrijkste soorten toepassingsmogelijkheden van GIS-software zijn:
- Visualisatie van informatie die op een locatie betrekking heeft. Dit is de bekendste bijdrage van GIS.
- Analyses waarbij selecties van ruimtelijke objecten worden bepaald op basis van nabijheid, overlap of mogelijke verbindingen via een (wegen)netwerk van andere objecten.
- Berekeningen waarbij – geheel geautomatiseerd – aan objecten afstanden, gebiedsbeschrijvingen worden toegekend, op basis van nabijheid of overlap met andere gebieden. Dit is te zien als verrijking van informatie, en maakt het beheer van informatie door de beherende instantie daarvan vaak veel efficiënter.
- Planning en voorspelling. Bouwprojecten kunnen begeleid worden. Door kaarten van bodem, klimaat, helling, grondgebruik te combineren kan erosie voorspeld worden, en op basis van sociaal-economische thema's kunnen gunstigste locaties voor bedrijven, wegen, stations en natuurgebieden bepaald worden.
- Het beheer van geo-informatie. Dat wil zeggen, de totstandkoming van geo-informatie en wijzigingen daarna verwerken.
1 tot en met 4 zijn toepassingsmogelijkheden waarbij het GIS ook als zogenaamd decision support system (beleidsondersteunend systeem) wordt gebruikt.
Welke vragen zijn aan een GIS(-viewer) te stellen? (naar Kraak en Ormeling 2003[3], "Understanding GIS" [4] en Meetkundige Dienst RWS, 2000[5]):
Met een aantal voorbeelden uit de gemeentelijke wereld wordt dit hieronder verder duidelijk gemaakt. Dit gebeurt zonder hierbij de indruk te willen wekken een volledige opsomming van alle mogelijkheden van een GIS te noemen. Wel zal de kracht en verscheidenheid van GIS in zijn volledige breedte duidelijk worden. Het voorbeeld komt uit de beheerstaken van de gemeente, die verantwoordelijk is voor het beheer van de openbare ruimte, zoals lantaarnpalen, de ondergrondse leidingen, en communicatie met de rechthebbenden van de percelen.
Ad Visualisatie:
- In de figuur hierboven is te zien van hoe data-lagen in een GIS of GIS-model opgenomen zijn. Tezamen vormen ze een kaart. De informatie (lees: objecten) uit de datalagen wordt op het scherm getekend in een bepaalde volgorde; van onder naar boven.
- Bij kaart A kan de gemeente zien welke leidingsoort waar ligt en in welke straten lantaarns zijn.
- Bij kaart B is – dankzij een legendawijziging waarbij de data zelf niet wijzigt – te zien welke leidingen wanneer vervangen dienen te worden. De kleur staat plotseling niet meer voor een leidingsoort, maar voor een jaartal. De onderste kaartlaag – in dit voorbeeld bij kaart A en B: 'percelen' – wordt dus het eerst getekend. Datalagen met vlakken, zoals percelen, staan daarom vrijwel zonder uitzondering onderaan, lijnen daar boven en data-lagen met punten staan daar weer boven. Anders zouden de datalagen (vaak thema's of – foutief – kaartlagen genoemd) met vlakken de symbolen bedekken en onzichtbaar maken.
- Dit laatste is te zien in kaart C. Leuk detail: merk op dat in het GIS-model de ondergrondse leidingen 'boven' de percelen liggen ... Zonder deze 'truc' – lees: zonder de werkelijkheid 'geweld aan te doen' – zouden ondergrondse leidingen nooit gevisualiseerd kunnen worden.
Ad Analyses:
- Kaart D: Wanneer een leiding vervangen moet worden, is het handig – voor het op de hoogte stellen van de betrokken bewoners – om te weten welke percelen hiermee gemoeid zijn. De betrokken percelen kunnen (per jaar of per leidingsoort) berekend worden. Met een GIS (lees: door het weten van de locaties van zowel de percelen als de leidingen) kunnen dergelijke zaken vrijwel met één druk op de knop gevisualiseerd en berekend worden. Zonder een GIS had de gemeente alle percelen aan alle leidingen moeten koppelen, bijvoorbeeld in een relationele database. Dat was veel kostbaarder en lastiger te beheren geweest.
- Kaart E: van één perceel kan automatisch berekend worden welke soort objecten (hier: leidingen) er onder liggen. Dat kunnen er meerdere zijn, één, of géén. Ook dat laatste is een antwoord!
Ad Berekeningen:
- Kaart F: Wanneer de gemaakte analyses worden weggeschreven in de database (bij de geo-informatie wordt opgeslagen) is sprake van verrijking van data. Bij kaart F is de datalaag 'wijken' over de eerder getoonde kaart 'heen gelegd'. Met één 'druk op de knop' zijn alle percelen uit de database aangevuld met het 'attribuut' (kenmerk) "wijknummer". De GIS bespaart op deze wijze veel invoertijd bij de beheerders en de kans op fouten neemt af.
- Kaart G: Hier is te zien hoe percelen worden geselecteerd die binnen 50 meter van lantaarnpalen liggen. Wanneer hier bijvoorbeeld onderhoud bij moet worden gepleegd, of de kleur verandert van wit naar neon, dan zijn die omwonenden 'met een druk op de knop' bekend, zonder handmatige berekeningen.
Ad beheer:
- Met beheer wordt bedoeld, inwinning, controle, invoer, aanpassingen en verwerking van verkregen data tot dat deze maximaal geschikt is voor geautomatiseerde verwerking. In de paragrafen 'Objectsoorten en opslag van geo-informatie' en 'Het bijzondere van GIS-data: de attributen' wordt verder toegelicht hoe dit in zijn werk gaat. In de paragraaf hiervoor zagen we al een reden waarom beheer van data soms makkelijker in de GIS kan gebeuren dan met andere (teken- of database) systemen; door bepaalde berekeningen kunnen gegevens eenvoudiger en/of met minder fouten ingevoerd worden.
Ad planning en voorspelling:
- In de inleiding van dit handboek is eerder getoond hoe bepaald kan worden hoe varianten van een nieuwe weg om en dorp berekend kunnen worden (klik eventueel op de figuur rechts). De GIS-specialisten (vaak van ingenieursbureaus) gebruiken daartoe hellingkaarten, kaarten met juridische beperkingen, en natuurwaardekaarten om te bepalen welke wegen en varianten mogelijk zijn, en wat de varianten kosten qua natuuropoffering en qua geld. Milieueffectrapportages zijn hier een mooi voorbeeld van. Als het gaat om voorspelling: hoe snel en waar een polder het eerst onderloopt is te bepalen met een GIS, waardoor een evacuatieplan beter kan worden geoptimaliseerd. Ook erosie in Limburg kan zo goed worden voorspeld.
Dit zijn voorbeelden van een aantal zeer gangbare functionaliteiten van GIS-software. De werkelijke mogelijkheden zijn véél groter. GIS als software bestaat al sinds de jaren tachtig. De ontwikkelingen zijn met name sinds 1990 zeer hard gegaan, en zijn betaalbaar geworden. Op het gebied van beheer, 3D-visualisatie, geostatistiek, geocoderen, cartografie, geoprocessing, netwerkanalyses zijn de functionaliteiten zeer breed en specialistisch te noemen.
GIS-toepassingen zijn onder meer te vinden in / bij:
Economie / commercie | assetmanagement (zie bijvoorbeeld wegbeheer), (geografische) marktpenetratie, marketing en verzekering; zie bijvoorbeeld markt-potentie-kaarten-VS en Geomarketing in het Openbaar Vervoer in Limburg, navigatiesystemen, toerisme, delfstoffen (onderzoek, inwinning, exploitatie, distributie), transport, landbouw |
Beheer / overheid | incidentmanagement, risicomanagement en risicokartering, objectbeheer, vastgoed (gemeentelijke Vastgoed Informatie Systemen of V.I.S.), kadastrale systemen, tot voor kort ook wel Land Informatie Systemen (L.I.S.) genoemd, schouwen (periodiek inspecteren van objecten, al of niet met Mobiele technieken; Location Based Services of L.B.S.)), Openbare Orde en Veiligheid (O.O.V.-sector), voor het in kaart brengen van criminaliteit / onderzoek en mobiele toepassingen voor de 'agent op straat', publieksvoorlichting, (openbare) nuts-sector, landschaps- en natuurbeheer, bosbouw. |
Medisch / sociaalgeografisch | archeologie, vervoersstromen, congestieonderzoek, toegankelijkheidsonderzoek (denk aan nabijheid van parken, scholen en ander voorzieningen vanuit bepaalde (achterstands) wijken, arbeidsparticipatie, medisch onderzoek, denk aan geografische spreiding van ziekten zoals, zie onder andere Nationale Atlas Volksgezondheid en specifiek Rode Hond, optimalisatie van locatie van ziekenhuizen, ambulanceposten. |
Milieu / Fysisch-geografisch / wetenschappelijk onderzoek |
geomorfologie, hydrografie, meteorologie, (landschaps)ecologie, bodemkundig onderzoek, zie erosiegevoeligheidskarteringen |
Inwinningstechnieken / ontwerp | inwinning geo-informatie, zie onder andere remote sensing, ontwerp (inclusief (schaduw-) effect op omgeving van bijvoorbeeld hoge gebouwen), milieu-effect rapportages (MER-studies), zichtlijnanalyses bij grootschalige projecten / hoogbouw, Virtual Reality (zie VR), effectstudies van bijvoorbeeld stuwdammen; waar ontstaan stuwmeren, wat loopt onder als de dam 5 meter hoger wordt? |
NB1: Uiteraard is bovenstaande tabel alleen indicatief, niet uitputtend. Meer voorbeelden van GIS-toepassingen zijn te vinden in de module met links: Overige Informatie.
NB2: Dit handboek richt zich met name op het (goed) visualiseren van geo-informatie. Analyses en (beheer)toepassingen zijn vaak én zeer specifiek, én worden als mogelijkheden vaak al in de GIS (software) boeken uitgebreid uitgelegd. Daarnaast zijn die functionaliteiten per GIS-pakket zeer verschillend en worden ze verschillend genoemd.
Wat is een GIS-model?
Voordat er een kaart gemaakt kan worden heb je – zoals eerder opgemerkt – een GIS-model nodig. Simpel gezegd is een GIS-model een verzameling (kaart)gegevens, verkregen uit metingen of berekeningen, meestal van een beperkt gebied; geo-informatie.
GIS-modellen bestaan uit gestapelde, digitale lagen (geo-)informatie (datasets). De lagen liggen in één overeenkomstig assenstelsel. Elke laag bevat (de locaties van) objecten. Elke locatie of object is gelinkt aan een database met attribuut-informatie (in het figuur de Z-as). De 'Z'-as is in dit verband niet per definitie een hoogteas, maar geeft – voor welke laag dan ook – de attribuutwaarde weer. Bijvoorbeeld de hoogte, het grondgebruik, de onderhoudstatus of de aanwezige of toekomstige infrastructuur. Op basis van overeenkomstige Z- en Y-waarden kunnen de Z-waarden in een model verder verwerkt of gebruikt worden. Het kunnen combineren van de kaartlagen geldt dus niet alleen voor het kaarten maken, maar ook voor verdere analyses. De attribuutwaarden zelf kunnen namelijk geherclassificeerd worden. Of ze kunnen samen met attribuutwaarden van andere lagen gecombineerd worden, door zogenaamde ruimtelijke analyses.
Hierboven werd al een voorbeeld genoemd waarbij een nieuwe supermarktlocatie moest worden bepaald met een GIS. Gezien de input – er werd over vijf soorten informatielagen gesproken – was er in die 'case' al een (sociaal-economisch) GIS-model bekend. GIS-modellen kennen blijkbaar niet alleen een ruimtelijke component (jouw input) maar ook een vakinhoudelijke kant.
Kijk eens naar het figuur met de foto van een Oostenrijks dal. Hier is de plaats van een GIS-model te zien bij de totstandkoming van een GIS-opdracht. De GIS-opdracht was simpel; laat zien waar de mogelijkheden zijn om een weg aan te leggen om het dorp heen, gezien alle daar geldende beperkingen. Met de nodige vakkennis (het brein rechtsboven) van een planoloog of fysisch geograaf worden de benodigde informatielagen in stelling gebracht. Zoals maximaal mogelijke hellingshoeken, belemmerende regelgeving, bebouwing, enzovoort. Merk op dat al deze input (informatielagen) een ruimtelijke component hebben. Zelfs regelgeving is in een informatielaag weer te geven.
Tezamen vormen deze informatielagen het belangrijkste deel van het GIS-model. Het GIS-model wordt gebruikt als een modelmatige representatie van de werkelijkheid, op basis van hoe tegen de werkelijkheid aan wordt gekeken. Dat is dus een model met een bepaald (en beperkt) doel. De output / de kaarten die ermee gemaakt kunnen worden zijn dus ook per definitie beperkt. Merk op dat het GIS-model in de figuur niet alleen uit kaarten bestaat, maar ook uit (de mogelijkheid tot) berekeningen. In de output is namelijk ook het begrip steilheid nodig; deze wordt in het model berekend. De steilheid is door een GIS vanuit de informatielaag 'hoogte' op elk punt berekend. Dit was nodig om te kijken waar de steilheid niet te groot zou zijn.
Soms lees je dat het ontwerpen van een GIS-model (of de fysieke database ervan, of het verzamelen van een set data nodig voor een kaart) hetzelfde is als het zoeken naar de beste representatie van de werkelijkheid buiten. Eigenlijk is dat zéér fout. Omwille van kostenefficiency én om moeite te besparen ga je namelijk vooral niet 'alles wat je buiten ziet' in kaart brengen. Je zult nét zo nauwkeurig data willen inwinnen, of die data aanschaffen, die nét nog voldoende is voor het beantwoorden van je vraag. Wat wél bedoeld wordt, is dat de werkelijkheid buiten – voor zover die nodig is voor het beantwoorden van vragen – zo goed mogelijk beschreven moet worden.
Wat is geo-informatie?
Een kaart is volgens J. Maantay en J. Ziegler een schaalmodel van de werkelijkheid, waarbij de informatie over de fysieke wereld die nodig is om die modellen op te bouwen gevormd wordt door geo-informatie (Engels: 'spatial data').[6]
In dit handboek wordt geo-informatie gezien als input voor een GIS, noodzakelijk om een thema te visualiseren of een kaart te maken.
Kennis over geo-informatie is nodig om voor de juiste input te kunnen zorgen, zodat de kwaliteit van het eindproduct – de analyse of de kaart – vooraf gegarandeerd kan worden richting de opdrachtgever en de doelgroep.
Hieronder volgen daarom:
- hoe geo-informatie is opgebouwd en hoe dit wordt opgeslagen
- de eigenschappen/beperkingen van geo-informatie die hier uit volgen.
Objectsoorten en opslag van geo-informatie
Geo-informatie beschrijft de werkelijkheid door een beschrijving er van in drie objectsoorten:
- punten
- lijnen
- vlakken.
Deze objecten kunnen op twee manieren in bestanden of databases worden opgeslagen:
- als vectordata en
- als rasterdata.
Bij de opslag worden de objectgegevens vaak in twee delen beschreven:
- De geografie, waarin de coördinaten van de objecten – de locatie ervan op aarde in een bepaald coördinatiestelsel – worden beschreven.
- De administratieve gegevens, waarin de 'attributen' worden beschreven. Met 'administratief' wordt bedoeld de tekstuele of numerieke classificatie of benoeming. Denk aan omschrijving, kwalificatie, status, naam, jaartal, et cetera.
De reden dat geografische en administratieve gegevens in twee aparte delen worden beschreven, heeft te maken met het feit dat het lezen, opslaan en vooral rekenen met geografische gegevens veel efficiënter en sneller kan indien die gegevens in aparte, binaire formaten worden opgeslagen. Dit apart opslaan gebeurt zowel in bestandsgeoriënteerde opslag als bij ruimtelijke databases, ook al lijkt het soms om één bestand of één tabel in de database te gaan. Naast de geografische en administratieve objectgegevens kunnen bij de geo-informatie ook andere, extra gegevens worden opgeslagen, zoals:
- projectiegegevens
- standaardlegenda
- onderlinge relaties
- cartografische coördinaten indien die moeten afwijken van hun geografische coördinaten en
- topologische regels, waarmee onderlinge consistentie op attribuutwaarden en geografische kenmerken kunnen worden afgedwongen
- metadata.
- Metadata is 'data over data', waarmee bedoeld wordt dat de gehele dataset, dus niet de individuele objecten, beschreven wordt met kenmerken als actualiteit, beheerder, betekenis van de attributen, compleetheid, geografische dekking, inwinningsschaal, enzovoort. Metadata kan zowel los, als bij het bestand zijn opgeslagen. Metadata is essentieel voor het kunnen gebruiken en interpreteren van de geo-informatie, zie onder 'toepassingscontext'.
- Overigens, ook bij de uiteindelijke publicatie kan het nuttig of noodzakelijk zijn om delen uit de metadata kenbaar te maken aan de doelgroep. Bijvoorbeeld door onder aan een kaart te melden: 'Het percentage CDA-stemmers per gemeente is uit een exit poll van 2006, en kent een nauwkeurigheid van plus of min 2 %'. Merk op dat er bij geo-informatie een attribuutnauwkeurigheid is en een geometrische nauwkeurigheid. Attribuutnauwkeurigheid wordt vaak vergeten door GIS-specialisten.
- Bij vectordata worden de locaties van individuele objecten beschreven middels punten, lijnen en vlakken:
- Een punt(object) wordt voorgesteld door één coördinaat.
- Een lijn bestaat uit minimaal twee met elkaar verbonden coördinaten. Zijn het er méér dan twee dan worden de tussenliggende coördinaten vertices genoemd. Hoe méér vertices, hoe nauwkeuriger de lijn kan worden opgeslagen; De omtrek van een provincie is met 100 punten te beschrijven, maar met 1000 punten is beter wanneer ook op gemeenteniveau moet worden ingezoomd.
- Een vlak (ook wel een polygoon genoemd) bestaat uit een lijn waarvan het beginpunt gelijk is aan het eindpunt; alle coördinaten ertussen behoren tot dat vlak. Er kunnen ook vlakken met gaten en zogeheten multivlakken (multipolygonen) beschreven worden. Bij multivlakken wordt bijvoorbeeld de provincie Friesland als één object gedefinieerd, dus de vlakken van het vaste land en die van de eilanden worden als één object, een regel, opgeslagen. Dit heeft onder andere als voordeel dat de naam en de afkorting van de provincie niet voor elk onderdeel van zo'n vlak hoeft te worden opgeslagen en beheerd. Maar ook is het oppervlak van de gehele provincie met dat ene multivlak direct te berekenen in een GIS.
- Bij rasterdata worden objecten – onafhankelijk of het lijnen, punten of vlakken zijn – door attribuutwaarden op een (meestal) regelmatig grid (raster) opgeslagen.
- Een rastercel wordt ook wel pixel genoemd, niet te verwarren met de pixels van een beeldscherm. Pixel is afgeleid van het Engelse 'picture element'.
- Een object kan nooit nauwkeuriger dan de grootte van één pixel worden beschreven. Is een (punt-, lijn-, of vlak-) object kleiner dan een halve pixel, dan zal dit object niet worden beschreven, óf het object is bewust te groot afgebeeld. Een lijn bestaat uit meerdere losse pixels (zie de rivier in het middelste plaat rechts). Zoals het is opgeslagen is het geen lijn, slechts visueel is dit als lijn te herkennen, omdat de individueel opgeslagen 'lijn/rivier' pixels met dezelfde kleur zijn gevisualiseerd. Merk op dat in het voorbeeld de rivier ergens ook geen aangrenzende pixels kent!
- In elke pixel wordt een of meer attributen gedefinieerd, zoals in het voorbeeld de grondgebruiksklasse. Elke pixelwaarde is onafhankelijk van waarde in de pixel daarnaast, en wordt dus ook onafhankelijk van de andere waarde opgeslagen. Rasterbestanden zijn dan ook vaak groter dan vectorbestanden, waarin de waarde van een groot vlak slechts één keer wordt opgeslagen.
- In een GIS kunnen rasterbestanden alleen worden ingelezen als deze bestanden ook ruimtelijke context bevatten. Hierin staat meestal de celgrootte van het raster dat gebruikt is, bijvoorbeeld in meters, en de coördinaten van de linker onderhoek. Deze informatie kan in het bestand zelf staan, zoals bij een 'Geo-tiff'-bestand, of er buiten in een apart bestand worden opgeslagen, zoals bij een 'tif-bestand'. Die aparte bestanden worden soms ook worldfiles genoemd. Houdt dit in de gaten als je rasters aangeleverd krijgt. Zonder deze coördinaten kan je de rasterdata nooit (of zeer onnauwkeurig) op de juiste plek in je GIS / kaart krijgen.
- Op luchtfoto's en satellietbeelden bepaalt de grootte van de objecten of een punt- of lijnvormig object nog (goed) waargenomen kan worden, zie de afbeelding van Texel.
- Bij topografische rasterkaarten zijn puntobjecten vaak symbolisch vergroot. Denk aan kerktorens, hunebedden, windmolens en wegwijzers.
- Rasterdata bestaat er in:
- een 'intelligente' vorm, waarin elke rastercel een attribuut vertolkt dat ook een fenomeen beschrijft, zoals het landgebruik in het voorbeeld rechts. Alle pixels met het grondgebruik 'bos' krijgen als attribuutwaarde in de kolom grondgebruikklasse de code 'B' (codering van Bos). De visuele kleur is dan voor alle pixels in één actie te bepalen met GIS, waardoor het bos geheel groen wordt (of rood indien gewenst).
- een 'niet intelligente' vorm. Hierbij beschrijft de rasterdata met kleuren rechtstreeks een luchtfoto of kaart. De cellen hebben dan géén attribuutwaarde, maar een kleur. Die kleur kan een kleur zijn zoals een satelliet- of luchtfoto die heeft waargenomen, of zoals een kaartenmaker die heeft bepaald. Met een GIS zijn die kleuren slechts iets lichter of iets donkerder te maken. Een luchtfoto lichter maken kan handig zijn als die luchtfoto's letterlijk op de achtergrond moet komen, zie verder Deel C; kaartopmaak.
Rechtsboven een voorbeeld van hoe de kwaliteit van data achteruit kan gaan bij conversies. Hier betreft het eerst een 'vector-naar-raster' conversie, daarna een 'raster-naar-vector' conversie.
- Doordat bij de eerste conversie een grof grid is gebruikt, is de middelste rasterdata wellicht niet geschikt voor bepaalde gedetailleerde uitspraken.
- Het is ook mogelijk dat rasterdata geconverteerd wordt naar vectordata. Wanneer dat het geval is lijkt de nauwkeurigheid misschien groter geworden; er kan op worden ingezoomd zonder dat men de grootte van de originele cellen ziet. Merk op dat in dit voorbeeld de rastergrootte erg groot is, dat de rivier als vlak niet meer één gesloten vlak is en dat (veel detail bij de) bebouwing verdwenen is. Bij oppervlakte berekeningen van het bos zou een dergelijke kaart misschien nog voldoende zijn.
- Bij zowel raster- als vectordata is het ver kunnen inzoomen gelimiteerd. Bij ver inzoomen op rasterdata is de onnauwkeurigheid als snel te zien door de blokkerige structuur. Bij vectordata is de onnauwkeurigheid niet te zien: de objecten zijn in vlakken of lijnen.
- Er gaat altijd informatie verloren, deze kan beperkt worden bij een kleine celgrootte van het raster.
Hierboven hadden we het steeds over tweedimensionale geo-informatie, waarin punten, lijnen en vlakken zowel als vectordata, als als rasterdata kunnen worden opgeslagen. Wanneer driedimensionale gegevens als raster worden opgeslagen, kan dat niet met tweedimensionale (vierkante) vlakjes, maar moet dat met (rechthoekige) kubusjes. Sterk ingezoomd op zo'n model zal je die kubusjes ook kunnen zien. Deze kubusjes worden voxels genoemd. Voxels is een samentrekking van de twee Engelse woorden 'volume' en 'pixels'; oftewel een 'pixel met een volume'. Je zal deze term en dergelijke bestanden alleen tegen komen als je veel met hoogtemodellen (zie ook de figuur) gaat werken. Niet alle GIS-softwarepakketten kunnen met voxels werken.
Toepassing van Rasterdata:
Rasterdata:
- dient vaak als ondergrond;
- wordt gebruikt wanneer je de lijn niet wilt prijsgeven (bijvoorbeeld als commerciële partij), opdat derden jouw data niet kunnen gebruiken voor nauwkeurige analyses. De rasterondergrond is dan ook vaak goedkoper dan de originele vectorbestanden die ten grondslag liggen aan de rasterdata;
- wordt gebruikt wanneer de gebruiker, zeker bij verder inzoomen in een GIS, geen schijnnauwkeurigheid wilt meegeven;
- gebruik je als de data nu eenmaal ook per grid (pixel, vierkant) is ingewonnen, zoals bij luchtfoto's, satellietbeelden en remote sensing, of wanneer deze gegevens op dit niveau zijn berekend middels (GIS) analyses met een bepaalde gridgrootte, denk aan de kans op erosie in vakken van 100 bij 100 meter, of de gemiddelde regenval in het stroomgebied van de Rijn in vakken van 1 km bij 1 km.
SAMENVATTING: Objecten kunnen met geo-informatie middels punten, lijnen en vlakken worden beschreven. De beschrijving bestaat meestal uit zowel de coördinaten van de objecten, als uit andere objectkenmerken en -beschrijvingen. De objecten kunnen als rasters en als vectoren worden opgeslagen. Een mogelijke conversie van rasterformaat naar vectorformaat zorgt niet voor verlies van kwaliteit, maar wel verlies van kennis over die kwaliteit. Een conversie andersom, van vector naar raster formaat, zorgt bij te grote rastercellen al gauw voor verlies aan kwaliteit.
TIP: In het algemeen geldt: zorg dat je kennis hebt over hoe de kaarten die jij gebruikt, tot stand zijn gekomen.
CAD-data en GIS-data
Vaak wordt door GIS-specialisten gesproken over de term 'GIS-data', als verbijzondering van geo-informatie. Ze doen dat bewust, omdat niet alle soorten geo-informatie met een GIS eenvoudig tot een kaart zijn om te vormen. Geo-informatie is namelijk een verzamelterm voor alle informatie met een geografische component. Dus ook CAD-(Computer Aided Design) gegevens vallen onder geo-informatie. Het bijzondere van GIS-data is dat niet alleen de punten, lijnen en vlakken worden opgeslagen, ook de bij die objecten horende attributen. Vandaar dat GIS-data, boven CAD-data, ook wel 'intelligente' data worden genoemd. Daardoor zijn er binnen een GIS plotseling veel meer mogelijkheden, zowel op het gebied van visualisaties (zie volgende paragraaf) als op het gebied van ruimtelijke en administratieve analyses.
Overigens, met 'administratief' wordt bedoeld niet de ruimtelijke gegevens van objecten in GIS-data, maar de tegenhanger ervan, de tekstuele en numerieke tabelgegevens.
Enkele eigenschappen van CAD-data en GIS-data:
- CAD-data wordt vaker voor ontwerp- en landmeetkundige toepassingen gebruikt. Bij CAD-data hangt er aan objecten meestal geen database gegevens aan. Voorbeelden van CAD-formaten die een GIS-specialist kan tegenkomen zijn Designfiles (dgn) van Microstation en Drawing-files (dwg) van AutoCad. Kleur en lijnstijl geven kenmerken weer van wat gekarteerd is. In CAD-data wordt de kleur en de lijnstijl direct in het (geografische) bestand opgeslagen. Hierdoor is nauwelijks te selecteren op kenmerken, of met de kenmerken te rekenen. In de figuur is te zien dat niet alle lijnen van een CAD-bestand per se elkaar moeten raken; het is meer een tekening van symbolen, dan dat elk individueel object is beschreven. Teksten zijn dicht bij de symbolen geplaatst, zodat visueel duidelijk is welk nummer hoort bij welk punt, of welke beschrijving (struiken, bomen) hoort bij welk vlak.
- GIS-data wordt meer voor beheerdoeleinden gebruikt, denk aan het beheren van de infrastructuur, transport, het gemeentelijk groen en vastgoed. In GIS-data wordt, in tegenstelling tot bij CAD-data, in het bestand meestal niet opgeslagen hoe de objecten er in gevisualiseerd moeten worden. Dat visualiseren moet nog in een GIS gebeuren en gaat geautomatiseerd voor alle objecten gelijktijdig op basis van de attribuutwaarden in de achterliggende database. Dat biedt de GIS-specialist een ongekende vrijheid om de GIS-data te visualiseren. De gekozen visualisatie wordt door zo'n GIS buiten de GIS-data opgeslagen.
GIS-specialisten hebben dus het liefst GIS-data, ook wel intelligente of 'GIS-waardige' data genoemd. Overigens, in de meeste GIS-pakketten is ook CAD-data in te lezen. GIS-pakketten hebben er echter wel vaak moeite mee. De in CAD-data opgeslagen visuele eigenschappen als lijndikte, lijnstijl en kleur en gebruikte puntsymbolen gaan dan verloren.
Is CAD-data objectgeoriënteerd, dan kan deze met wat moeite omgezet worden in GIS-data. Ontwikkelaars van CAD-software slagen er steeds meer in om ook met hun CAD objectgeoriënteerde bestanden te kunnen leveren, waar wél attribuutdata in opgeslagen zijn en die wél goed is in te lezen in een GIS. CAD en GIS groeien daarmee steeds meer naar elkaar toe. Soms lezen ze dezelfde data in. In de praktijk zal echter voorlopig nog steeds gelden: werk je met een GIS, zoek dan in eerste instantie naar GIS-data.
Objectgeoriënteerd
Met name bij CAD-data worden lijnen van objecten niet altijd netjes exact op elkaar aangesloten, zogeheten undershoots. Dat is ook niet erg wanneer deze data 'slechts' voor visualisatie wordt gebruikt, zolang er maar niet te ver op wordt ingezoomd. Het is dan ook niet erg dat de tekenaars de lijnen te ver doortrekken daar waar ze op een andere lijn hadden moeten eindigen, zogeheten overshoots (of dangles). Met andere woorden CAD-bestanden worden lang niet altijd wat we noemen 'objectgeoriënteerd' opgebouwd. 'Spaghettidigitalisering' is de wat licht negatief bedoelde naam voor het 'niet objectgericht karteren of digitaliseren'. Bij verwerking in een GIS is dit objectgeoriënteerd zijn vrijwel altijd een noodzaak.
Nog zo'n term is een pseudonode, een node (vertex) die niet nodig is, omdat de lijn daar niet buigt. Voor een GIS is dat qua analyse geen probleem. Komt het echter in één bestand heel vaak voor, dan kunnen deze psuedonodes, oftwel onnodige vertices, de performance wel negatief beïnvloeden. Pseudonodes ontstaan niet zozeer door overijverige of onzekere digitaliseer-specialisten. Vaker ontstaan die op het moment dat door een GIS-tool, in een bepaald conversieproces, korte lijstukjes, ooit met een CAD getekend, worden samengevoegd tot één lijn. In de figuur is dat het geval bij 'ndl' (linker deel figuur, paarsblauwe lijn). Worden die twee middelste lijnen (geautomatiseerd of handmatig) samengevoegd (middelste deel figuur), dan ontstaat er in het midden een vertex die zonder software niet zichtbaar is, omdat er geen buigpunt te zien is. Een GIS kan meestal deze onnodige tussenpuntenpunten weghalen met een tool zoals bijvoorbeeld 'remove pseudonodes'. Deze punten bepalen immers niet de vorm van zo'n lijn.
Met objectgeoriënteerd (ook vaak objectgericht genoemd) wordt bedoeld dat de lijnen niet getekend zijn om allerlei grenzen aan te geven, maar om de objecten aan te geven. Begin- en eindpunten van lijnen zijn niet lukraak gekozen, maar stoppen en starten daar waar het object ook begint en eindigt. Ook voor vlakken geldt dat die niet omgeven worden door lukraak getekende lijnen, maar door één omhullende lijn. Twee rechthoekige aangrenzende percelen worden niet weergegeven door 7 of 8 lijnen, maar door 2 vlakken (zie figuur). Bovendien zijn de van een objectgeoriënteerde dataset vrijwel altijd ook meteen koppelbaar gemaakt aan beschrijvingen in andere (administratieve) databases.
Tijdens het digitaliseren met CAD-software of achteraf met een GIS is middels topologische regels af te dwingen dat lijnen en vlakken objectgeoriënteerd worden getekend of opgeslagen. Er is bijvoorbeeld in te stellen dat lijnen op minimaal twee andere lijnen moeten aansluiten, anders had die lijn één lijn moeten zijn. Of dat vlakken (in het geval van grondgebruik of percelen) elkaar niet mogen overlappen. Zie verder de toelichting bij de figuur.
Zoals je bij lijnen under- en overshoots hebt, zo heb je bij vlakken zogeheten slivers, ook wel sliver-polygonen genoemd. Een Nederlandse term bestaat hier niet voor. Slivers zijn polygonen (vlakken) die elkaar onterecht niet over raken – er zitten dan gaten tussen de vlakken – of elkaar onterecht overlappen. Zo dienen gemeentegrenzen (de omtrekken van de vlakken die gemeentes beschrijven) van naburige gemeente te sluiten. Er mogen nooit gebieden zijn waarvoor geldt dat die niet tot een bepaalde gemeente vallen. Ook mogen de gemeentes elkaar niet overlappen. Bij veel soorten geo-informatie mogen géén slivers vóórkomen. Denk aan bodemkaarten, hoogtezones, geluidsniveaus en allerlei bestuurlijke indelingen. Er kan namelijk op één plek altijd maar één (niet meer en niet minder) waarde van toepassing zijn; er is op een bepaalde plek maar één bodemsoort, één hoogtezone, een geluidsniveau en één provincie van toepassing. Er kan op één punt niet géén bodemsoort voorkomen, of twee bodemsoorten.
Over slivers:
- NB1: Voor sommige vlakken kunnen mogen wél overlappen en gaten voorkomen; die overlappen worden dan ook géén slivers genoemd. Denk aan stankcirkels rondom dicht bij elkaar liggende varkensboerderijen, of verzorgingsgebieden van concurrerende winkelcentra.
- NB2: Slivers ontstaan vaak door het samenvoegen (of 'mergen') van verschillende bestanden van verschillende nauwkeurigheid of beheerd door verschillende instanties. Bijvoorbeeld: meerdere, naburige gemeentes leveren de door hun beheerde of in kaart gebrachte gemeentegrenzen aan één persoon die ze wil combineren.
- NB3: Met allerlei GIS-tools zijn deze tekortkomingen (want dat zijn slivers!) op te sporen, en soms ook gedeeltelijk automatisch te verwijderen binnen een bepaalde marge en – helaas – met een risico dat de data toch gewijzigd wordt waar je dat niet wilt. Ook kunnen deze fouten handmatig verbeterd worden. Beter is het om topologieregels in te voeren. Bijvoorbeeld: "een (gemeente)vlak dient over de gehele omtrek aangrenzend te zijn met een ander (gemeente)vlak (of zee)". Veel, duur en intensief correctiewerk wordt zo voorkomen en analyses zullen daarna betrouwbaar zijn en geen hiaten vertonen, zoals lantaarnpalen die niet aan een beheerder of gemeente worden toebedeeld!
- NB4: Met allerlei snapping-tools kunnen – achteraf – of bij het tekenen zelf minieme over- en undershoots, dus ook slivers, voorkomen of verbeterd worden. Bij het gebruik van snapping tijdens het tekenen of wijzigen, wordt door het GIS-programma afgedwongen dat de punten goed worden geplaatst. Punten die je 'op zicht' ongeveer over een vertex (knikpunt) van een naburig vlak of lijn heen legt, komen zo ook daadwerkelijk exact op die ene vertex te liggen.
- NB5: Meer over slivers, mergen, topologie en het nut van objectgeoriënteerdheid, zie Vervolg GIS.)
SAMENVATTING: Undershoots, overshoots en slivers zijn tekortkomingen in je geo-informatiebestand, die vaak achteraf, bij wat verder inzoomen of bepaalde analyses, aan het licht komen. Erger is wanneer ze niet aan het licht komen. Voorkom deze tekortkomingen met GIS-tools als snapping en het instellen van topologieregels wanneer je bestanden zelf aanlegt of beheert. Krijg je gegevens van anderen, controleer dan of deze tekortkomingen er in voorkomen. Voor veel analyses is het namelijk zeer essentieel dat lijnen en vlakken objectgeorriënteerd zijn opgeslagen. Op kaarten kan het uiteraard ook zeer slordig staan.
TIP: Wil je verstoken blijven van problemen of conversies met je GIS om CAD-data om te zetten naar GIS-(waardige) data, zorg dan dat de CAD-data die je krijgt objectgeoriënteerd is, of, veel beter, dat je GIS-(waardige) data krijgt. Ben je toch afhankelijk van niet-objectgeoriënteerde CAD-data, dan kan je die in een GIS waarschijnlijk alleen als achtergrondkaart gebruiken. Veel berekeningen of een ingewikkelde visualisatie op basis van verschillende lijn- of vlak-soorten zullen niet lukken.
Het bijzondere van GIS-data: de attributen
Hieronder, om elk misverstand uit te sluiten, hoe objecten uit werkelijkheid en de attributen van die objecten worden opgeslagen in een GIS-bestand.
In het figuur hieronder wordt duidelijk dat GIS-data uit een geografische en een administratieve component bestaat:
In de geografische component wordt de geometrie beschreven, oftewel de bij de objecten behorende coördinaten van de punten of vertices (bij lijnen en vlakken). In de administratieve component worden alle thematische gegevens beschreven, op basis van allerlei denkbare tekstuele en getalsmatige gegevens.
Middels een ID (dit is een Engelse afkorting, spreek uit: "ai-die") oftewel een overeenkomstig 'identificatienummer', is bekend welke regel in de tabel bij welke object in de kaart hoort.
Bij bedrijfstoepassingen of bij zeer grote hoeveelheden administratieve gegevens word veel attribuutgegevens vaak opgeslagen en beheerd buiten de GIS-data, in een externe database. Slechts dat éne ID is dan voldoende om de objecten op basis van attributen uit de database juist te kunnen visualiseren. Er moet dan wel een verbinding (of onlinekoppeling) tussen het GIS-pakket en die externe database zijn. Is dat niet het geval, dan zijn er problemen te verwachten op het gebied van uitwisseling van gegevens, combineerbaarheid, consistentie en actualiteit en is er waarschijnlijk sprake van een onnodig hoge beheerslast voor de organisatie.
Wanneer je in een GIS-pakket GIS-data laadt, zal eerst voor alle objecten uit een GIS-bestand één willekeurige kleur worden getekend. Alle objecten (bijvoorbeeld: alle punten) hebben dan dezelfde kleuren. Op basis van de thematische / administratieve gegevens uit de tabel zijn de individuele objecten dan andere kleuren of symbolen toe te kennen. Dat is te zien in de figuur hier rechtsboven. Duidelijk is dat de attribuutwaarden van de verschillende objecten, samen met de inventiviteit van de GIS-specialist, bepalen hoe de objecten uit de GIS-data gevisualiseerd worden. De mogelijkheden zijn 'eindeloos'. Richtlijnen over hoe dat moet gebeuren staan in de delen B en C van dit handboek.
Let op: buiten deze twee bovenstaande paragrafen wordt niet specifiek over GIS-data gesproken. Gekozen is om de term geo-informatie te gebruiken, een algemeen geaccepteerde, neutrale term. Vaak zal echter wel bedoeld worden: GIS-data, omdat dit voor een GIS-specialist de meest ideale geo-informatie is.
Gebruik maken van attributen: over queries of 'zoekvragen'
Attributen zijn de kracht van geo-informatie. Een GIS kan hier op meerdere manieren slim gebruik van maken. Zoals gezegd, in deel B (thematische kaarten) en deel C (o.a. bij het labellen) zal op de daadwerkelijke toepassing terug gekomen worden. Hieronder nog wat theoretische achtergrond, die nodig zal zijn om er überhaupt gebruik van te kunnen maken.
Hieronder een voorbeeld hoe een goed doordacht (maar zeer simpel) GIS-model er voor zorgt dat er snel en plezierig gebruik kan worden gemaakt van de mogelijkheden die een GIS biedt.
Het eerste figuur toont één tabel (gegevensbestand of geo-informatie) met grote steden van Nederland. Merk op dat er een kolom 'Status' in staat:
Voor die steden die een provinciehoofdstad zijn, is dit in deze kolom 'Status' aangegeven. Met dit (gedeeltelijk getoonde) bestand zijn drie kaarten gemaakt. Door slim gebruik te maken van de attributen zijn met dit bestand verschillende soorten kaarten te maken:
Over de kaart met steden en provinciehoofdsteden:
- De eerste kaart, links, toont alle steden uit dit bestand (ongelabeld).
- De tweede kaart toont zowel de labels als het symbool van provinciehoofdsteden anders dan de overige steden. Provinciehoofdsteden zijn bij het labelen apart geselecteerd, en hebben een aparte tekstopmaak gekregen (onderstreept en met hoofdletters). Dat betekent dat het dus niet nodig was een aparte kolom te maken waarin de steden met hoofdletters zijn geschreven.
- De derde kaart, rechts, toont alléén de steden waarvan de attribuutwaarde 'Status' (uit in de kolom 'Status') 'provinciehoofdstad'. Hier is dus automatisch door het GIS-pakket geselecteerd in het bestand met álle steden.
In tegenstelling wat een beginnende GIS-ser of – eerder – een buitenstaander misschien zou verwachten, hoeven voor de drie kaarten die gemaakt zijn niet verschillende bestanden (één met hoofdsteden, één met alle steden, en misschien wel één met overige steden) te worden gemaakt. Het mag duidelijk zijn dat de opbouw van zo'n steden bestand moet aangepast zijn op basis van wat nodig is voor analyse en kaarten maken. De exacte opbouw van zo'n GIS-bestand is een simpel voorbeeld van een GIS-model. Zonder over die opbouw vooraf goed (en eenmalig) na te denken, kan je later wel eens enorm veel moeite blijken te hebben met het maken van goede analyses en kaarten.
In de tweede en derde kaart lijkt het zo in de eenvoudige legenda die linksboven is getoond, dat er sprake is van een tweetal bestanden ('lagen') die worden aan- of uitgevinkt. In werkelijkheid verwijzen ze beide naar dezelfde data: het eerder genoemde bestand met álle steden. Hoe kan het dan zijn dat de laag 'provinciesteden' niet alle objecten/steden laat zien in de kaart, maar slechts die steden die ook echt provinciehoofdstad zijn?
Hierboven is tweemaal gesproken over selecteren. Het (automatisch) selecteren gebeurt met zogenaamde queries (Engels, spreek uit: kwèries) of in het Nederlands 'zoekvragen'. Een query beperkt het objecten dat voorkomt in een geheel databestand op basis van een of meer voorwaarden. Queries maken gebruik van zogenaamde SQL-statements (Standard Query Language). GIS-pakketten zorgen vaak dat je met een wizard of op een andere manier deze selecties makkelijk kan maken. Vaak heb je het snel onder de knie. Een beperkte hoeveelheid kennis over SQL kan jou effectiviteit en de functionaliteit van je GIS vergroten. Hieronder wordt alleen een zeer summiere uitleg en het hierboven gebruikte voorbeeld gegeven.
Een SQL-query (of: select-statement in dit geval) ziet er bijvoorbeeld als volgt uit:
SELECT * FROM tabelnaam WHERE kolomnaam = ... voorwaarde ...
- Uitleg over deze opbouw:
- SELECT: 'selecteer'; hierachter wordt in een GIS meestal een * genoteerd: dat betekent alle velden.
- FROM: 'uit'; hierachter komt de naam van de tabel
- WHERE: 'waar voor geldt dat'; hierachter komen de veldnamen met waarden waaraan de velden moeten voldoen. Hier wordt gebruikt gemaakt van 'Boleaanse' operatoren, zoals = <>, >, <. Deze laatste regel wordt ook wel de 'whereclausule' genoemd. In sommige GIS-pakketten zal je alléén deze laatste regel te zien krijgen, waardoor het selecteren nog weer iets simpeler is gemaakt.
In het voorbeeld van hierboven is bij de 2e en 3e kaart dit select-statement gebruikt:
SELECT * FROM hetnederlandsestedendataset WHERE [STATUS] = 'provinciehoofdstad'.
Dankzij deze 'select-statements' hoeven we niet twee aparte bestanden te beheren; één met provinciehoofdsteden en een ander met de overige steden. Zonder select-statements en zonder bepaalde attribuutkolommen zou je nooit de toegevoegde waarde uit een GIS kunnen halen die er in zit. Door slim gebruik te maken van attribuutkolommen kunnen bestanden bij elkaar worden toegevoegd die voorheen misschien dubbel of separaat van elkaar zouden moeten worden bijgehouden. Dit zorgt voor minder werk en minder fouten aan de kant van de beheerder.
SAMENVATTING: Door vooraf te weten wat je met een GIS wilt, kan je definiëren welke attributen nodig zijn in een bestand. Door SQL (queries of zoekvragen) kan je uit GIS-bestanden beperkte subsets halen, die je vervolgens gebruikt voor visualisatie van slechts die objecten die je nodig hebt, of om slechts die objecten te labellen die voldoen aan een bepaalde voorwaarde of belangrijkheid. Voor zowel analyses, representatie als het beheer is deze techniek van waarde.
TIP: De notaties die GIS-pakketten bij queries gebruiken wijken soms licht af van de officiële SQL-schrijfwijze. Doorgaans zal je daar geen last van hebben. De ene keer moet je een " vervangen door een ' of omgekeerd. Meer informatie kan je vinden op Wikipedia over SQL, of op Wikipedia over Operatoren, maar wellicht is je eigen GIS-handleiding al voldoende. Een zware wiskundige achtergrond of programmeerkennis is niet echt nodig; een GIS-specialist heeft aan een beperkte, beginnende hoeveelheid 'SQL'-kennis voldoende.
Eigenschappen van geo-informatie
Uit bovenstaande paragrafen zal het nu duidelijk zijn waarom geo-informatie géén kaartlaag genoemd mag worden. Geo-informatie staat in dienst van een GIS-model. Een GIS-model om analyses of kaarten te maken. Een (digitaal gemaakte) kaart bestaat uit een of meer geo-informatie bestanden / datasets, die geheel of gedeeltelijk in een kaart gebruikt of getoond kunnen worden. Zo kan een GIS-data bestand 'topografie' ook gebruikt worden om op een kaart alleen straten weer te geven.
Een GIS beschrijft de werkelijkheid – voor zover de mens die al kan kennen – met allerlei beperkingen. Jij als GIS-specialist moet die altijd in het achterhoofd houden. Een GIS beschrijft niet de werkelijkheid. Dat komt omdat de geo-informatie die er in zit (vaak onterecht dus kaartlagen genoemd; datasets is beter) een gedwongen beperking van die werkelijkheid is.
Hier volgen een aantal van die eigenschappen, die beperkingen kunnen zijn.
- Toepassingscontext. De data is slechts nuttig binnen een bepaalde toepassingscontext. Elke toepassing stelt andere eisen aan data. Een voorbeeld. Een GIS-model voor de gunstigste busroutes zal een dataset 'wegen' bevatten, maar zonder de zandpaden. Een GIS voor een volledige stratenatlas zal die zandpaden wel moet kennen. Een ander voorbeeld. De wegbreedte wordt door een beheerder die ook de berm moet maaien, anders gedefinieerd dan een automobilist dat zou doen. Een autonavigatiesysteem zal weer géén wegbreedte nodig hebben bij die dataset 'wegen', die wil van elke weg de maximale snelheid weten.
- Generalisatie / weglating. De data bevat niet alle (kleinere) objecten. Een dataset 'rivieren' voor een atlas van heel Nederland zal niet de (kleine) Dortherbeek in de Achterhoek beschrijven, die een GIS-specialist die de beekdalgronden in kaart wil hebben toch echt wél nodig heeft. Hoe je zelf voor het kaarten maken van generalisatie gebruik kan maken, zie 'Generaliseren in deel B'.
- Nauwkeurigheid. De nauwkeurigheid kan niet optimaal zijn. De dataset 'kust' van Groot-Brittannië voor een kaart in een atlas zal al snel nauwkeurig genoeg zijn. Maar deze geeft nooit de werkelijkheid weer zoals een strandjutter in Plymouth die ervaart. Bij geo-informatie levert het aspect nauwkeurigheid vaker een beperking of limiterende factor dan het aspect precisie. Omdat deze twee termen vaak door elkaar gehaald worden, volgt hier toch het aspect precisie. Bij geo-informatie is zowel sprake van een attribuutnauwkeurigheid als een geometrische nauwkeurigheid. Zoals eerder gezegd, attribuutnauwkeurigheid wordt vaak vergeten door GIS-specialisten. Met attribuutnauwkeurigheid wordt bedoeld de nauwkeurigheid van de gemeten thematische waarden (attributen) van de objecten in de dataset. Denk aan een bestand met locaties van vijftig steden in Afrika met het aantal inwoners. Het aantal inwoners, een attribuut, kan zeer onnauwkeurig zijn, daar waar de locatie (geometrische nauwkeurigheid) zeer groot is.
- Precisie. Precisie is iets anders dan nauwkeurigheid. Precisie wordt bepaald door het aantal cijfers achter de komma waarmee een gemeten eenheid wordt opgeslagen. Laten we eens aannemen dat er een foutloze, onbetwistbare hoogtemeting van de Mount Everest is gedaan. Wellicht is de uitkomst daarvan 8850,36m plus of min een halve meter. De nauwkeurigheid is een halve meter. Dat betekent dat in werkelijkheid (zouden we die al kunnen weten of benaderen) de berg best 8849 of als we pech hebben 8851,50 zou kunnen zijn. De precisie waarmee de waarde is opgeslagen is 0.01 meter (twee decimalen) Gezien de onnauwkeurigheid is daarom beter te spreken over een hoogte van 8850 meter, waarbij – om geen onnodige fouten te introduceren bij bijvoorbeeld verschilmetingen – wel gewoon die 8850,36m in de database blijft staan. Ook op een kaart dient dan dus 8850 te staan, en niet iets 'nauwkeurigers'. Het is daarom heel gebruikelijk bij (geo-)informatie, dat waarden schijnbaar 'te precies' zijn opgeslagen. Vooral bij interpolaties. Maak niet de fout de precisie er uit te halen – door bijvoorbeeld cijfers achter de komma weg te gooien- door de precisie te bestempelen als onnauwkeurigheid. Het kaartbeeld zou door een dergelijke actie vreemde vormen aan kunnen nemen.
- Mutaties / actualiteit. De werkelijkheid verandert in de tijd. Wegen worden gebouwd, rivieren verleggen zich of worden wadi's, steden groeien en geluidsniveaus of bodemvervuilingscontouren veranderen snel of langzaam. Een bijzonder voorbeeld is een luchtfoto met daarop de 'kustlijn' van een gebied waar eb en vloed heerst. Je zou er verkeerde conclusies aan kunnen verbinden als de luchtfoto juist bij eb is genomen ... Kaarten kunnen overigens wel helpen om (langzaam) wijzigende fenomenen helder weer te geven. Bijvoorbeeld kaartseries van bebouwde kommen of bodemvervuilingscontouren. Die zouden om de tien jaar kunnen aangeven in welke richting de stad uitdijt of hoe de vervuiling – door grondwaterstromingen – langzaam groter maar minder geconcentreerd wordt. Naast kaartseries kunnen ook verschilkaarten berekend worden op basis van twee opeenvolgende kaarten van hetzelfde gebied met hetzelfde fenomeen. In het voorbeeldfiguur is het Aralmeer te zien. Veertig jaar geleden was het een meer van formaat. Het meer droogt sindsdien tot op de dag van vandaag steeds verder op doordat rivierwater voor agrarische en stedelijke toepassingen wordt gebruikt. De geo-informatie is hier nog niet op aangepast. Het gebruik van verouderde data kan de geloofwaardigheid van de kaart aantasten, zeker wanneer de combinatie van verschillende informatielagen in de kaart dit hiaat al direct laten zien.
- Definities. Definities van objecten in datasets kunnen uiteenlopen, deels misschien het resultaat van de toepassingscontext. Maar dit is misschien ook het resultaat van cultuur tussen twee gebieden/landen. Of verschil van inzicht dat niet is uitgesproken. Wat de één 'bebouwing' noemt, zal de ander splitsen in 'huizen en boerderijen', waarbij de schuren in eens niet worden meegenomen. Of Wadi's worden door de één wel tot rivieren gerekend, door de ander niet.
- Fuzzy-grenzen. In werkelijkheid gaat een steppe langzaam over in een bos. Maar waar ligt de grens? Gaat een steppe bij meer dan 10 bomen per hectare over in een bos? En hoe nauwkeurig valt die grens dan in te winnen en vervolgens te karteren? Ook een indicatie als wel of niet vervuild lijkt helder. Er zal immers een bepaalde drempelwaarde overschreden zijn. De kaart die vervolgens van zo'n dataset wordt gemaakt zal dus ook een haarscherpe grens opleveren. Zeker wanneer er veel en nauwkeurig is gemeten. De werkelijkheid is echter anders: er is gewoon een overgangsgebied. Dit geldt onder andere ook voor bodemkaarten. Dergelijke grenzen worden 'fuzzy-grenzen' genoemd. Fuzzy-grenzen is een ander begrip dan 'vage grenzen' (zie deel B).
- Classificaties. Door classificatieverschillen zijn gegevens misschien niet goed combineerbaar / bruikbaar. Een voorbeeld. Bij de
zeegraskartering.nl, door het Rijksinstituut Kust en Zee van Rijkswaterstaat, wordt in Nederland onderscheid gemaakt in een bepaald percentage bedekking. Een andere karteerder/bioloog had misschien gedacht aan: zeegras komt wél of niet voor en weer een andere karteerder neemt als norm: pas bij meer dan 30% bedekking bestempel ik de begroeiing als 'zeegras'. Het moge duidelijk zijn dat de twee alternatieve karteringen nauwelijks verantwoord zijn te combineren met de eerste kartering. In deel B wordt verder in gegaan op meetschalen en classificaties. - Compleetheid. Waar de ene toepassing genoeg heeft aan 'de belangrijkste objecten' zal een ander ze toch echt allemaal moeten hebben. Stel iemand heeft bijvoorbeeld een bestand met zo ongeveer alle belangrijkste overwegen om een beeld te krijgen van waar die het meeste voorkomen. Dat kan dan afdoende zijn. Echter dit is beslist onvoldoende voor een beheerder van de railinfrastructuur of een gemeente. Die moeten respectievelijk de veiligheid en mogelijke verbindingsroutes voor wandelaars kennen.
- De genoemde beperkingen worden bij het gebruik van geo-informatie soms geconstateerd en als fout gekwalificeerd. (Hé, het klopt niet dat die monumentale boom volgens dataset/kaart BOOMLOCATIES ligt die en die plek, want het valt volgens dataset/kaart KADASTRALE_KAART op het verkeerde perceel).
- Nog een leuke uitspraak (Bron: Wikipedia 2007 Misbruik_van_statistische_gegevens, auteur onbekend):
- "Er is al een statisticus verdronken in een meer dat gemiddeld een halve meter diep was."
- Wanneer dit een cartograaf was, was deze zeker niet goed gekwalificeerd!
Wanneer jij bovenstaande beperkingen kent, weet je welke kaartlagen wel of niet mogen worden gecombineerd, welke conclusies mogen worden getrokken en – eventueel – welke waarschuwingen je de gebruiker mee moet geven met de kaart. In Deel B en C zullen aan deze beperkingen cartografische principes worden verbonden. Zoals – in het geval van de boom – met welke schaal en dikte je bepaalde symbolen moet weergeven. En in hoeveel verschillende klassen classificeer je de bevolkingsdichtheid van 12 provincies of honderden gemeenten?
TIP1: Bedenk als GIS-specialist elke keer weer opnieuw of de dataset die je krijgt of al hebt wel voldoende is voor waar je het nu weer voor gebruikt. Je opdrachtgever zal dit niet altijd voor je doen. Jij wordt geacht te weten welke kenmerken de geo-informatie heeft die je gebruikt. Het kan beperkingen met zich meebrengen die de opdrachtgever en de kaartlezer dienen te kennen. Informatie over nauwkeurigheid, toepassingsmogelijkheden en mogelijke beperkingen zijn te vinden in de metadata van die dataset. Vraag daarnaar bij de bron. Zoek eventueel naar alternatieve geo-informatie zonder die beperkingen. Zoek niet naar de beste (dure) informatie, maar naar geschikte informatie.
TIP2: De beperkingen van geo-informatie staan in het ideale geval dus in de metadata die er bij hoort. Gebruikers van geo-informatie (of dat nu via een kaart of een analyse is) zijn meestal geheel onbekend met de genoemde beperkingen. Metadata en zaken als onbetrouwbaarheid zijn niet sexy. De gebruikers willen het vaak niet horen, het is te ingewikkeld, de metadata is niet vindbaar, er wordt in hun ogen onnodig moeilijk gedaan. Opmerkingen hierover vanuit de GIS-specialist landen dan ook vaak niet. Opmerkingen over de betrouwbaarheid in centimeters of de volledigheidsgraad van de attribuutvelden zijn niet echt. De kaartlezer wil hooguit het belangrijkste horen: voor welk doel is de kaart (of analyse) geschikt. Houdt hier rekening mee. Beperk het aantal waarschuwingen tot een tekstuele oneliner in of bij de kaart. Het zal wel op prijs gesteld worden wanneer jij als GIS-specialist deze samenvatting kan maken; jij bent immers degene die de gebruikte geo-informatie (wel) kent.
Intermezzo: Over het gebruik van satellietbeelden en luchtfoto's
Of deze rasterbestanden nu satellietbeelden zijn of 'echte luchtfoto's', er kleven gevaren aan. Hier onder een opsomming van enkele eigenschappen van dergelijke beelden. Het zijn die eigenschappen die al snel kunnen leiden tot foute interpretaties bij de lezer:
- Nauwkeurigheid verwarren met de pixelgrootte. De pixels van een originele, digitale luchtfoto zijn misschien 50 cm, maar de pixels die in beeld komen, in de kaart of op je scherm, kennen een grovere resolutie, omdat het beeld waarschijnlijk niet maximaal is ingezoomd op die nauwkeurige pixels.
- Relatieve nauwkeurigheid verwarren met absolute nauwkeurigheid. De leverancier van je bestand noemt misschien 50 cm als nauwkeurigheid, maar dat is de grootte van de kleinst mogelijke pixel. De absolute nauwkeurigheid is veel lager. De reden is dat de luchtfoto / het satellietbeeld is (nog) niet (goed) gegeorefereerd. (Zie eventueel 'Intermezzo Georefereren', onderaan in 'Vervolg Cartografie / Europa'.) De gehele luchtfoto kan tientallen pixels / meters verkeerd zijn geplaatst. Daarnaast zullen bepaalde objecten toch niet (goed) te zien zijn.
- Verkeerde (letterlijk en figuurlijk: vals) kleuren. In het voorbeeld van de satellietbeeldkaart van Nederland; het lijkt alsof het IJsselmeer inmiddels flink is ingepolderd. Algen of ondiep water zijn door het geautomatiseerde proces ontrecht met een landkleur (groen) weergegeven. Gebruik deze kaarten daarom alleen als de kaartlezer bekend is met het gebied en enige ervaring heeft met kaarten en satellietbeelden.
- Verkeerde / geen projectie. In dit voorbeeld is het satellietbeeld onbruikbaar. Nederland is veel te uitgerekt weergegeven, waarschijnlijk omdat ingezoomd is op een wereldkaart met een Mercatorprojectie. (Zie eventueel meer over projecties.)
Vermijd dergelijke slechte data, zorg voor goede projecties, zoom niet te ver in op kaarten en gebruik deze kaarten niet voor (nauwkeurige) afstandsmetingen of ruimtelijke analyses waar afstanden, vóórkomen en oppervlak een rol spelen. (Meer informatie over Remote Sensing (technieken, satellietbeelden), zie met name Lillesand, Kiefer, en Chipman; Remote Sensing and Image Interpretation, 2003, 5e editie).
Toepassingscontext
steden | #inwoners | afkorting | #klanten |
---|---|---|---|
alkmaar | 47.000 | AL | 470 |
Heerhugowaart | 25.000 | HH | 250 |
Amsterdam | 370.000 | AM | 3.700 |
Haarlem | 75.000 | HA | 750 |
De input die je gebruikt in een GIS is vaak niet (geheel) door jou of jouw bedrijf zelf ingewonnen. Of de data is afkomstig uit een afdeling die jij niet kent. Bekijk bijvoorbeeld eens bovenstaande tabel.
Stel je bent redacteur van een krant in Noord-Holland. Je moet een kaartje maken van de belangrijkste steden van Noord-Holland, als illustratie bij een artikel. De data krijg je via de mail van een behulpzame collega. Die heeft de data – heel handig – van de website van het busvervoerbedrijf 'Synnexxion' gehaald. Wanneer hier snel met een GIS een kaartje van wordt gemaakt, is het kaartje rechts wellicht het resultaat. Keurig met titel. Niet gevraagd, maar toch gedaan: je hebt de grootte van de cirkels op de een of andere manier laten afhangen van het aantal inwoners. En je hebt ook mooi een legenda toegevoegd. GIS is prachtig gebruikt. Of toch niet? Je mag hopen dat de redactie de klachten van de lezers voor is.
Wat is er fout gegaan? Het aantal inwoners klopt niet. Dat stond wel in de kolomnaam van die tabel, maar bedoeld werd het aantal inwoners relevant voor Synnexxion. Namelijk, het aantal inwoners dat binnen een straal van 500 meter woont in de omgeving van de bushaltes. Notabene, steden als Zaanstad en Den-Helder staan er niet in. Waarom niet? Omdat deze tabel alle steden bevatte in Noord-Holland waar het fictieve bedrijf Synnexxion een aanbestedingscontract heeft voor het openbaar vervoer.
Toch was de tabel voor Synnexxion vrijwel foutloos. Het aantal inwoners, zoals door Synnexxion gedefinieerd, klopte wel degelijk. Waarom mag zo'n tabel toch niet gebruikt worden? Er is sprake van een andere toepassingscontext. Voor het bedrijfsmodel van Synnexxion is ook de geringe precisie van de aantallen en het tweetal spelfouten in de namen geen enkel probleem. In 'jouw' kaart staan die fouten wél te veel. De kaart binnen de muren van Synnexxion is goed, er buiten is die kaart fout. Blijkbaar hebben data en kaarten een toepassingscontext.
Overigens, dat er meer mis is met de kaart van Noord-Holland (symbolen, uitlijning va de elementen, ontbreken van essentiële onderdelen), wordt in Deel B en C duidelijk. Er zijn ook twee opdrachten over.
SAMENVATTING: Gegevens worden ingewonnen voor een bepaalde – per definitie – beperkte toepassingscontext. Niet elke dataset die ergens voor geschikt lijkt, is dat ook. De wegendataset die in een TomTom (autonavigatiesysteem) wordt gebruikt, is Nederlanddekkend, is voor de autogebruiker je-van-het, maar is onbruikbaar voor het uitzetten van wandelroutes.
TIP1: Bespreek met de bron van de dataset de betekenis van de velden, ga de bron na, raadpleeg de metadata bij deze dataset.
TIP2: Ook al is de bron wél bruikbaar. Jij bent óók verantwoordelijk voor de output. In het voorbeeld zijn labels gebruikt. Labels op basis van een tabel die voorheen niet gebruikt werd voor externe communicatie. Er zitten twee fouten in de stadsnamen, dus ook in de labels die jij gegenereerd hebt. Een GIS neemt die fouten namelijk onverkort over. Controleer dus altijd de output. Ga niet klakkeloos uit van de juistheid van een bestand.
Digitalisering (facultatief)
Voor het maken van kaarten en analyses is dus geo-informatie nodig. Meestal hoeft een GIS-specialist als kaartenmaker niet zozeer bij het totale totstandkomingsproces van geo-informatie stil te staan. De gegevens zijn immers vaak al aanwezig. Toch is het voor sommige GIS-specialisten – zeker als er geadviseerd dient te worden bij inkoop en bij digitaliseringstrajecten – nodig om meer van digitalisering af te weten.
In het hoofdstuk hiervoor (Eigenschappen van geo-informatie) is al besproken dat niet elke soort geo-informatie inhoudelijk gezien zomaar gebruikt kan worden. Bijvoorbeeld omdat de actualiteit, nauwkeurigheid of toepassingscontext niet in orde is. Voor een GIS-specialist is er echter nog een beperking of geo-informatie wel gebruikt kan worden. Dat is de manier hoe het bestand modelmatig is opgebouwd en hoe het is opgeslagen. Kort gezegd, de manier van digitaliseren, of de 'mate van' digitalisering. Niet elk digitaal bestand is namelijk geschikt voor een elke toepassing in een GIS. Neem bijvoorbeeld een digitale, beschikbare, gedetailleerde topografische (wegen)kaart van Nederland, in een rasterformaat opgeslagen. Hier kan je lastig in meten en mee ontwerpen, omdat er geen vertices in zitten. Hierdoor ontbreken de juiste, nauwkeurige (hoek)punten van objecten. Je kan de objecten bovendien niet / nauwelijks geautomatiseerd laten analyseren. Selecties in dit bestand maken ("toon alleen grote steden of A- en B-wegen") kan ook niet. Laat staan dat de dataset voor bijvoorbeeld GIS-analyses, lineair refereren, routeberekeningen gebruikt kan worden. We moeten als GIS-specialist dus weten wat de mate van digitalisering is; de functionaliteit hangt namelijk af van de mate van digitalisering.
Het zijn bijna dogma's – beweringen die goed klinken en door niemand betwist lijken te worden – dat digitaliseren goed is en dat digitalisering vroeg of laat zijn geld wel opbrengt. We 'moeten binnen een organisatie nu eenmaal verder', want 'stilstaan is achteruitgang'.
Digitaliseren biedt inderdaad veel meer mogelijkheden dan analoge data. Maar hoever moet je gaan? Want de ene digitaliseringswijze is de andere niet! Wanneer het bedrijf een analoge gegevenscollectie of objecten buiten denkt te moeten digitaliseren, is bij te veel beleidsmakers, beslissers, managers en soms zelfs ICT'ers het credo "digitaliseren is goed en logisch" – al of niet met de benodigde business-case – helaas al voldoende om hen een 'GO' te ontfutselen voor dit digitaliseringstraject. Welke functionaliteit met die digitaliseringsslag bereikt moet worden, is voor de GIS-specialist / onderzoeker vaak nog wel duidelijk, echter, dat is het meestal niet bij die beslissers. Zowel bij beslissers als zelfs bij specialisten worden termen als digitaliseren, vectoriseren, verrasteren onbewust door elkaar gehaald, waardoor bij beide groepen spraakverwarring aanwezig kan zijn en – erger – verkeerde beslissingen in een digitaliseringsproject of in het digitaliseringsbeleid worden genomen. Dit hoofdstuk brengt daarom zo simpel mogelijk de verschillende termen in beeld. Een simpel plaatje met een toelichting kan gebruikt worden om spraakverwarring te voorkomen.
Digitalisering wordt veelal omschreven als het omzetten van data van een analoog naar een digitaal medium.[7] Echter, in de literatuur over geo-informatie, wordt óók tot digitalisering, gerekend wanneer opgemeten gegevens van objecten (zoals ligging en eigenschappen) uit de (meestal: fysieke) werkelijkheid direct digitaal worden opgeslagen – dus zonder tussenkomst van analoge vastlegging op bijvoorbeeld papier.
Digitalisering is een digitale vorm van vastleggen (zie figuur hierna). Waar vroeger zaken vooral analoog werden vastgelegd (voor zowel geo-informatie als 'gewone' informatie in tekstuele documenten), gebeurt dat tegenwoordig vrijwel altijd digitaal. Administratieve documenten werden in de jaren zeventig en tachtig van de vorige eeuw nog wel alleen analoog vastgelegd. Echter, tegenwoordig is dat nergens meer het geval. Alle administratieve data die moet worden vastgelegd, wordt digitaal opgeslagen. Bij geo-informatie is het, begin 21e eeuw, soms toch nog steeds zo dat er (oude) gegevens alleen analoog voor handen is. Dat zat 'm vaak in de kosten. Inmiddels is het wel een zeldzaamheid geworden; de meeste collecties zijn inmiddels gedigitaliseerd. De belangrijkste geo-informatie is nu wel digitaal, meestal zelfs gevectoriseerd. De laatste (analoge) collecties zijn nu meestal wel op zijn minst gescand. Scannen (onder andere in de vormen van verrasteren, vertiffen (omzetten in een TIF), en ver-PDF-en) is het proces waarbij (teksten, foto's kaarten of andere uitdrukkingsvormen op) documenten via een optisch invoerapparaat ('scanner') systematisch afgetast worden in een digitaal formaat. Door dit scannen is het verstrekken en verzenden van een kopie makkelijker.
Deze vorm van digitaliseren is voor gewone documenten, regelgeving, besluiten, brieven en zelfs plattegronden, dwarsdoorsneden of projectkaarten misschien prima en genoeg. Echter, deze 'simpelste' en oudste vorm van digitalisering is voor geo-informatie meestal onvoldoende. De kaart (PDF of TIF) kan dan slechts gelinkt worden met een kaart. Klikken op een projectgebied en er verschijnt een nieuw scherm met daarin de tekening. Echt combineren, laat staan de individuele, getekende objecten aanklikken of selecteren kan niet. Geen enkele overlaytechniek is mogelijk. Geautomatiseerde bewerking (denk aan: "maak een lijst, voor elk object één regel, van in welke gebieden al deze objecten liggen") blijken onmogelijk. Terwijl de organisatie de gegevens wel in huis denkt te hebben – ja zelfs gedigitaliseerd! – kunnen deze relaties niet gelegd worden; het antwoord op deze vragen is elke keer weer handmatig uitzoekwerk. We moeten in deze gevallen dus een stap verder gaan met de mate van digitalisering.
Het figuur hierna geeft – voor geo-informatie:
- van links naar rechts een overzicht van welke soort digitaliseringsgradaties er zijn
- de relaties en verschillen die er bestaan in definities als vastleggen, digitaliseren, vectoriseren, verrasteren.
Algemene opmerkingen over het schema:
- Links zijn de te meten objecten te zien, zoals ze in werkelijkheid bestaan. Objecten uit de werkelijkheid kunnen zijn:
- 'fysiek'. Fysieke objecten zijn direct aanwijsbaar of meetbaar. Meestal worden vooral fysieke objecten vastgelegd en gedigitaliseerd.
- 'virtueel'. Virtuele objecten zijn objecten die strikt genomen buiten niet (direct) te zien zijn, maar daar wel degelijk gesitueerd zijn. Denk aan percelen, regio-indelingen, gemeentegrenzen, plannen, opgetreden ongelukken of een mogelijke locatie voor een ramp.
- Onder in beeld is weergegeven hoe de toepassingsmogelijkheden van de verschillende digitaliseringsgradaties naar rechts toenemen.
- Wordt een object vastgelegd, dan kan dat door te digitaliseren, maar ook door het (voorlopig) op papier te schetsen (een analoge vastlegging).
- Digitaliseren kan direct door objecten uit de werkelijkheid (buiten) op te meten, of door de (eerder analoog vastgelegde data) te digitaliseren. Een voorbeeld van rechtstreeks digitaliseren (en vectoriseren!) is een modern, digitaal waterpasinstrument zoals landmeetkundigen dat gebruiken. Een voorbeeld van rechtstreeks digitaliseren (en verrasteren) is 'remote sensing', een inwinningstechniek waarbij het aardoppervlak – meestal vanuit een satelliet – met een bepaalde resolutie gescand wordt. Een voorbeeld van analoog vastleggen is het op papier zetten van inspectiegegevens bij sloten tijdens het schouwen. Wanneer deze vervolgens worden ingevoerd bij geo-informatie van de sloten, zijn ook de inspectiegegevens gedigitaliseerd.
- Een GIS kan alle digitale geo-informatie uit de genoemde gradaties gebruiken / lezen, echter, bij gebruik van geo-informatie uit de stappen (1), (2) en min of meer ook (3) is de functionaliteit zeer beperkt.
- De zeven digitaleringsgradaties worden in principe niet volgordelijk uitgevoerd, ook niet bij een bepaald digitaliseringsproject. Bij een bepaalde digitalisering / digitaliseringsproject wordt – vanuit de werkelijkheid of vanuit analoge documenten – een van de genoemde digitaliseringsgradaties bereikt. Bij het inrichten van de digitalisering dient vooraf bepaald te worden welke functionaliteit uiteindelijk verkregen dient te worden, en – dus – voor welke toepassingen de geo-informatie uiteindelijk gebruikt kan worden.
- Door kortzichtigheid, een niet bedrijfsbrede scope, onbekendheid of door angst voor digitaliseringsprojecten, kan het zijn dat gekozen is voor een te lage gradatie in de digitalisering.
- Door voortschrijdend inzicht, of nadat geconstateerd is dat de geo-informatie niet de juiste gradatie in digitalisering bereikt heeft bij een vorige digitalisering / vorig digitaliseringsproject, kan men besluiten om aan de gedigitaliseerde data een of meer gradaties toe te voegen. Hierdoor krijgt de digitale geo-informatie alsnog méér toepassingswaarde. De historie laat daarom zien dat – ondanks dat je zou verwachten dat er vóór de aanvang van dure digitaliseringstrajecten goed wordt nagedacht – de volgende digitaliseringstrajecten voor dezelfde geo-informatie (soort) voorkomen; het digitaliseren moet daardoor blijkbaar toch in twee stappen; pas na de eerste digitalisering is er vaak pas commitment, omdat er dan meer inzicht is verkregen in de nut en het noodzaak ervan om enkele gradaties verder te gaan. Daarmee dwingt de eerste ronde de organisatie langzaam verder te gaan.
- Van gradatie (0) naar gradatie (1), waarna 10 jaar later blijkt dat er een behoefte is aan gevectoriseerde bestanden; stap (3). Geld, aangepaste bedrijfsdoelstellingen en goedkopere technieken spelen hierbij een rol.
- Van gradatie (0) of (1) naar gradatie (3), waarna 2 jaar later blijkt dat er behoefte is aan (met bedrijfsprocessen) koppelbare bestanden; gradatie (5). Geld en een te beperkte scope of onbekendheid met mogelijke digitaliseringsstappen speelt hierbij mogelijk een rol.
- Van gradatie (5) naar nogmaals gradatie (5) komt ook voor. Soms blijkt namelijk dat erg vanuit de data is beredeneerd; objecten die digitaal zijn vastgelegd, worden middels het adagio 'ze moeten nu eenmaal koppelbaar worden gemaakt' objectgeoriënteerd gemaakt. Pas nadat de geo-informatie werkelijk met de objecten uit de andere (administratieve, al of niet bedrijfsbrede) bedrijfsdatabases wordt gekoppeld, blijkt de werkelijke koppelbaarheid; sommige objecten blijken niet koppelbaar te zijn. Het datamodel van de geo-informatie en het datamodel van de administratieve data kent blijkbaar geen bedrijfsbreed afgestemd definitiemodel (zie ook onder Ruimtelijke gegevensmodellering en Geo-informatie binnen bedrijven).
In bovenstaand schema worden per gradatie in de digitalisering weergegeven:
- een aantal voorbeelden;
- wat deze stap toevoegt aan de vorige en
- wat de meerwaarde is van deze stap qua functionaliteit / voor de businessprocessen.
Hoewel dit niet per definitie het geval is, ziet men vaak in de praktijk wel dat wanneer een bepaalde gradatie in digitalisering bereikt is – bijvoorbeeld gradatie 6 – dat dan de vorige gradaties / functionaliteiten bij de digitalisering ook mogelijk zijn. Vandaar dat er hier gekozen is niet alleen over zeven functionaliteiten te spreken, maar over zeven gradaties.
Meer opmerkingen over de zeven getoonde digitaliseringsstappen:
Gradatie in digitalisering | |
---|---|
(1): Verrasteren is een (oude) vorm van digitalisering, waarbij slechts een beperkte toepassingsmogelijkheden bereikt worden. Voor geo-informatie is verrasteren meestal niet, zeker niet op langere termijn, een goede keuze. Dat komt omdat de geo-informatie nauwelijks gecombineerd kan worden. Héél zelden zijn (geografische) rasterbestanden intelligent (zie gradatie 5). Denk bijvoorbeeld aan remote-sensing beelden (zie met name Lillesand, Kiefer, en Chipman; Remote Sensing and Image Interpretation, 2003, 5e editie) van het aardoppervlak, waarbij de waargenomen golflengtes via analyses vertaald zijn naar een legenda (oordeel); braakliggend terrein, gezonde of niet gezonde bomen, et cetera. In de praktijk bedoelt men bij het digitaliseren met het begrip 'rasterbestanden' de niet intelligente versie zoals die het resultaat is van het 'vertiffen' van analoge tekeningen. (Meer over intelligente en niet intelligente rasterbestanden is hierboven al besproken bij Objectsoorten en opslag van geo-informatie.) | |
(2): Geo-refereren, zie ook georefereren; (zie het Intermezzo, onderaan in -), is het zodanig juist verschalen, draaien en koppelen aan een coördinatenstelsel, dat het (raster)bestand in de juiste positie in de ruimte krijgt. Op deze wijze kan een rasterbestand (of het nu een tif, een pdf of een ander raster-formaat betreft) dienen als onderliggende kaart, waarna andere digitale (vector)data / geo-informatie in datzelfde coördinatenstelsel over de kaart heen kan worden gelegd. (Georefereren kan soms ook voor in lokale assenstelsels getekende vectordata een uitkomst zijn, al komt dit minder vaak voor.) | |
(3): vectoriseren. Meestal wordt bij het digitaliseren vanuit de werkelijkheid direct de objecten als vectoren opgeslagen. Punten, lijnen en vlakken worden daarbij opgeslagen als (met lijnen verbonden) punten. Deze stap is voor ontwerp en constructie doeleinden vaak al voldoende. Het vectorbestand is vrijwel altijd noordgericht en in een (juist) coördinatenstelsel en op schaal getekend. Is dat niet zo, dan dient het bestand – om het te kunnen combineren met andere bestanden – alsnog gegeorefereerd te worden, zie gradatie (2). Meestal gaat het om CAD-tekeningen (met als opslagformaten meestal DWG en DGN. (Zie ook eerder deze module, in CAD-data en GIS-data.) Echter, voor beheerdoeleinden, GIS-analyses en het produceren van uiteenlopende cartografische afbeeldingen is de simpelste vorm van vectoriseren meestal niet voldoende. Vandaar dat bij de volgende vormen van vectoriseren, enkele extra eisen aan de opgeslagen data wordt toegevoegd, zie stappen (4), (5), (6) en (7). | |
(4): objectgeoriënteerd tekenen. Bij gradatie (3) zou de manier van tekenen wel eens als spaghettidigitalisering kunnen worden betiteld. In stap (4) wordt door de afgedwongen dat de digitalisering van één object (punt, lijn of gebied) ook als één punt, lijn of vlak wordt opgeslagen. De A50 van Zwolle naar Arnhem is dus als één lijn getekend, ook als die bij Apeldoorn door de A1 onderbroken wordt. (Zie ook Objectgeoriënteerd eerder in deze module.) | |
(5): objectgeoriënteerd (kunnen) koppelen. Hierbij kennen de in de vorige stap als eenduidige objecten getekende punten, lijnen en vlakken ook een identificatie (id, of sleutelveld met daarin een unieke naam, code of volgnummer), waardoor koppeling met databases nodig zijn. Stap (5) kan niet zonder stap (4). Stap (4) wordt meestal samengegaan met stap (5) tenzij het datamodel of de nummertoedeling nog niet geheel bekend is, maar men wel al weet dat men in de toekomst de objecten wil gaan koppelen. In dat laatste geval wordt (tijdelijk) alleen nog objectgericht getekend. Veel CAD-bestanden zijn daarom tegenwoordig al objectgeoriënteerd getekend – tot en met stap (4) – voorbereid op echte GIS-toepassingen. Naar stap (5) is dan eenvoudiger. Sommige CAD-bestanden kennen tegenwoordig ook al wel degelijk de genoemde koppelingsmogelijkheid! Digitaliseren tot en met stap (5) is voor beheertoepassingen noodzakelijk en bij GIS-specialisten vaak als minimum eis bij digitaliseringstrajecten genoemd. Wanneer deze stap bereikt wordt bij een digitaliseringstraject, dan wordt vaak gesproken over een GIS-waardig bestand en over intelligente objecten en bestanden. Een raster- of vectorbestand dat niet intelligent is wordt ook wel eens plat gedigitaliseerd genoemd. (Meer info over objectgeoriënteerdheid en het koppelen met databases, zie Het bijzondere van GIS-data: de attributen en eventueel Joinen in deel B.) | |
(6) Topologie toevoegen. Onderlinge relaties tussen bestanden, maar ook (attribuut)volledigheid en het wel of niet mogen snijden van lijnen met andere lijnen of vlakken, wordt afgedwongen met (bedrijfs)regels (business rules). Zo wordt geëist dat percelen niet overlappend zijn en dat huizen binnen (woon)percelen moeten vallen, en niet op een straat gedigitaliseerd kunnen worden. De tekenregels zijn dan nog strenger dan bij stap (4) al het geval was. Met deze stap worden meestal ook – minder vaak gebruikte, maar geavanceerde (netwerk)toepassingen en berekeningen – mogelijk. (Zie ook Topologie.) | |
(7) Een enterprise oplossing. In feite verandert hier niet (de digitalisering van) de data, maar de plek waar deze wordt opgeslagen; centraal bij andere geo-informatie (strikt genomen kon dat ook al bij de vorige stappen), maar nu ook bij andere 'gewone' administratieve data van de organisatie. Daardoor kunnen applicaties (niet alleen GIS-applicaties, niet alleen beheerapplicaties, maar ook ontsluitingsapplicaties) beter bij de data uit de verschillende databases. Het beheer, de consistentie, hergebruik van de data maar ook applicatieontwikkeling kan zo eenvoudiger. Deze laatste stap wordt het minst snel bereikt. Niet alleen omdat dit duur zou zijn, maar eerder omdat hiervoor alle bedrijfsprocessen bekend dienen te zijn en goed op elkaar dienen te zijn afgestemd. |
- NB / noot voor perfectionisten onder de GIS-kenners: Er zijn ook rasterdata die wel objectgericht / intelligent zijn. Deze datasets zijn vaak relatief grover dan de rasterdatasets die hierboven zijn bedoeld. Intelligente rasterdatasets beschrijven vaak niet de vormen van fysieke of virtuele objecten, maar zijn veelal uitkomsten van ruimtelijke (GIS) technieken. Dergelijke rasterdata zijn toch niet objectgericht, omdat de individuele gridcellen slechts tezamen één groot object vormen (bijvoorbeeld een vlak met één bodemtype). Er kunnen dus fantastische berekeningen meet gedaan worden. In het getoonde figuur zou een dergelijk intelligent rasterbestand ergens tussen 2 en 5 geplaatst kunnen worden. Voor dergelijke voorbeelden zie de rastervoorbeelden (grids) in de volgende modules, erosiegevoeligheid van de bodem, bodemsoorten en – eerder nog in deze huidige module – grondgebruik.
SAMENVATTING: Digitaliseren is – wanneer het over geo-informatie gaat – het vastleggen van ruimtelijke objecten door deze te verrasteren (op te slaan als pixels), óf door deze te vectoriseren. Vooral bij vectoriseren kunnen een verschillend aantal gradaties in functionaliteit bereikt worden. Bij vectoriseren worden de objecten als punten, lijnen en vlakken vastgelegd. Afhankelijk van de gewenste eindfunctionaliteit worden bij het digitaliseren – zeker bij het vectoriseren – meestal ook in een coördinatensysteem getekend, waardoor de bestanden gegeorefereerd zijn. Daardoor zijn de objecten gezamenlijk te tonen met andere kaartlagen. Voor beheerdoeleinden dienen de objecten meestal ook objectgeoriënteerd te zijn getekend én koppelbaar te zijn met databases. Dit wordt meestal 'intelligent digitaliseren' genoemd. Het bestand / de dataset wordt dan 'GIS-waardig' of 'intelligent' genoemd.
TIP1: Vermijd verwarring over de term digitalisering. Benoem in discussies altijd wat exact bedoeld wordt met deze term. Geef richting beleidsmakers / managers op zijn minst aan wat de (maximale) functionaliteit is bij die vorm van digitaliseren waar het op dat moment om gaat.
TIP2: Digitalisering en inwinningstechnieken van geo-informatie zelf vallen niet onder de scope van dit handboek. Meer informatie over inwinningstechnieken bij geo-informatie is onder andere te lezen in het hoofdstuk "Het verzamelen van gegevens" in "Kartografie, Visualisatie van ruimtelijke informatie", F.J. Ormeling en M.J. Kraak, Delfse Universitaire Pers. Uitgave 1990 en uitgave 1993. Meer over remote sensing is onder andere te lezen in "Remote Sensing and Image Interpretation", door T.M. Lillesand, R.W. Kiefer, en J.W. Chipman, 5e druk, 2003 John Wiley & Sons.
Als laatste een voorbeeld van een kaart die digitaal is, maar wellicht niet 'genoeg' digitaal; zie de kaart van de kerk, rechtsboven. Een bibliothecaris vindt dit misschien afdoende. En misschien was de opdracht van het management ook om alle plattegronden/ kaarten te digitaliseren voor het nageslacht. Maar als er ook echt onderzoek, berekeningen, analyses, of bepaalde beheerwerkzaamheden moest worden uitgevoerd, was dat absoluut onvoldoende. Het is namelijk een JPG. Met wat metadata erbij is de afbeelding weliswaar vindbaar en kopieerbaar voor iedereen. Echter, de gegevens zijn niet gegeorefereerd, er kunnen geen (GIS-)analyses mee uitgevoerd worden en de kaart is niet combineerbaar met andere kaarten. Een simpele, aan GIS-afdelingen vaak gevraagde klus als op welke percelen of op welk bodemtype liggen de weg en de kerk, zijn pas mogelijk te maken als deze JPG gevectoriseerd en liefst ook objectgeoriënteerd wordt. Let op de noordpijl rechtsboven het midden. Ook op met CAD-programma's getekende kaarten/plattegronden, verraadt zo'n noordpijl vaak dat het géén gegeorefereerd bestand is. Dat beperkt toekomstig wellicht noodzakelijke GIS-functionaliteit enorm. Alleen viewen, niet op de juiste locatie, maar via een hyperlink vanuit een GIS-pakket of viewer is mogelijk.
Referenties
- ↑ A to Z GIS, an illustrated dictionary of geographic information systems; T. Wade en S. Sommer, 2006 (2e editie), pag 90.
- ↑ J. Maantay en J. Ziegler; GIS for the Urban Environment, ESRI-press Redlands California, 2006, pag 8.
- ↑ Cartography, Visualisation of Spatial Data; M.J. Kraak en F.J. Ormeling; 2003, 2e editie, Pearson Education, blz 7 en 8.
- ↑ Understanding GIS; the ArcInfo Method, ESRI press, 3rd Edition, 1995, Redlands California, US, blz 1-7.
- ↑ Theoretische Aspecten van GIS, Basisboek GIS; versie september 2000, blz 13-14
- ↑ GIS for the Urban Environment J. Maantay en J. Ziegler, 2006, blz. 25.
- ↑ Digitalisering op de Nederlandse Wikipedia
Literatuur
Voor literatuur zie Overige informatie en links.
Ga naar de opdrachten over deze module 'Inleiding GIS'.