Geo-visualisatie/Vervolg GIS

Uit Wikibooks
Naar de sartpaginaNaar de startpagina
Naar de sartpagina

Deel A: Theorie / Vervolg GIS

Doelstellingen van deze module 'Vervolg GIS'
Na het lezen van deze module is de lezer bekend met diepgaandere GIS-begrippen, de belangrijkste beperkingen van GIS bij ruimtelijke analyses en kan hij verschillende bronnen van geo-informatie noemen inclusief de sterke en zwakke kanten van die bronnen. Hij kent via een aantal praktijkcases de sterke kanten van het combineren van geo-informatie en hij kent de belangrijkste GIS-bewerkingsstappen. Deze module is een vervolg op de basis uit de vorige module, 'Inleiding GIS'. Veel van deze hoofdstukken zijn facultatief. Deze module is niet strikt noodzakelijk, maar wel plezierig bij het verder lezen van dit handboek.
Modules Handboek Geo-visualisatie:
Startpagina Handboek Geo-visualisatie Zeer goed ontwikkeld. Revisiedatum: 19 januari 2008
Inleiding Zeer goed ontwikkeld. Revisiedatum: 18 februari 2008

Deel A: Theorie Zeer goed ontwikkeld. Revisiedatum: 6 februari 2008
Inleiding GIS Zeer goed ontwikkeld. Revisiedatum: 10 april 2008
Vervolg GIS Zeer goed ontwikkeld. Revisiedatum: 10 februari 2008
Inleiding Cartografie Zeer goed ontwikkeld. Revisiedatum: 13 februari 2008
Vervolg Cartografie Zeer goed ontwikkeld. Revisiedatum: 6 februari 2008
Communicatie Zeer goed ontwikkeld. Revisiedatum: 6 februari 2008
Deel B: Geo-visualisatie Zeer goed ontwikkeld. Revisiedatum: 6 februari 2008
Classificatie Zeer goed ontwikkeld. Revisiedatum: 18 februari 2008
Symbologie Zeer goed ontwikkeld. Revisiedatum: 10 april 2008
Deel C: Kaartopmaak Zeer goed ontwikkeld. Revisiedatum: 10 april 2008
Labels Zeer goed ontwikkeld. Revisiedatum: 10 april 2008
Oplevering van de kaart Zeer goed ontwikkeld. Revisiedatum: 10 april 2008

Vragen en opdrachten Zeer goed ontwikkeld. Revisiedatum: 10 april 2008
Woordenlijst Zeer goed ontwikkeld. Revisiedatum: 10 april 2008
Overige informatie en links Zeer goed ontwikkeld. Revisiedatum: 10 april 2008

GIS-analyses / GIS-bewerkingen

Enkele van de belangrijkste GIS-bewerkingen. Op basis van ruimtelijke ligging kunnen verschillende analyses en bewerkingen worden uitgevoerd. Links de input, rechts de output met voorbeelden.

In de vorige module, Inleiding GIS, zijn al enkele (gemeentelijke) voorbeelden genoemd om te laten zien wat er mogelijk is met een GIS. Die mogelijkheden zitten wel of niet in een GIS, afhankelijk van het aantal functies (ruimtelijke operatoren, bewerkingen of analyses) die de desbetreffende GIS kent. Een desktop-GIS is hierin véél krachtiger dan web-GIS-applicaties of (gratis downloadbare) GIS-viewers.

GIS-desktop-software kent over het algemeen vele mogelijke GIS-analyses. Uiteraard is dit afhankelijk van de leverancier en de gekochte licentie. Een gemiddelde desktop GIS-applicatie van een gemiddelde bekende leverancier kent minimaal een honderdtal functies, maar doorgaans veel meer. Toch zal je er vaak slechts enkele van gebruiken. Door het combineren van die functies wordt het resultaat nog krachtiger. Ook zijn die functies vaak in modellen te gieten, waardoor meerdere functies zijn te combineren, al of niet met handmatig in te voeren parameters, en al of niet in batch uit te voeren. Het is ondoenlijk en onnodig alle functies uit je hoofd te kennen, net zoals het ondoenlijk en onnodig is deze te vermelden in dit handboek. Je wordt verwezen naar de handleiding van de leverancier.

Wel wordt hier, in de figuur rechtsboven, getoond wat zo ongeveer de belangrijkste krachtige GIS bewerkingen zijn. Zowel de veel gebruikte Engelse termen als hun minder vaak genoemde Nederlandse vertaling worden genoemd. De voorbeelden verduidelijken de functie. Merk op dat de output - rechts in de figuur - vaak een nieuw bestand is, met op de achtergrond - in het bestand zelf - alle attributen die van toepassing zijn. De figuur legt achtereenvolgens uit:

  • merge (samenvoegen)
  • buffer
  • ruimtelijk selecteren
  • clip (snijden)
  • union (het verenigen op basis van attributen)
  • ruimtelijk joinen
  • dissolve (generaliseren op basis van attribuutwaarden)

Door middel van dergelijke ruimtelijke operatoren voegen GIS-applicaties een heel bijzonder soort operatoren toe aan de operatoren die bij de meer gebruikelijke en bekendere administratieve (getalsmatige en tekstuele) databases al bekend zijn (zoals: < > = not, nor, and). Administratieve databases zijn heel goed in staat om objecten te selecteren of te combineren met deze zogenaamde Booleaanse en logische operatoren; Selecteer alle gemeentes groter dan 50.000 inwoners (de operator > wordt hier gebruikt). Een GIS voegt hier operatoren aan toe die een ruimtelijke component kennen. Selecteer alle boringen die - op grond van hun ligging (x- en y- coördinaat) vallen in de gemeente. Net zoals dat door een mens direct op een kaart te zien zou kunnen zijn, zo selecteert een GIS deze boringen op grond van hun locatie. Dat gebeurt dus niet op basis van een (lastig te beheren) koppeling in een relationele database. Andere voorbeelden uit de praktijk zijn: selecteer boringen binnen een bepaalde afstand, combineer objecten (merge), et cetera. Zie verder het figuur.

SAMENVATTING: GIS-operatoren (typische GIS-functies of GIS-bewerkingen) zijn er in meerdere soorten en smaken, en voegen - door gebruik te maken van nabijheid, overeenkomsten in locatie of onderlinge ligging - een wezenlijk nieuw soort operatoren toe aan de Booleaanse operatoren (administratieve of louter wiskundige functies) waar standaard administratieve (relationele) databases over beschikken. Alle GIS-operatoren hebben met elkaar gemeen dat ze iets met de factor 'locatie' doen, een eigenschap die niet voorkomt in administratieve databases. Voorbeelden van deze GIS-bewerkingen zijn ruimtelijk selecteren, joinen, bufferen, reclassificeren (of generaliseren), verenigen, snijden en samenvoegen.

TIP: Ook bij het tot stand komen van kaarten, kunnen deze GIS-bewerkingen geo-informatie geschikt of geschikter maken. Hoe meer kennis van GIS / jouw GIS-pakket, hoe makkelijker het (goed) kaarten maken zal gaan. Raadpleeg de handleiding van jouw GIS-pakket regelmatig om ideeën op te doen. Dat kan verhelderend werken en tijdbesparend uitkomen op het moment dat je een kaart in opdracht snel moet gaan uitvoeren.

NB: De meest gebruikte GIS-tool, de join, is strikt genomen geen analyse maar het startpunt van het maken van een kaart of analyse. Deze wordt besproken in joinen.

GIS-analyses, de 'do's and dont's'

Er zijn vele GIS-bewerkingen waarbij geo-informatie geconverteerd kan worden, verbeterd, gecombineerd, geanalyseerd. Hoe groter en duurder het GIS-pakket of licentie, hoe meer mogelijkheden. Deze mogelijkheden worden niet allemaal uitgebreid behandeld, daar is de GIS-handleiding van het softwarepakket zelf waarschijnlijk beter in. Maar er zijn altijd een aantal zaken waar je rekening mee moet houden. In de volgende paragrafen komen een aantal van die zaken aan de orde.

De wet van het kleine getal

Bij het trekken van conclusies op basis van kaarten geldt hetzelfde als bij het trekken van conclusies op basis van andere data.

Er moet voorzichtig worden omgesprongen bij onvolledige of niet juist ingewonnen data. Zeker wanneer een kaart gemaakt wordt op basis van een beperkt onderzoek, of een beperkte hoeveelheid data (zie ook de vorige paragraaf). Staat er een beperkte selectie van de werkelijkheid op een kaart, of er zijn nu eenmaal weinig voorvallen gekarteerd, dan is er de kans dat de beslissing of het inzicht die volgt uit een kaart, bepaald wordt door wat men noemt 'de macht van het kleine getal' of 'overhaaste generalisatie' (zie ook 'De Wet van het kleine getal' op Wikipedia). Zelfs wanneer de data 100% goed, actueel, compleet en nauwkeurig is, moet men met deze wet rekening houden. Een voorbeeld.

Hier rechts staan twee figuren. Hier worden daadwerkelijk plaatsgevonden meldingen van calamiteiten weergegeven van regio IJsselland. Deze vanuit het P2000-systeem van de centrale meldkamer (112) van de ambulance, brandweer en politie.

Een kaartlezer zou de volgende conclusies kunnen trekken:

  • In Olst, Hardenberg en Zwarte-waterland gebeurt weinig of niets; ze kunnen daar leunen op de brandweer, politie en ambulance uit de omgeving.
  • Zwolle en Kampen hebben relatief meer brandmeldingen dan andere gemeenten; de brandweer moet daar dus beter uitgerust zijn dan in andere gemeenten.
  • In Staphorst gebeurt veel, maar het zijn altijd onduidelijke meldingen.
  • enzovoort.

Al deze conclusies komen voort één groot misverstand: ze worden getrokken over een heel kleine periode én een heel klein gebied. Door de beperkte tijdspanne is de factor toeval bepalend voor het kaartbeeld. De werkelijke ruimtelijke spreiding die bij een dergelijk fenomeen hoort is niet zichtbaar. Pas wanneer een fenomeen (bijvoorbeeld brandmelding) in alle gebieden een minimum aantal keren voorkomt en/of de meldingen gelden over grotere perioden (bijvoorbeeld een jaar), zouden dergelijke conclusies pas te trekken zijn. Er is een grote kans dat deze conclusies dan totaal anders zijn. Het heeft dat ook geen enkel nut dergelijke kaarten als hier boven te maken. Slechts voor dagrapportages ('waar zijn de hulpdiensten vandaag opgeroepen?') is het wellicht handig.

(Voor wie overigens bekend is met de vele P2000-sites die er zijn; niet alle meldingen zijn goed classificeerbaar. Een melding als 'XXX Gaarne contact opnemen met centrale', of communicatie die niet via P2000 gaat, strooien sowieso roet in het eten, wanneer we toch kaarten willen maken en conclusies zouden willen trekken. Hiermee wordt maar weer eens aangegeven: Gebruik spaarzaam of voorzichtig andermans (internet) data; stap op de vakdeskundigen / kenners af alvorens zomaar zaken in kaart te brengen. Ook al is de hoeveelheid en veelsoortigheid aan informatie op internet nog zo'n verlokking, en ziet die er nog zo professioneel uit.)

Ook op de kaart met de nieuwsmeldingen, hierboven, zijn sommige van onderstaande conclusies misschien voor de hand liggend, echter ze zijn allen toch verkeerd:

  • In Oost-Nederland en Brabant gebeurt weinig.
  • De meeste UFO-meldingen komen uit Groningen.

Naast de wet van het kleine getal moeten we hier ook met andere zaken rekening houden. Skoep als nieuwsmedium is wellicht populairder in de Randstad dan elders. Het zijn wellicht vooral jongere scholieren die deze site vullen, zij die hier tijd voor nemen, en in het bezit zijn van de juiste kennis en gadgets óm dit te doen. Het soort onderwerpen, de aantallen en de spreiding van de nieuwsitems over de kaart wordt daar dus door beïnvloed.

Arbitrair gekozen of bestuurlijke gebiedsindelingen

Hoe een arbitraire (slecht gekozen of bestuurlijke) grens beslissingen en GIS-berekeningen beïnvloedt. Stad A en Stad B kennen dezelfde geografische spreiding van een bepaald sociaal probleem, hier voorgesteld door adressen met een probleemindicatie. Stad B zou wel eens wèl subsidie kunnen krijgen voor hun Wijk 2, omdat alléén daar het percentage adressen met een probleemindicatie boven een bepaalde (landelijke?) norm komt. De werkelijke problematiek is voor beide steden hetzelfde. Het grijze gebied geeft een véél betere grens aan van een gebied waar de aandacht van béide steden naar zou moeten gaan. Hiermee is aangetoond dat onderzoeksgebieden en rekeneenheden nooit te klein mogen zijn; ze moeten afgestemd zijn op de werkelijke spreiding. Zie verder tekst.
Berekening van welke gebieden gunstig zijn voor de landbouw met grof raster. De uitkomst is blijkbaar afhankelijk van het toeval van waar dit raster over het gebied wordt heen gelegd. Het rechter voorbeeld geeft een hoger percentage dat geschikt is voor landbouw, en laat ook andere gebieden als geschikt zien dan het linker voorbeeld. De vraag is of een koper van één van deze negen gebieden tevreden zal zijn!
Berekening van welke gebieden gunstig zijn voor de landbouw met fijn raster. Hier is een fijner en - gezien de uitkomst - beter raster gebruikt. De uitkomst wordt blijkbaar nauwelijks beïnvloed door waar het raster over het gebied wordt heen gelegd. Beide analyses (links en rechts) geven ongeveer dezelfde uitkomsten.

Arbitraire of bestuurlijke gebiedsindelingen kunnen een negatieve invloed hebben op (GIS-)analyses. De spreiding van een fenomeen (bijvoorbeeld armoede) komt vaak niet overeen met een administratieve of bestuurlijke gebiedsindeling. Bij analyses moet hier rekening mee worden gehouden. In de figuur wordt dit met een voorbeeld aangetoond. Het fenomeen (armoede) heeft een geografische spreiding die niet overeenkomt met de wijkgebieden; de wijken zijn blijkbaar niet uniform; er zijn misschien wel villa's en huurwoningen.

Het probleem is ontstaan omdat harde, politieke, of verkeerd getrokken grenzen gebruikt zijn. Wil men toch in percentages per gebied werken, omdat de besluitvorming / politici dat eisen, én een goede aanpak van de (armoede) problematiek hebben, dan dient dus een gebiedsindeling van een juist (hoger) detailniveau gebruikt te worden, bijvoorbeeld deelwijken of zogenaamde 6-punts-postcodegebieden (1234AB). Nog beter zou zijn: rekenen met het fenomeen zelf, de adressen met de (armoede) problematiek. Zouden deze gegevens niet voorhanden zijn, reken dan met de fijnere grenzen. In dit geval de deelwijkgrenzen, aangegeven met een stippellijn rondom het probleem gebied. Deze deelwijkgrenzen geven de werkelijke spreiding van het probleem weer.

Statistische gegevens zoals die van het Centraal Bureau voor de Statistiek komen hebben achter zich (een onbekende) ruimtelijke dynamiek. Een voorbeeld is het percentage werklozen in een gemeente. Met een verdere analyse nemen we - vaak zonder dit expliciet te weten of dit kenbaar te maken - aan dat deze ruimtelijke dynamiek netjes is uitgesmeerd over dat hele gebied ("Deze hele gemeente kent 10 % werkloosheid").

SAMENVATTING: Bestuurlijke of andere administratieve indelingen zijn niet altijd de juiste reken- en/of rapportage indelingen om bepaalde fenomenen te beschrijven die spelen in dat gebied. Dat komt omdat die fenomenen dan niet evenredig verspreid zijn in datzelfde gebied.

TIP: Een GIS-specialist zal zo lang mogelijk moeten willen rekenen met de meest gedetailleerde informatie die hij heeft. Pas op het laatste moment zal de uitkomst - indien voor besluitvorming of representatie strikt noodzakelijk is - misschien doorvertaald mogen worden naar grotere gebieden, oftewel, gebieden van een hoger aggregatieniveau. De analyse zelf zal moeten aantonen of dit mag. In het voorbeeld van hierboven; zou het grijze gedeelte een derde wijk zijn, dan was de indeling op wijkniveaus een goede geweest.

Te grof gekozen aggregatieniveaus en rasters met te grote cellen

Ongeveer hetzelfde probleem kan optreden wanneer bij GIS-analyses gewerkt wordt met een raster. De reden waarom bij GIS-analyses vaak gekozen wordt voor de beschrijving van een fenomeen (verschijnsel / thema) met een raster is omdat op deze manier gemakkelijk gerekend kan worden. 'Scores' van verschillende fenomenen kunnen bijvoorbeeld worden opgeteld.

Voorbeeld: als we voor een bepaald gebied willen zien waar de kansen voor de landbouw het gunstigst zijn, zouden bijvoorbeeld de thema's grondwaterstand, bodemtype en bereikbaarheid een rol kunnen spelen. Het kan zijn dat er opdracht wordt gegeven dat gebied in te delen in gebieden van honderd bij honderd meter, omdat die gebieden vervolgens goed aan geïnteresseerde boeren zijn aan te bieden. De thema's hebben echter allemaal hun eigen grenzen. Door deze te verrasteren zijn de scores per thema (1=ongunstig, 2=matig, 3=redelijk, 4=goed) optelbaar (zie vector-raster-conversie [Geo-visualisatie/Vervolg GIS Vervolg GIS]). Er zal zo een maximale score ontstaan van 12 (driemaal een goede score).

Het probleem bij deze verrastering doet zich voor wanneer de cellen van zo'n raster te groot zijn; het fenomeen wordt dan niet meer goed beschreven. Te grote rastercellen leveren dezelfde problemen op wanneer een te hoog aggregatieniveau wordt gebruikt. Met een hoog aggregatieniveau wordt bedoeld dat een thema / fenomeen beschreven wordt op basis van een samenvoeging van een aantal gebieden. Wanneer gerapporteerd (en gerekend) wordt op een hoog aggregatieniveau, kan dit negatieve invloeden hebben op de juistheid of de nauwkeurigheid van de analyse. Voorbeelden van hoge aggregatieniveaus in gevallen waar ook gebruik gemaakt had kunnen worden van kleinere gebieden zijn:

  • gemeentes in plaats van individuele wijken
  • secties in plaats van individuele percelen
  • zandgebieden in plaats van (uitgesplitst) in duinzand, stuifzand, dekzand, rivierzand, et cetera

In het voorbeeld in deze paragraaf wordt één thema verrasterd. De vraag is: welke gebieden van honderd bij honderd meter zijn gunstig voor de landbouw? In het bovenste figuur, waar direct gebruik gemaakt wordt van een raster van honderd bij honderd meter, zijn de uitkomsten onbetrouwbaar. In het onderste figuur is gekozen voor een fijner raster van zo'n twintig bij twintig meter.

Merk op dat in het onderste figuur met het fijne raster zowel links als rechts ongeveer een gelijk beeld laat zien: in het noorden en in het zuidoosten is een concentratie van voor de landbouw geschikte grond. Daarentegen laat het bovenste figuur met het grove raster rechts een totaal verschillend beeld zien als links.

Duidelijk zal zijn dat de tweede analyse betrouwbaarder is. De percentages zijn vrijwel hetzelfde (21% en 20%), en de spreiding van het fenomeen komt overeen met de werkelijkheid zoals die boven in beeld staat. De analyse is tweemaal uitgevoerd; de tweede maal met een verschoven raster. De uitkomst levert slechts een héél klein verschil op. Zou dit fijne raster vervolgens worden opgedeeld in het percentage landbouwgrond dat geschikt is per vak van honderd bij honderd meter, dan zou de koper een veel juister beeld krijgen dan het beeld uit de eerste analyse met het grove raster.

SAMENVATTING: Wanneer gebruik gemaakt wordt van te grove rasters, of te hoge aggregatieniveaus, worden GIS-berekeningen onnauwkeuriger of onbetrouwbaarder. Met een hoog aggregatieniveau wordt bedoeld een reken- of rapportageniveau op basis van vlakken (eenheden) die bestaan uit meerdere kleinere vlakken (subeenheden).

TIP: Een vuistregel is dat het raster viermaal zo fijn moet zijn als de lengte en breedte van de kleinste vlakken uit het thema, voor zover je die kleine vlakken nog belangrijk acht. De kleinste vlakken (bijvoorbeeld maximaal de 5 % kleinste vlakken) mogen verdwijnen als de uitkomst 95% onnauwkeurigheid mag kennen. Echter, er zijn twee redenen om toch te kiezen voor nog fijnere rasters. De snelle rekentijd van de computers en de zogenaamde 'foutenvoortplanting'. Foutenvoortplanting, een lastig te onderzoeken fenomeen, is een proces waarbij een 'fout' (=onnauwkeurigheid in de uitkomst van één berekening) steeds groter of nadeliger wordt bij de uitkomst van een volgende stap in de berekening. Zolang je PC de analyses zonder een lange rekentijd aankan, kies dan liever voor nog fijnere rasters, minimaal tienmaal zo fijn als hierboven aangegeven.

Het verhogen van de nauwkeurigheid (facultatief)

Een wat gevaarlijk onderwerp op het moment dat je er geen verstand van hebt, maar, het is mogelijk om de nauwkeurigheid van geo-informatie te verhogen.

Het komt vaak voor dat je van geo-informatie met kwantitatieve (getalsmatige) gegevens hebt die geldig zijn voor bepaalde gebieden. Deze kwantitatieve gegevens beschrijven voor een vastomlijnd gebied (bijvoorbeeld een gemeente) met één getal het fenomeen (bijvoorbeeld de bevolkingsdichtheid). Daarbij neem je meestal aan dat dit fenomeen evenredig verdeeld is over het gehele oppervlak. Dat zal echter nooit het geval zijn; bepaalde plekken kennen vast een hogere dichtheid dan andere plekken.

Stel: de bevolkingsdichtheid is 1000 inwoners/km2. Wanneer je alléén deze gemeente in beeld hebt en zeker weet dat er buiten de bebouwde kom vrijwel geen mensen wonen, dan zal uiteraard gelden dat de werkelijke bevolkingsdichtheid voor deze bebouwde kom groter is, aangezien er op de heide en in het bos bij deze gemeente niemand woont... Stel dat de helft van deze gemeente uit bebouwde kom bestaat, dan kan je dus voor deze gemeente stellen dat de bevolkingsdichtheid hoger is: 2000 inwoners/km2. Ga je dit in een kaart opnemen voor deze gemeente (of ook omliggende gemeenten), dan moet je natuurlijk wel aangeven wat de bevolkingsdichtheid is per deelgebied: dus 2000 inw/km2 in de bebouwde kom en 0 (of als je klasses gebruikt: 0 - 100) inw/km2 in het buitengebied van deze gemeenten. Op deze wijze geef je een reëler beeld van de situatie. 2000 inw/km2 is voor de bebouwde kom een aannemelijker getal, 0 (of 0 - 100) inw/km2 is voor het buitengebied een aannemelijker getal dan 1000 inw/km2. Beslissingen, analyses en vergelijkingen tussen verschillende gemeenten e/o wijken kunnen zo van een betere kwaliteit zijn.

Discussie: Let op dat je deze methode wel ergens in de kaart of begeleidende tekst moet verantwoorden; niet voor alle gemeenten zal dit zomaar toe te passen zijn. Wanneer in een dorp sprake is van lintbebouwing (huizen aan één lange straat, zonder zijstraten met wijken) en deze zijn weer niet opgenomen in de bebouwde kom, gaan er zaken fout. Voor bepaalde analyses en onderzoeken waarbij je veel data zelf moet maken en verwerken, zal je deze methode toch kunnen overwegen. Een ander voorbeeld is overigens het aantal restaurants per km2 (ook weer: in bebouwde kommen of in gemeenten). Het mag duidelijk zijn dat enige kennis van zaken nodig is op het moment dat je deze techniek niet als truc maar als een verantwoord techniek wil inzetten.

Coördinaten creëren met een GIS indien er geen coördinaten zijn

Dankzij GIS beschikt de cartograaf over geautomatiseerde manieren om geo-informatie goedkoop en zonder dure inwinning 'in het veld' te verkrijgen. Wanneer géén coördinaten bekend zijn, kunnen namelijk op twee andere wijzen toch coördinaten toegevoegd worden aan lijsten met informatie. Door die toevoeging is die informatie plotseling geo-informatie te noemen. Voor beide methoden, geocoderen en lineair refereren, geldt dat deze geautomatiseerd (snel en 'met één druk op de knop') voor grote gegevensbestanden gerealiseerd kunnen worden.

Geocoderen

Geocoderen is het toevoegen van x- en y-coördinaten aan gegevens die die nog niet hebben op basis van een bepaalde locatieaanduiding. Die locatieaanduiding kan nauwkeurig (adres, dus postcode met huisnummer) zijn, of minder nauwkeurig (zoals alleen de postcode of een gemeentenaam). Twee voorbeelden:

  • Een lijst met gemeentes waar zich een vestiging bevindt van universiteiten of andere objecten, is in een geo-informatie-bestand om te zetten door de zwaartepunten van de gemeente toe te voegen als extra kolom aan die lijst. De oorspronkelijke lijst bevatte een kolom gemeentenamen en een kolom met de naam van die universiteit. Na het geocoderen is er een kolom x en een kolom y toegevoegd. Door deze actie is de x en de y (dus de locatie) per adres bekend, en dus kunnen al deze adressen op de kaart worden weergegeven! Voor deze actie dient de GIS-ser over een bestand met gemeentes te beschikken.
  • Een lijst met adressen van restaurants is door het geocoderen om te zetten in een (geo-informatie-) bestand waarmee direct een kaart gemaakt kan worden met restaurants. Er zijn commerciële aanbieders voor geocoderen, omdat er anders grote en dure adressenbestanden zouden moeten worden ingekocht.

Intermezzo: Over geocoderen, misdaad, Google Mash-ups en Google Earth
Als voorbeeld van het geocoderen kan genoemd worden www.misdaad.nl. Misdaadmeldingen van de politie, worden automatisch op een kaart geplaatst op basis van de plaats- en straatnaam. De meldingen worden gecategoriseerd op soort melding zoals brand, moord of een steekpartij. De kaart met misdaden staat prominent op de startpagina van deze site, net zoals een lijst met de meest recente misdaden. Bezoekers van de site kunnen ook zelf misdaden aanmelden. Na controle door een redactie worden die geplaatst. Hiermee is de site een mooi voorbeeld van een combinatie tussen "user generated content" en input van de politie. (Helaas doen momenteel enkele politiekorpsen nog niet mee volgens een artikel in de GIS-magazine 2007, nr.7, pagina 46). De site is ook één van de vele voorbeelden van zogenaamde Mash-ups. Dat zijn sites die de Google Maps interface inclusief de luchtfoto's en stratenpatroon hebben geïntegreerd in een eigen toepassing. Locaties, foto's meldingen worden hiermee gegeocodeerd, waardoor deze met een puntsymbool, het bekende ballonnetje als 'huisstijl van Google Mash-ups', op de juiste x-y-coördinaat in beeld komen. Het grote voordeel is dat je de benodigde geo-informatie, de luchtfoto's en het stratenpatroon niet hoeft aan te schaffen en/of te beheren. Het is in technisch opzicht bovendien zeer laagdrempelig, dankzij de Maps API die Google sinds 2005 beschikbaar heeft gesteld. Een API (Application Programming Interface) is software en/of een verzameling definities waarmee een computerprogramma of site kan communiceren met een ander programma of onderdeel. Dus zonder dat de programmeur of de site Google Maps helemaal kent, kan redelijk eenvoudig de functionaliteit overgenomen worden. Is er ook een nadeel? Ja, want je bent afhankelijk van de (begrensde) interface en koppelmogelijkheden die Google biedt en van het format dat Google eist. Maar dat is waarschijnlijk geen enkel probleem voor iemand die niet op zoek is naar GIS-view- en GIS-analysemogelijkheden.

Meer voorbeelden van geocoderen zijn terug te vinden op Geocodeervoorbeelden van Universiteit van Amsterdam. Zie verder ook op Overige informatie.

SAMENVATTING: Voor het publiceren van gegeocodeerde puntlocaties op een simpele kaartviewer is Google Maps wellicht een geschikt middel. Het is voornamelijk door zijn bekendheid een gebruikersvriendelijke standaard geworden. Puntlocaties zijn eenvoudig toe te voegen voor iemand met gemiddelde technische (web-)kennis.

TIP1:Wil je als sitebouwer / programmeur werken met Google Mash-ups? Zie googlemapsmania.blogspot.com/ voor een (besproken) overzicht van Mash-ups. Zie https://www.javaworld.com/javaworld/jw-01-2006/jw-0116-google.html, https://code.google.com/gme/docs/gettingstarted.html of voor de techniek er achter.

TIP2:Wil je zelf data-bestanden (lijnen en vlakken) toevoegen? Dat kan op Google Earth (en ook Google Maps) met KML (Keyhole Markup Language). KML is een eigen, op XML gebaseerd opmaaktaal voor geo-informatie van Google. (XML staat voor Extensible Markup Language, zie eventueel de XML op Wikipedia). KML wordt inmiddels veel gebruikt, zei het alléén voor Google-applicaties. GIS-pakketten kunnen jou eigen geo-informatie vaak automatisch omzetten naar KML, waarna deze in Google Earth is in te lezen. Daardoor hoef je niet veel van KML zelf af te weten, en kan je via Google toch veel (eigen) geo-informatie delen met derden, zonder voor een eigen GIS-viewer en server te hoeven zorgen. Én 'iedereen' kent de interface van Google al. Dat zijn mooi allerlei voordelen. bedenk wel dat je afhankelijk bent van de continuïteit van Google - ook al lijkt deze wereld erg stabiel. En je 'klanten' zien steeds reclame van of via Google. Voor KML: zie https://nl.wikipedia.org/wiki/Keyhole_Markup_Language en https://code.google.com/apis/kml/. Uiteraard dien je Google Earth eerst geïnstalleerd te hebben op je eigen PC, deze is gratis downloadbaar. Voor bedrijven is er een - niet gratis - enterprise editie. Overigens, GML kan gezien worden als de tegenhanger / niet commerciële versie van KML. GML (zie ook GML op de Engelstalige Wikipedia) staat voor 'Geography Markup Language' en is de open-GIS standaard voor het uitwisselen van geo-informatie, eveneens op XML gebaseerd. Waar KML door de enorme bekendheid spontaan een standaard is geworden, is GML door het Open Geospatial Consortium (OGC) tot wereldwijde uitwisselstandaard verklaard voor geo-informatie. Veel GIS-pakketten kunnen met beide standaarden overweg, al zijn beide standaarden nog in staat van ontwikkeling. Ook geldt dat GML in de praktijk nog geen gemeengoed is; vaak wordt er gewoon uitgewisseld op basis van zogenaamde gesloten formaten van de (GIS) software leveranciers.

Lineair refereren

Lineair refereren is het toevoegen van x- en y-coördinaten aan gegevens op basis van een opgegeven afstand vanaf een bepaald nulpunt op een bepaalde lijn. Stel je een snelweg voor, de A50, die begint met kilometrering 0 (het nulpunt) bij Zwolle en eindigt bij kilometrering 58 in Arnhem (zie onderstaande figuur)

Mogelijke input bij lineair refereren. Het belangrijkste is de beschikking over een 'as' (lijn, zoals een snelweg of meetraai), waarvan het nulpunt bekend is, en hoe met de lijn mee een afstand oploopt. Administratieve tabel gegevens die refereren aan dezelfde afstandsmaat, kunnen nu op deze lijn geprojecteerd worden. In blauw zijn de benodigde kolommen die bij deze techniek gebruikt worden. (zie voor het resultaat de figuur hierna).

De locatie van kruisende infrastructuur (zoals een duiker onder de weg), ongelukken of de onderhoudstoestand van het wegdek kan nu met een afstand (kilometrering) worden aangeduid tezamen met de naam van die weg. Is er op de A50 een ongeluk geregistreerd bij kilometrering 7,5 (7.500 meter in de figuur), dan is exact de x- en y-coördinaat van dat ongeluk te berekenen, namelijk op exact op (7,5/58)e deel va die A50, startende bij het nulpunt in Zwolle. Noodzakelijk hierbij is uiteraard een goed gedigitaliseerde A50. Bovendien moet dat niet zomaar een lijnobject zijn, maar het moet bekend zijn in welke richting de kilometrering oploopt. In de tabel is de blauwe pijl een aantal 'blauwe' kolommen aangegeven. Deze kolommen zijn essentieel voor het lineair refereren. Op het moment dat lineair refereren niet gebruikt wordt om puntobjecten, maar lijnobjecten weer te geven, spreekt men van dynamische segmentatie. Dynamische segmentatie is dus een bijzondere soort van lineair refereren. De bovenste tabel (inspectiegegevens met de onderhoudsstatus) van de figuur geeft hier een voorbeeld van. In de figuur hierna is het resultaat te zien.

Mogelijke output als resultaat van lineair refereren. Zowel puntgegevens (gebeurtenissen) als kenmerken die zich afspelen op de as (lijngegevens) kunnen zo geprojecteerd worden op een kaart, zonder dat er oorspronkelijk van een coördinaat sprake was! In dit geval worden twee verschillende tabellen visueel gecombineerd. Er kan geanalyseerd worden of het aantal ongevallen over een bepaald tijdvak een relatie heeft met de onderhoudsstaat.

Met lineair refereren worden tekeningen dus automatisch gegenereerd. Door - simpel gezegd - een GIS naar een database te laten kijken, wordt de kaart gemaakt. Het bijzondere is dat op het moment dat die database verandert, de kaart ook verandert. Wanneer in het bovenstaand voorbeeld een wegvak bij nader inzien als kwaliteit toch 'Goed' in plaats van 'Matig' met zich meekrijgt, dan verschiet onmiddellijk de kleur van oranje naar groen. De moeite die het bijhouden van tekeningen kost is daardoor tot een minimum beperkt, terwijl de actualiteit en juistheid van de tekening maximaal geborgd zijn. Het getoonde voorbeeld maakt duidelijk dat GIS ook een duidelijke rol kan spelen op het gebied van assetmanagement, dat wil zeggen, het beheren (bouwen, onderhouden, gebruiken en slopen) van infrastructuur.

SAMENVATTING: Geocoderen en Lineair refereren zijn GIS-technieken waarbij aan data zónder coördinaten toch coördinaten worden toegevoegd. Bij geocoderen gebeurt dat middels adreskenmerken zoals gemeente, postcode of adres, bij lineair refereren gebeurt dat middels een afstand langs een bepaalde weg.

Reverse geocoding

Hierboven zijn geocoderen (Engels: 'geocoding') en lineair refereren behandeld. Wanneer het omgekeerde gebeurt - voor beíde technieken - wordt dit 'reverse geocoding' genoemd. Hier is geen Nederlandse term voor, maar het betekent zoiets als omgekeerd geocoderen. Het wordt niet zo vaak gebruikt. Reverse geocoding is het omzetten van een bekende locatie (met een x- en y- coördinaat) naar een adres. Het kan op twee manieren:

  1. De uitkomst is een kilometrering langs een een bepaalde weg, en het juiste wegnummer. Bijvoorbeeld de locatie van een gevaarlijke tankvrachtwagen met GPS, die in een file is vast komen te zitten. Dankzij de GPS is de locatie bekend, dankzij een GIS kan deze locatie worden omgerekend naar wegnummer (A50) en de juiste kilometrering, bijvoorbeeld 32,421
  2. De uitkomst is een (post)adres.

Hieronder zie je dit schematisch weergegeven.

input ouput
(x1,y1) (wegnummer = "A50", kilometrering = 32,421)
(x2,y2) (straatnaam = "Stationsstraat", huisnummer = 12, plaatsnaam = "Kedichem")

Een offset (de minimale afstand van de locatie tot de weg) kan ook tot de ouput behoren. Bijvoorbeeld de locatie van een zendmast die zich 53 meter naast de middenberm van een snelweg blijkt te bevinden:

input ouput
(x3,y3) (wegnummer = "A50", kilometrering = 32,421, offset = 53 meter)

De meeste GIS-applicaties kennen deze functie, waarmee dan vele locaties gelijktijdig en automatisch kunnen worden omgezet naar dergelijke (administratieve) aanduidingen.

SAMENVATTING: Met 'reverse geocoding' kan het omgekeerde van geocoderen en lineair refereren. Hiermee zet een GIS (bekende) locaties om in postadressen of wegnummers met kilometreringen.

Topologie

Een GIS-model gebruikt punten om lijnen en lijnen om vlakken te beschrijven. (b=punt en of vertex, c=lijnsegment, l=lijn, p=polygoon (vlak).) Dankzij deze strakke hiërarchie kunnen topologieregels worden afgedwongen en kunnen inconsistenties tussen informatielagen worden opgespoord en verbeterd. Daarnaast kunnen GIS-modellen zonder inconsistenties als netwerkmodellen worden gebruikt (zie verder tekst).
Donutpolygonen en nut/noodzaak topologieregels. Donutpolygonen zijn vlakken met gaten er in. Door topologieregels toe te passen wordt afgedwongen dat er geen slivers/gaten ontstaan. De gebruikte vertices voor vlakken die aangrenzend moeten zijn met andere vlakken of lijnen, zijn zo altijd en exact overeenkomstig met die van de aangrenzende vlakken of de er langslopende lijnen. Dit bespaart beheerwerk en levert consistente bestanden op die zich voor veelsoortige, ruimtelijke analyses lenen.
Hoe je niet moet tekenen en hoe je de gegevens niet moet opslaan wanneer je objectgericht wil werken. Objectgericht werken is noodzakelijk indien je de gegevens (geautomatiseerd) wilt kunnen analyseren: "Hoeveel gras moet onderhouden worden?", "Is al het gras via de openbare weg bereikbaar?" et cetera.

Topologie beschrijft - vanuit dataoogpunt bezien - regels over hoe objecten (punten, lijnen vlakken) onderling verbonden dienen te zijn, op elkaar dienen aan te sluiten, welke richting zij dienen te hebben en hoeveel exemplaren (nul, één of meer) van het ene in het andere mogen liggen. De simpelste menselijke definitie van topologie is echter de onderlinge ligging van objecten.

Een iets nettere definitie is 'het geheel van regels hoe onderling bij elkaar horende geografisch objecten - de punten, de lijnen en de vlakken - hun geometrie delen' (zie figuur rechts).

Voor een GIS kan topologie aangewend worden om bestanden te controleren, te vergelijken met andere bestanden. Dit geldt voor controle doeleinden, maar ook tijdens het tekenen zelf. Topologie gaat verder dan objectgerichtheid. Objectgerichtheid is in 'Inleiding GIS' al aan de orde geweest. Topologie beschrijft niet alleen dat de objecten (bijvoorbeeld de lijnen die wegen voorstellen) niet mogen overlappen, maar ook dat zij beginnen bij een andere weg, bij een kruispunt, dat zij wellicht eenrichtingsverkeer hebben, en dergelijke. Door topologische (controle- en of teken-) tools, is een bestand dat voor navigatiedoeleinden gebruikt wordt, van zo hoge kwaliteit dat de gebruikers 'nooit' de verkeerde kant op worden gestuurd.

Een voorbeeld: Op het oog is het misschien duidelijk dat op een kaart een huis A, gelegen in Wijk B, via de wegen C, D en vervolgens E, naar huis F in Wijk G kan komen. Voor een GIS betekent dit dat de wegen C, D en E elkaar MOETEN raken, dat huis A in (en niet ernaast!) het vlak van Wijk B moet liggen, en dat huis F in Wijk G moet liggen. Dit kan exact worden afgedwongen door die topologische regels. Een huis ligt in een wijk, niet op een weg of in het water. Een weg raakt (of loopt langs) een wijk, kent een rijrichting en komt bij minimaal één andere weg uit. Die rijrichting is nodig om te zien of anders niet een andere route bereden had moeten worden. Behalve voor navigatiedoeleinden is dit ook handig voor netwerkanalyses, het plannen van optimale busroutes, en dergelijke.

Topologie is voor een GIS van wezenlijk belang. Wanneer we ruimtelijk onderzoek doen, of op basis van kaarten beslissingen willen nemen, dan willen we dat de objecten, patronen en hun onderlinge relaties op de juiste plek liggen, niet met elkaar in tegenspraak zijn. De hoofdstad van een provincie ligt ook daadwerkelijk in die provincie, de zijrivier eindigt ook exact in een hoofdrivier, en een weg de is afgesloten met paaltjes is ook in mijn GIS afgesloten naar de hoofdweg toe. En in het tweede figuur: Een gemeentegrens gaat niet door de zee, maar komt overeen met de objecten (hier: water en grasland) van het eiland. Alleen wanneer bestanden onderling deze zekerheden hebben, kunnen we deze ruimtelijke informatie met een goed resultaat gebruiken voor:

  • navigatievragen; bijvoorbeeld: hoe kan ik het kortst of snelst van A via B naar C.
  • netwerkanalyses; bijvoorbeeld: berekeningen die niet gebaseerd zijn op absolute afstanden ('door de lucht') maar op relatieve afstanden ('via de weg') en capaciteitsvraagstukken (de weerstand of snelheden zijn dan bekend per lijnstuk/wegsoort).
  • rijtijdengebieden weergeven; bijvoorbeeld wat is het exacte bereik vanaf verschillende ambulance- of brandweerposten na melding (binnen 12 minuten en binnen 15 minuten), en wat zijn misschien betere locaties voor deze posten, nu er een nieuwe woonwijk is bijgebouwd.
  • het uitvoeren van overige ruimtelijke analyses op zowel route(lijn-)netwerken als vlakobjecten.

Over donutpolygonen:

In het tweede figuur kunnen we het percentage grasland en het percentage water per gemeente berekenen. We krijgen daarbij niet het probleem dat er dubbeltellingen zijn, omdat het grasland als een gemeentevullende vlak is getekend, met er overheen een meer... Dat is de reden voor het bestaan van zogenaamde donutpolygonen. Een typisch Amerikaanse term (GIS en de donut zijn hier beiden zo'n beetje uitgevonden!) voor vlakken waar een gat in zit. Voor cartografische toepassingen is dit principe niet altijd nodig, maar voor analytische (GIS) toepassingen wel. Zo zijn er in Nederland kadastrale percelen die gaten kennen: denk aan een plein, waarop een kerk staat. De kerk staat zelf op een kadastraal perceel van een kerkelijke gemeente, het plein is vaak eigendom van een gemeente. Bij automatische, ruimtelijke (GIS-) analyses ("van wie is deze kerk?") moet de uitkomst niet zijn: twee eigenaren. Bij 'oude' GIS-software en oude geo-informatie-bestanden was de uitkomst in dergelijke gevallen nog wel eens dat er twee percelen / perceeleigenaren tevoorschijn kwamen. Sinds 15 jaar is dit geen probleem meer dankzij de donutpolygonen. Eén vlak kan één of meer gaten kennen. In het figuur zie je een meer met een gat, en een eiland met een gat. Er zijn dus twee donutpolygonen. Middels topologische regels worden onderlinge mogelijke gaten en overlaps (slivers) voorkomen.

SAMENVATTING: Topologie kan gebruikt worden om inconsistentie (zoals slivers, maar ook in actualiteit) te voorkomen. Dat is weer nodig voor behoud van functionaliteit, meer mogelijkheden voor analyses en het verminderen van de beheerlast van (het bijhouden van) geo-informatie. Ook zonder topologie(regels) is een GIS vaak zodanig opgebouwd dat de verschillende lagen (punten, lijnen, vlakken) van elkaar afhankelijk zijn omdat ze bijvoorbeeld aangrenzend (moeten) zijn. De reden van die opbouw zit 'm in de noodzakelijkheid / wenselijkheid om de gegevens te kunnen analyseren / combineren. Donutpolygonen zijn vlakken met één of meer gaten.

TIP: Bestaan er topologische relaties tussen bepaalde bestanden (delen uit het (geo-) informatiemodel), dan is dit vaak een reden om deze bestanden in één geo-database, of op zijn minst door één centrale organisatie of afdeling te laten beheren.

Ruimtelijke statistiek / interpolatietechnieken

Meetlocaties met (gelabeld) de gemiddelde neerslag per jaar in mm.
Zelfde data, maar beter weergegeven. Door interpolatie-technieken is een neerslagkaart berekend. Isolijnen geven nu de overgangen weer.

Ruimtelijke statistiek is een specialistisch vak, waarbij GIS bij de praktische uitvoering ervan onmisbaar is. Zowel daar waar het gaat om de statistische berekeningen als bij het presenteren van het resultaat. Door middel van interpolatietechnieken kunnen onder andere puntmetingen (zoals neerslagmetingen, maar ook vervuilingsgraad, geluid of criminaliteit) worden omgezet naar een vlakkenkaart. Ruimtelijke statistiek kan behalve deze voorspellende waarden berekenen, gelijktijdig aantonen hoe zeker die waarden zijn, dus hoe zeker die interpolatietechniek is, gegeven het aantal meetlocaties, de variatie van de meetwaarden en de onderlinge afstand tussen de meetlocaties. Met andere woorden, het is ook bekend hoe zeker of onzeker een berekende (voorspelde) waarde is die tussen twee meetlocaties is gelegen. Zo zijn er zogeheten "spline-technieken", waarbij de tussenliggende (voorspelde of berekende) waarden (waarden tussen twee meetpunten) zodanig worden bepaald, dat het resultaat zo geleidelijk mogelijk verloopt. Bij andere meer geavanceerdere technieken, zoals "kriging", is het zelfs mogelijk om meetwaarden te voorspellen die buiten het bereik liggen van de meetwaarden. Zonder enige kennis van en ervaring met ruimtelijke statistiek is het toepassen van deze technieken in een GIS niet altijd even verstandig.

In de twee voorbeeldfiguren wordt getoond hoe meetlocaties, waarvan de neerslag van bekend is, kunnen worden gebruikt om een neerslagkaart te berekenen. In de woorden van de bekende cartograaf Bertin (zie 'Goede geo-visualisatie' in deel B) is de eerste kaart een kaart om te lezen. En dan ook nog een van het vervelende soort. Alleen iemand die het aantal meetlocaties en hun resultaten moet controleren op volledigheid en op uitschieters heeft er heel misschien iets aan. Echter, bij een dergelijke hoeveelheid data beginnen heel veel kaarten, waaronder allerlei meteorologische kaarten. Door middel van de ruimtelijke statistiek is er de tweede kaart van te maken. Dit is nu - in de woorden van Bertin - een kaart om te zien. Plotseling wordt duidelijk waar de meeste neerslag valt. Op een visueel aantrekkelijke manier (honderd keer zo duidelijk als de uitgangsdata?!) komen nu allerlei vragen naar boven. Waarom regent het op de Veluwe, in Zuid Brabant, bij Rotterdam en in Zuid-Limburg meer dan elders...

SAMENVATTING: Ruimtelijke statistiek is de wetenschap die binnen GIS gebruikt wordt om onder andere gegevens te analyseren en door interpolatietechnieken te voorspellen. Van puntgegevens (zoals meetlocaties) kunnen vlakken geconstrueerd worden. Ruimtelijke statistiek is een specialistisch vak, de interpolatietechnieken die het biedt zijn vaak lastig in de praktijk.

TIP: Een (commercieel) GIS-pakket kan vaak meerdere (standaard) GIS-analyses uitvoeren, maar sommige interpolatietechnieken gaan vaak te ver. Ga je je met dergelijke, zware technieken bezig houden, dan zal je de verschillende GIS-pakketten goed met elkaar moeten vergelijken op juist dit punt. Voor wat betreft zwaardere modelberekeningen met betrekking tot rasters is het ook nog mogelijk om te kijken of het programma PCRaster gebruikt kan worden. Dit is geen compleet GIS, maar is op het gebied van modelleren van processen waarbij rasters een rol spelen uniek in zijn soort. Wanneer rekentijd en de grootte van bestanden een rol spelen is dit pakket sneller dan andere pakketten. Het is gratis te downloaden, maar het gebruik vereist wel enige (GIS en modelleer) kennis.

De geschiedenis van GIS en een blik in de toekomst

Dit handboek ziet GIS als een middel om kaarten (en wellicht daarvoor ook analyses) te maken. Wil je meer over de geschiedenis van GIS weten, zie dan bijvoorbeeld Geografische Informatie Systemen in ruimtelijk onderzoek van P. Hendriks en H. Ottens. (Onderstaande indeling is door deze zelfde schrijvers voorgesteld.) Hier onder wordt daarom slechts héél algemeen de geschiedenis van GIS toegelicht, (Fase 1 t/m 3 naar: [1]).

  • Fase 1 / Pioniersfase (1960-1980): De academische wereld experimenteert. Amerika en Canada lopen hierin voorop. Het zijn geen GIS-pakketten, maar eerder GIS-programma's die in staat zijn data om te zetten naar kaarten (meestal: rasterkaarten) of specifieke berekeningen kunnen uitvoeren, vaak nog sterk op een bepaald vakgebied gericht, en daarom nog niet algemeen toepasbaar voor derden.
  • Fase 2 / Institutionalisering en commercialisering (1980-1990): ESRI, onder andere, komt met het eerste algemene GIS-pakket (ArcInfo, later met ArcView. De pakketten werken vaak nog met eigen (niet open) standaarden.
  • Fase 3 / Toename en verbreding gebruik en opbouw (nationale) geo-informatieinfrastructuur (1990-2000): Terwijl de GIS-pakketten verder evalueren en GIS steeds breder wordt ingezet, worden standaarden ontwikkeld. Standaarden van andere leveranciers kunnen vaker / beter worden ingelezen, leveranciers kunnen ook - de in middels ontwikkelde - open standaarden lezen en binnen bepaalde vakdisciplines, zoals vastgoed en ruimtelijke ordening in Nederland, worden ook standaarden ontwikkeld.
  • Fase 4 / GIS-toepassingen als geaccepteerde (geo-)IT-technologie (2000 - nu): Door het wereldwijde web, ontwikkelingen op IT-gebied - waaronder die van ruimtelijke databases, wordt het gewenst en mogelijk de output van GIS-pakketten (voorheen kaartjes of rapportages) on-line en interactief - ook vanuit andere applicaties - te raadplegen.

Duidelijk is inmiddels dat GIS van iets exotisch/wetenschappelijks in de beginjaren nu verworden is tot wat sommige auteurs een mainstream-technologie noemen: geaccepteerd en op basis van meer open standaarden, open formats en soms zelfs open software. Er is steeds meer interoperabiliteit (mogelijkheid tot uitwisseling met andere pakketten. Daarnaast kan de GIS-software steeds beter 'praten' met andere software, via technieken en standaarden als XML, GML, SOA, SOAP, en allerlei programmeertalen. Wel is nog steeds de benodigde kennis voor het goed vormgeven van GIS-modellen en het bedienen van de software nodig om er mee om te kunnen gaan. Het is daarom wellicht op middellangere termijn schadelijk dat in Nederland het aantal op GIS en geo-informatie gerichte opleidingen steeds minder wordt. Vooral op het gebied van services zal GIS nog een flinke vlucht kunnen maken, door aanvullingen op andere software te bieden in de vorm van specifieke viewers en ruimtelijke analyses, al of niet op de achtergrond. Er zijn naast de techniek twee redenen te noemen die zich aan de 'vraagkant' van GIS bevinden:

  • Ten eerste is er sprake van een toenemende GIS-awareness; door de toepassingen van onder andere Google Maps, Google Earth en TomTom, weet iedereen (misschien zonder de juiste 'GIS' termen te noemen) wat geo-informatie is en wat er mee moet kunnen. Zo kan iedereen 'pinpoints' ('points of interest') downloaden, zoals restaurants en flitspalen... Speciale datastandaarden ontstaan 'spontaan' (KML, Keyhole Mark-up Language) omdat Google inziet dat iedereen geografisch denkt bij het zoeken naar restaurants in zijn buurt. Het einde van de traditionele Gouden Gidsen is in zicht... Gis is in opkomst. Niet iedereen beseft wat nu al mogelijk wordt gemaakt dankzij GIS-sen... De vraag naar GIS-toepassingen en geo-informatie zal daardoor langzaam maar zeker steeds groter worden.
  • Een tweede aspect is de eerder besproken 'democratisering van geo-informatie'. Door deze twee ontwikkelingen lijkt het logisch dat ook GIS steeds meer ontwikkeld zal worden. Misschien niet (nog) specialistischer, maar breder ingezet voor meer (commerciële) diensten, al of niet op via het (mobiele) web aangeboden.

SAMENVATTING: Na een langzame start met voor de buitenwereld soms moeilijk toegankelijke software en formaten, gaan de ontwikkelingen sinds 2000 steeds sneller, vooral aangejaagd door toepassingen middels het www en dankzij de toegenomen 'GIS-awareness' bij een steeds breder, veeleisender publiek. Steeds meer (commerciële interessante / internet) toepassingen zullen worden ontwikkeld.

Informatiesystemen (facultatief)

Als GIS-specialist wil (of moet) je zo mogelijk werken. In het voorbeeld van hierboven bleek dat al. Je maakt dus afwegingen tussen zo goed mogelijke kwaliteit en kosten. De minimale nauwkeurigheid uit de opdracht zal centraal staan. De geo-informatie die je aldus verzamelt voor een kaart bestaan al vaak. Het zelf inwinnen is duur. Data snel op straat inwinnen (via lokale bestanden, nieuwskrantjes, vrijwilligers, websites van enthousiastelingen) is gevaarlijk. In de praktijk komen de betere beschikbare geo-informatie bestanden uit bestaande GIS-modellen. GIS-modellen zijn informatiemodellen met een geografische component/locatiecomponent. Fysiek gesproken komt (geo-)informatie uit een (geo-)informatiesysteem, maar dat vertolkt in feite een informatiemodel zoals dat is opgesteld binnen een onderzoeksproject of bedrijf. In deze paragraaf wordt verder ingegaan op de herkomst van geo-informatie.

Herkomst van geo-informatie (facultatief)

Jouw geo-informatie kan komen vanuit:

  • bedrijven: die vanuit hun beheerdersrol specifieke geo-informatie bijhouden.
  • onderzoeksprojecten: het gaat hier vaak om zeer gedetailleerde specifieke geo-informatie.
  • Internet: dit is zelf 'te googelen' uit vrij toegankelijke (overheid)sites. Houd wel rekening met eventuele copyrights / licenties
  • commerciële bedrijven: dat betekent inkopen van een commercieel bedrijf dat geo-informatie generiek voor meerdere, algemene toepassingen inwint en verkoopt.
  • eigen inwinning / eigen beheer: denk aan het zelf simpel plaatsen van locaties van
  • alle politiekantoren uit een plaatselijke gouden gids voor een kaart over veiligheid voor een lokale krant
  • monumentale panden uit een eigen inventarisatie
  • kinderdagverblijven of parkeergarages uit een gemeentegids, stadsplattegrond, enzovoort.
  • geocoderen; Adresbestanden kunnen op basis van gemeente, postcode of compleet adres voorzien worden van een coördinaat. Zie ook Geocoderen in Geo-visualisatie/Inleiding Cartografie
  • Eigen beheer: Bestaat de geo-informatie niet, dan zal dit door het bedrijf in kwestie wellicht zelf moeten worden opgestart, inclusief een beheercyclus, om een zekere - gewenste - actualiteit te kunnen waarborgen.

TIP1: Op kaarten zit een copyright. Op feiten, en dus ook de locaties van bepaalde objecten uit kaarten, zit echter géén copyright. Een (topografische) kaart mag dus niet zomaar gekopieerd worden, net zoals (delen van) luchtfoto's. Wel mag je die kaart gebruiken om een selectie van de objecten in eigen kaart te gebruiken, zolang je maar niet (delen van) de kaart gaat overnemen door digitalisering. Raadpleeg altijd de copyrightvoorwaarden, of raadpleeg de uitgever/bron. Meer over copyright op geo-informatie vind je in 'Cartography, Visualization of Geospatial Data' [2]

TIP2: Wees voor wat betreft de kwaliteit voorzichtig met het overnemen van lokale data van de community, 'open data', data van bepaalde gebruikersgroepen, belangenverenigingen, enzovoort. Deze bestanden kunnen met een beperkte bril, scope of aandachtsgebied tot stand komen. De data is bewust, maar vaker onbewust, voor een beperkt gebied tot stand gekomen. Wanneer een school alle graffiti in een stad in kaart heeft gebracht, zullen graffitilocaties die zich bevinden tussen de school en de huisadressen van de scholieren over vertegenwoordigd zijn... Wanneer op een dergelijke kaart beslissingen worden genomen, is dit niet bepaald wetenschappelijk verantwoord te noemen. Als GIS-specialist vervul je een bepaalde rol hierin; jíj hebt kennis van de eigenschappen van geo-informatie, jij hebt deze verzameld, jij bent de enige die de bron kan verifiëren. Vertaal dit niet zonder meer één op één over naar de kaartlezer.

Geo-informatie binnen onderzoeksprojecten (facultatief)

Bij een losstaand onderzoek geldt dat de data alléén de onderzoeksdoelstellingen dient te heiligen. Maakt het onderzoek deel uit van een breder onderzoeksprogramma of wordt deze uitgevoerd door een groter onderzoeksinstituut - zoals het CBS, Alterra, RIVM, LNV - dan is de beschikbaarheid van geo-informatie bij het opstarten van het onderzoek of project waarschijnlijk al snel geregeld. Hoe kleiner en specifieker het project, hoe groter de kans dat deze data zelf moet worden ingewonnen of speciaal moet worden aangeschaft. Bij kortdurende projecten zal de geo-informatie waarschijnlijk niet voorzien zijn van een beheercyclus; na verloop van tijd zal die data verouderen.

Onderzoeksdoelstellingen zijn vaak zo specifiek of gedetailleerd, dat hier nieuwe, al of niet geavanceerde GIS-modellen voor worden ontwikkeld. De geo-informatie binnen een dergelijk onderzoeksproject is vaak op projectbasis ingewonnen, specifiek gedefinieerd en daardoor buiten dat onderzoek niet altijd herbruikbaar.

Geo-informatie binnen bedrijven (facultatief)

Door een bedrijfsplan wordt het via missie, visie en strategie duidelijk wat de benodigde bedrijfsmiddelen zijn. GIS en geo-informatie staat niet los van het bedrijfsplan; het dient de missie te ondersteunen, en hoe dun of zwaar een GIS en de bijbehorende geo-informatie er uit zien, wordt bepaald door de (wellicht veranderende) strategie.

Binnen een bedrijf zijn de functionaliteiten van het GIS-model en dus ook de data idealiter afgeleid van het bedrijfsplan (zie figuur). Te zien is een zogenaamde top-down-benadering. De bovenste drie lagen uit het bedrijfsplan bestaan alleen in de hoofden van de medewerkers, of zijn beschreven op papier. De onderste laag beschrijft de werkelijk tastbare bouwstenen van een bedrijf. Dat zijn de productiemiddelen. Denk aan het gebouw, de medewerkers, de computers en het netwerksysteem, en ook de informatie. Deze productiemiddelen bestaan alleen omdat dit nodig is volgens de lagen erboven; bij een commercieel (of efficiënt gerund) bedrijf zal dus ook het informatiemodel alléén bestaan omdat het iets bijdraagt aan het bedrijfsmodel. Anders zou er sprake zijn van hobbyisme of geldverspilling op informatiegebied. Ook de aanwezige geo-informatie maakt hier deel van uit. De bedrijfsstrategie, visie, normen en waarden (bijvoorbeeld nauwkeurigheid), wijze van aansturen (stuurparameters uit geaggregeerde (geo-)informatie, zij allen hebben dus invloed op het wel of niet voorkomen, de kwaliteit en de kwantiteit van de aanwezige geo-informatie en het gebruikte GIS.

Intermezzo: GROEN VOOR GELD BV: (GIS)Bouwstenen afleiden met behulp van een bedrijfsplan

Een kort voorbeeld verduidelijkt het bovenstaande. GROEN VOOR GELD BV is een bedrijf met de missie: 'Groenbeheer uitvoeren voor gemeenten en waterschappen'.

  • De visie en missie is 'In Noord Nederland binnen drie jaar marktleider, door het opkopen van huidige uitvoerders en netwerken bij de gemeenten. Geld en winst staan voor op, echter dit mag niet ten koste gaan van een tevreden klant (de gemeente)'.
  • De strategie is: 'jaarlijkse klantenquêtes, cijfers moeten op het niveau van gemeenten helder zijn. Het gaat dan om inzicht in: kosten, opbrengst, tevredenheid, soort groenbeheer. Binnen 3 jaar 10% winst voor elke provincie'. Wanneer dit in detail verder wordt uitgewerkt, door terzake kundigen, blijkt uiteindelijk wat gedurende de eerste drie jaar de bouwstenen moeten zijn:
  • De bouwstenen zijn: 1 hoofdkantoor, noordelijk gelegen, 3 accountmanagers, 6 regionale groenbedrijven, 1 centrale database, pro-actieve houding van zowel medewerkers op gemeentelijk niveau als de accountmananagers'.


  • Bij het inrichten van de bouwsteen 'centrale database' blijkt uit een adviesrapport dat de centrale database gegevens moet bevatten van het oppervlak dat per gemeente moet worden onderhouden, het soort oppervlak per gemeente, en welke (maai)machines hierop gebruikt kan worden. Dat is onder andere afhankelijk van het oppervlak, de steilheid daarvan (met name bij taluds) en de afstand tot de omwonenden. De afstand tot de omwonenden is nodig om overlast te voorkomen bij het inzetten van het zwaarste, lawaaierige materieel. Ook moet GROEN VOOR GELD BV afspraken die de gemeenten met bedrijven en omwonenden heeft gemaakt vastleggen in die database. Tot slot moeten de medewerkers bij overlast of commentaar op het moment van de klacht dírect met het hoofdkantoor kunnen overleggen. Het hoofdkantoor moet weten waar die klacht zich dan bevindt, moet zich kunnen verplaatsen in de situatie ter plekke.
  • Uiteindelijk blijkt daarom de volgende geo-informatie nodig:
  • Topografische kaarten
  • Kadastrale kaarten
  • Vlakken kaart met te onderhouden groengebieden / groenstroken, met daarbij de volgende kenmerken: oppervlak, groenclassificatie (grasveld, ruw gras, berm, sloot, voetbalveld, et cetera) gemiddelde helling, maximale helling, materieel dat daar ingezet kan worden, contactpersoon bij de gemeente, onderhoudsfrequentie, datum laatst gemaaid/onderhouden.
  • Op (Geo)IT gebied (GIS, netwerk, hardware, software) is nodig:
  • On-line verbinding met het Kadaster op het kantoor voor check op eigenaren / omwonenden, alléén bij klachten.
  • Mobiele telefoon met GPS, voor medewerkers ter plaatse, in het geval er klachten zijn.
  • GIS om te berekenen welk materieel op een te onderhouden gebied optimaal kan worden ingezet.

Informatiesystemen die van bedrijfsplannen zijn afgeleid, zijn vaak groot en breed opgezet en dienen gedurende langere tijd flexibel herhaalbaar of vergelijkbare output te kunnen leveren.

Echter, ook geldt dat bedrijven continu in ontwikkeling zijn. Hun visie of strategie wordt gewijzigd of er is behoefte aan andere stuurparameters. Ga er dan niet vanuit dat per direct de systemen, de data en de functionaliteit van applicaties onmiddellijk zijn aangepast. Bijvoorbeeld omdat er nog geen prioriteit voor is gegeven die database uit te breiden of te koppelen. Elke visie- of beleidswijziging heeft zijn tijd nodig om effect te hebben. De cultuur, de systemen en het resultaat hebben tijd nodig om te veranderen. Soms wordt de inwinning, digitalisering of het beheer van geo-informatie te duur geacht, terwijl er wel meer verdiend moet worden met de primaire processen. Bij bedrijven mag echter toch verwacht worden - meer dan bij projecten - dat de geo-informatie die ingekocht wordt, voorzien is van een onderhoudscontract. En dat de geo-informatie die door het bedrijf zelf wordt ingewonnen of beheerd, een bepaalde - op de bedrijfsdoelstellingen afgestemde - revisiecyclus heeft. In die gevallen is de bijdrage van GIS en geo-informatie aan de bedrijfsdoelstellingen 'als smeerolie voor de business' gewaarborgd.

SAMENVATTING: Middels een bedrijfsplan kan bepaald worden welke bouwstenen noodzakelijk zijn. Voor een GIS en geo-informatie geldt dat ook deze afgeleiden zijn van missie, visie en strategie van het bedrijf. Dit kan in detail worden uitgewerkt, al zal praktijkervaring aan moeten geven 'hoe dik' dit moet worden opgepakt om het gewenste effect te bereiken. Na verloop van tijd kunnen andere strategieën, stuurparameters of acties nodig zijn die minder of juist méér GIS en geo-informatie nodig hebben dan enkele jaren daarvoor bedacht is. Bedrijven zijn flexibel, en daarmee dient de ICT (waaronder GIS / Geo-ICT) dezelfde mate van flexibiliteit te kennen.

TIP: Zorg dat jouw GIS-afdeling betrokken is/wordt bij niet alleen projecten waarbij 'bouwstenen' worden gewijzigd, maar ook bij momenten waarop missie en strategie worden gewijzigd of besproken. Denk aan contacten met ICT-afdelingen, discussies over informatiebeleid, klantenwens-inventariesties, en dergelijke. GIS en de geo-informatie kan dan sneller inspelen op de nieuwe eisen, en de bijdrage die het levert kan dan direct meegenomen worden in de strategie. GIS is dan niet alleen een 'met de golven meedeinende' bouwsteen, maar levert input voor de strategie.

Gebruik van geo-informatie

Verwacht niet zonder meer dat van elders verkregen geo-informatie gebruikt kan worden voor nieuwe, innovatieve of andere toepassingen dan oorspronkelijk bedoeld.

In de praktijk zal echter toch vaak op al bestaande geo-informatie (hieronder ook genoemd: fysieke databases) worden teruggegrepen. Bijvoorbeeld omwille van snelheid, vanwege de kosten of er is onnadachtzaamheid in het spel. Er wordt dan uit gewoonte gekozen voor een bekende, makkelijk ontsluitbare dataset. Aan jou als GIS-specialist is dan dus wel steeds de vraag of deze afkomst van de data de kwaliteit van het onderzoek / de kaart in de weg staat.

Intermezzo: Synnexxion en de concurrent: over nauwkeurigheid van bestanden

Een kort voorbeeld. Denk nog eens aan het eerdere voorbeeld uit paragraaf "Toepassingscontext", over het fictieve bedrijf Synnexxion. In dat voorbeeld bleken de aantallen niet nauwkeurig in de database te staan. Dat was strikt genomen ook niet nodig. Synnexxion wil geen accurate databases, maar accuraat vervoer en vooral veel winst. Waarom zou bij een ander busbedrijf met dezelfde missie (namelijk: geld verdienen in het openbaar vervoer) de klantgegevens per stad misschien véél accurater geweest? Dat is héél goed mogelijk. Het antwoord is eenvoudig: Omdat dezelfde missie met een andere strategie wordt uitgewerkt. Wellicht worden normen en waarden als accuraat, klantgericht en professioneel vervoer bij dit tweede bedrijf ook bewust uitgedragen naar en door de databeheerders. De gedachte hierachter is wellicht de overtuiging dat niet alleen buschauffeurs, maar héél het personeel deze normen moet hebben. Job-rotation en een professionele indruk naar potentiële klanten maken voor dit tweede bedrijf misschien zelfs wel deel uit van hun marketingstrategie. NB: Géén van beide bedrijven heeft gelijk of ongelijk. Beide bedrijven kunnen met hun verschillende strategie financieel gezond zijn en blijven.

SAMENVATTING: Binnen bedrijven is vaak de aanwezige geo-informatie niet afdoende voor een onderzoeksvraag / kaartverzoek. Wanneer geo-informatie van buiten het bedrijf komt, kan omwille van snelheid, eenvoud of kosten, bewust of onbewust geweld worden gedaan aan de kwaliteit van het eindproduct, de analyse of de kaart. De kaart geeft dan misschien nog wel een antwoord op de onderzoeksvraag, echter, de nauwkeurigheid, compleetheid of actualiteit ervan is misschien lager dan vooraf gehoopt. Dit kan een bewuste keuze zijn.

Gebruik van geo-informatie van belangenverenigingen en 'open geo-informatie'

Nieuwsmeldingen van individuen in kaart gebracht. Bron: www.skoeps.nl, Nieuwscategorie 'Binnenland', 15-22 oktober 2007. Achtergrondkaart: www.openstreetmap.org.
P2000-meldingen, regio IJsselland, over 2 dagen. Bron data: P2000, via https://www.langeleegte.net/.
P2000-meldingen, regio IJsselland, over 2 maanden, alleen categorie "Politie". Bron data: P2000, via https://www.langeleegte.net/.

Belangenverenigingen, lokaal en landelijk, enthousiaste individuen verzamelen steeds meer data. Onder andere doordat van het individu als burger steeds meer verwacht wordt, maar ook omdat hij steeds meer beschikt over de kennis en middelen - zoals GPS - om deze data te verzamelen. Ze proberen op deze wijze grip te krijgen op de wereld om hen heen, op specifieke objecten uit hun aandachtsgebied, hun (sub)cultuur. Ze gebruiken daarbij (bewust of onbewust) bepaalde, vaak voor de buiten wereld onbekende prioriteiten, definities en gebiedsafbakeningen. Zie onder andere www.openstreetmap.nl, of lokale belangengroepen uit jouw eigen omgeving.

Andere voorbeelden van user-generated-content-sites zijn Wikipedia, Hyves, Flickr, YouTube en watvindenwijover.nl?. Meer voorbeelden en meer weten over www2.0? zie Wikipedia Web2.0.

De inspanning van deze organisaties wordt onder andere uitgevoerd om (lokale) overheden te voorzien van andere, nieuwe zienswijzen en om de beslissingen bij individuen en overheden te beïnvloeden. In dit verband moet ook genoemd worden het fenomeen "www 2.0", waarmee gedoeld wordt op het wereldwijde web dat steeds meer 'user generated content' bevat; elk individu kan wat voor informatie dan ook delen met wie dat dan ook maar wil gebruiken, van 'blog' tot kaart, en van 'medische site' tot complete databases. Een aardig voorbeeld hiervan is onder andere de site van Skoeps: Skoeps 'nieuwskaart'. Hier kunnen gebruikers onder andere nieuwsitems toevoegen (ongelukken, graffiti) met minimaal een lokale betekenis. Foto's, films en commentaar worden gekoppeld aan een kaart. Via een filter is de zien welke gebeurtenissen waar plaatsvinden. Zie illustratie rechtsboven.

Er zitten twee interessante aspecten aan de geo-informatie die op deze wijze ter beschikking komt.

  1. Voor de (lokale) belangenverenigingen is deze vorm van data verzamelen een goede ontwikkeling. Het vormt een prachtig middel om hun democratische taak praktisch in te vullen. Op een positieve wijze is het mogelijk om de overheid en de informatie die de overheid gebruikt te beïnvloeden. Het proces gaat snel. Bijvoorbeeld via een camera's op een mobieltje met GPS. Het gesproken woord en het beeld of filmpje wordt via 'bluetooth' geupload op PC en wordt dezelfde dag nog via internet of op een andere wijze gecommuniceerd met de doelgroep die de afzender wenst te beïnvloeden. Er wordt zo tegenwicht geboden daar waar de overheid te traag wordt geacht, of wellicht 'slechts' gebruik maakt van landelijke, altijd weer dezelfde misschien verouderde bestanden en (landelijk opererende) (GIS) adviesbureaus. Omdat deze belangenorganisaties wél de tijd en energie (en soms: ook meer kennis) hebben, krijgen zij - actueler en specifieker - in kaart wat anders niet zichtbaar zou zijn voor de burger en de overheid. Wanneer GIS en GIS-kennis aan deze initiatieven kunnen worden toegevoegd, hebben deze organisaties een visueel sterk middel in handen om de publieke opinie en de politiek constructief en op argumenten te beïnvloeden.
  2. Er zit ook een andere kant aan deze 'democratisering' van (geo) informatie. En dat is misschien als 'keerzijde' te bestempelen volgens sommige GIS-specialisten en overheden. De vraag is namelijk of deze nieuwe manier van data verzamelen zonder meer een aanvulling kan zijn voor bestaande, vaak meer landelijke of meer gebiedsdekkende geo-informatie. Wanneer die bestanden actueler zijn, is er de neiging om die direct maar over te nemen. Echter, wanneer die nieuwe bestanden met een beperktere scope, definitie, aandachtsgebied of te verspreid tot stand zijn gekomen, moet er aan getwijfeld worden deze te gebruiken in een GIS. Zeker bij kleine aantallen; dan speelt ook nog eens "de macht van het kleine getal".

Ruimtelijke gegevensmodellering (facultatief)

Het ontwerpen van een model voor een (geografisch) informatiesysteem zal jij waarschijnlijk niet vaak gaan doen. Het GIS-model bestaat vaak al, zoals hierboven beschreven. Je maakt er als GIS-specialist gebruik van, of je krijgt de kans hem (mede) te ontwerpen of deze te actualiseren. Vandaar de volgende uitwijding over gegevensmodellering. Als eerste een afbeelding met wat terminologie. Zoals te zien is, is het fysieke model een beperking van de werkelijkheid; iets dat we ook al zagen in de eerste hoofdstukken van dit theoretische deel.

Beschrijving van en voorbeelden bij de relaties tussen de ruimtelijke logische-, conceptuele- en gegevensmodellen. Conclusie is dat goed nagedacht moet worden over het model; als de toepassingcontext wijzigt / verbreedt, zijn wellicht achteraf grote aanpassingen nodig.

In bovenstaande figuur (naar: [3]) een voorbeeld van hoe Ruimtelijke gegevensmodellering is op te vatten.

Ruimtelijke modellering wijkt in principe niet af van 'gewone' modellering, zij het dat nu met een ruimtelijke factor om moet worden gegaan. Daardoor zijn relaties, afhankelijkheden en benodigde data anders, is de functionaliteit eenvoudiger of met meer mogelijkheden in te richten. De database is eenvoudiger te modelleren, dan wanneer dit model puur relationeel en buiten een GIS om zou zijn gemodelleerd. (Dit is een rol die jij als GIS-specialist zou kunnen opnemen; adviseren over hoe dit anders / beter kan.) Het model is daarna te vertalen naar een fysiek gegevensmodel. Een fysiek gegevensmodel is in feite een verzameling (database) met tabellen (of serie bestanden) met een onderlinge, vastgelegde relatie.

Te zien is dat - afhankelijk van de toepassingscontext - verschillend naar de werkelijkheid gekeken wordt. Afhankelijk van die kijk komt een verschillend fysiek (GIS-) model tot stand. In het ene geval worden wegen als lijnen gedefinieerd (zie de figuur: met 1) aangegeven), en in het andere geval worden de wegen gezien als vlakken, omdat men de rijbanen als een te onderhouden oppervlak wil kunnen zien (zie de figuur: met 2) aangegeven).

Het ontwerpen van een Fysiek Model wordt iets eenvoudiger voorgesteld door het volgende plaatje. Is het Fysiek Model eenmaal vormgegeven, dan bestaat dit uit geo-informatie in een (fysieke) database of serie bestanden, met onderlinge relaties en afhankelijkheden.

Hoe een (geo-) database idealiter tot stand komt. De business, oftewel de primaire processen van een bedrijf, vastgelegd in een zogenaamd Conceptueel Model, bepaalt via het Logisch Model (hoe men werkt of wenst te gaan werken) welke geo-informatie nodig is ten behoeve van het Fysieke Model.

Is het Fysieke Model bepaald, dan kan de fysieke database gebouwd en vervolgens gevuld worden, met de benodigde software (GIS) er omheen.

SAMENVATTING: Een fysieke database kan alleen optimaal functioneren indien het (nog steeds) is afgestemd op het Conceptueel Model: de business. Een fysieke database kan alleen gebouwd worden (of effectief aangepast worden) als het Business Model bekend is. Voor kleinere omgevingen geldt dit ook: een fysiek GIS-model is alleen op te zetten als bekend is welke onderzoeksvragen beantwoord dienen te worden en welke kaarten geproduceerd moeten worden.

TIP: Zomaar kijken welke databases / geo-informatie je voorhanden hebt - en deze vervolgens gebruiken - is gevaarlijk. Zonder kennis van wat hierboven als informatiegrammatica wordt genoemd - de regels en definities die binnen het bedrijf of bij de data horen - is er een goede kaart of analyse alleen 'op goed geluk' te maken. Bespreek als GIS-specialist met de kenners van de data, het businessproces en/of de leverancier/beheerder van de data ('wat wordt verstaan onder een weg, onder een wegvak, enzovoort'. De visualisatie ervan zal dan eerder juist zijn.

Meer weten over de ontwikkeling van GIS-modellen, het initiëren van GIS, het opzetten van GIS-gebruikersgroepen, GIS-projecten opzetten? Zie onder andere:

  • GIS for the Urban Environment, J. Maantay en J. Ziegler, 2006, pagina's 248 - 264.
  • Thinking about GIS: Geographic Information Systems Planning for Managers; R. Tomlinson, 2003; Redlands VS, ESRI-Press.

Cases (facultatief)

In dit handboek staat vooral de geo-visualisatie centraal. De meest mooie analyses van GIS blijven daarbij - helaas - buiten beeld. Een aantal voorbeelden kunnen analyses en toepassingen binnen GIS wel verhelderen en verder uitdiepen. De voorbeelden illustreren daarnaast de kracht van een GIS voor de overheid en de commercie die beslissingen moeten nemen, en de wetenschap.

Case 1: De erosiegevoeligheidskaart; GIS als voorspeller

Het gebied waarvoor de erosiegevoeligheid moet worden gekarteerd in deze case.

Hier een goed voorbeeld van hoe met een GIS én een bepaald model verrassende output berekend kan worden. Cartografisch is er op het eindresultaat wat af te dingen. Het betreft dan ook een GIS uit 1996, waarin niet elke handeling zeer gebruiksvriendelijk was en waarmee cartografisch nog niet bepaald sterke producten konden worden gemaakt. In deze module 'Inleiding GIS' is dit niet erg; het toont dat een GIS ook als voorspeller kan dienen, als een model maar goed / wetenschappelijk onderbouwd is vastgelegd.[4] Andersom geldt gelijktijdig. Is het model (nog) niet goed / wetenschappelijk onderbouwd, dan kan een GIS de voorspelling toch in kaart brengen, waarna deze voorspelling verworpen of aangescherpt kan worden door extra metingen. Nu iets concreter.

Het doel is om te komen tot een erosiegevoeligheidskartering van een deel van het Limburgse heuvellandschap. Dat is dus geen voorspeller zoals het weer. Er kan namelijk niet mee voorspeld worden dat er binnen nu en een week op die en die plek 10 kubieke meter grond naar beneden komt. Het is meer een voorspeller zoals bij het klimaat. Gezien over een langere periode, is de kans dat er op die plekken veel grond naar beneden komt, duidelijk veel groter dan op andere plekken.

Hoe is zo'n voorspellende kaart met in dit geval erosiegevoeligheid te maken?

Hieronder - voor de lezers met weinig tijd - eerst een samenvatting van deze case, daarna het uitgebreide verhaal van de totstandkoming van de erosiegevoeligheidskartering.

  • SAMENVATTING.
Een vakspecialist heeft onderzoek gedaan. Uit waarnemingen blijkt steeds maar weer dat de erosie op een bepaald punt, afhankelijk is van (en dus voorspeld kan worden door) het hellingspercentage en het landgebruik. Op een (vaak onbegroeide) akker spoelt de regen meer en vaker grond weg, dan op grasland. En hoe hoger het hellingspercentage, hoe meer erosie. (Dit is een vakinhoudelijk model.) Door beide aspecten - hellingspercentage en landgebruik - van een bepaald gebied in twee rasterdatabestanden te zetten, kan van elk punt (pixel) berekend worden van de erosiegevoeligheid is. (Dit is een GIS-model.)
  • 1. HET ONDERZOEKSMODEL
Het begint niet bij een GIS-specialist, maar bij een vakspecialist. In dit geval een fysisch geograaf, een geomorfoloog, een geoloog of een bodemkundige. Die vakspecialist zal een (vakinhoudelijk) model moeten hebben of maken. Laten we aannemen dat uit zijn metingen (dat zijn puntmetingen of puntwaarnemingen!) blijkt dat de hellingshoek, en het grondgebruik goede voorspellers zijn voor de erosie. Hij heeft namelijk alle waarnemingen van erosie in dit gebied bekeken, en is tot de conclusie gekomen dat vanaf bepaalde hellingshoeken, en bij bepaald grondgebruik, veel vaker erosieverschijnselen zich hebben voor gedaan. Laten we als GIS-specialist nu aannemen dat hij dit goed gedaan heeft en dat er dus geen andere 'voorspellers' zijn, zoals grondsoort. Want een grondsoort löss is erg erosiegevoelig, en een grondsoort kalksteen of klei is minder erosiegevoelig. Gelukkig stelt die vakspecialist ons gerust. Alle puntmetingen / waarnemingen die hij heeft gedaan, zijn gesitueerd in lössgebieden, en het onderzoeksgebied zelf is ook geheel löss.
  • 2. VERKENNINGSFASE: HET OVERLEG
Nu pas komt de GIS-specialist aan bod. Samen met de vakspecialist bespreekt hij het model. 90% van de tijd is de vakspecialist aan het woord. De GIS-specialist luistert goed, vraagt indien hij iets niet begrijpt. Hij moet immers het model écht snappen en omzetten in een GIS-model. Uiteindelijk is dit het model (uit: [5] naar [6]). :
erosiegevoeligheid landgebruik met hellingspercentage (=de twee voorspellers)
zeer sterk akkerland op >8%
sterk akkerland op 5-8%
matig akkerland op 2-5% én grasland op >8%
licht akkerland op 1-2% én grasland op 5-8% én bos&boomgaarden op >8%
nauwelijks overige categorieën (lagere hellingshoeken als hierboven genoemd, en alle bebouwde gebieden en de snelweg
Merk op dat de GIS-specialist niet het model maakt, maar bespreekt. De GIS-specialist moet namelijk nu op zoek gaan naar kaarten die bovenstaand onderscheid kunnen maken. Er is wel een landgebruikskaart, maar die maakt onderscheid tussen bossen en boomgaarden. Zou de vakspecialist onderscheid gemaakt hebben in erosiegevoeligheid tussen gebieden met naaldbomen en
Totstandkomingsproces / GIS-model bij de erosiegevoeligheidskartering. Het GIS-model is zwart weergegeven, de input van de vakspecialist (classificatie) is blauw weergegeven. Bovenaan staat de input, drie bestanden, onderaan de output: de erosiegevoeligheidskaart (zie verder tekst)
gebieden met loofbomen, dan zou de GIS-specialist op zoek moeten naar een andere kaart waar dat onderscheid in bos ook op wordt gemaakt. In het uiterste geval zou de GIS-specialist de vakspecialist / onderzoeker moeten teleurstellen, namelijk, het model moet worden aangepast. Let wel dat is een uiterste redmiddel. Zou de GIS-specialist niet beschikken over een kaart met onderscheid in grasland en akkerland (staat vaak zonder begroeiing!) dat zal er een waardeloze kaart uitkomen, omdat deze erosiegevoeligheid van deze twee klassen ver uiteen ligt. Zou de GIS-specialist echter niet beschikken over een kaart met de ligging van de snelweg, of hij heeft een kaart met bebouwd - waarin snelweg én bebouwing in één klasse vallen - dan is dat voor de onderzoeker waarschijnlijk geen groot probleem; het model maakt dit onderscheid niet. Merk op dat er géén categorie 'geen erosie' is. De vakspecialist heeft onvoldoende vertrouwen in de data om dit te kunnen voorspellen, óf het blijkt dat deze categorie gewoon niet waar te maken is; overal kan nu blijkbaar altijd een beperkte mate van erosie plaats vinden.
NB: De vakspecialist had ook dezelfde persoon kunnen zijn als de GIS-specialist, wanneer deze over de juiste GIS-expertise zou beschikken. Dit komt bij grotere onderzoeksinstituten vaak voor. GIS wordt dan ook vaak op meerdere opleidingen als ondersteunend vak gedoceerd.
  • 3. GEO-INFORMATIE VERZAMELEN
De GIS-specialist moet nu op zoek naar kaarten waarin 'de voorspellers' staan. Dat is een landgebruikskaart en een hellingklassekaart. In de figuur aan het begin van dit hoofdstuk zie je het gebied waar het om gaat, in Zuid-Limburg (Bron: eigen onderzoek 1996, bij het vak 'Hands on GIS', UU, Fac.der Ruimtelijke Wetenschappen). Op basis van een kartering van wegen, het landgebruik en hoogtelijnen is deze landgebruikskaart tot stand gekomen. Het lastige is nu: de GIS-specialist beschikt niet over een hellingklassekaart.
  • 4. GIS-BEWERKING1: INPUT GENEREREN
De Hellingklassen moeten berekend worden. Dat kan op basis van de hoogtelijnen. In het gesprek met de vakspecialist was het ontbreken van de hellingklassenkaart geen probleem, omdat de GIS-specialist al wist dat zo'n kaart relatief eenvoudig te berekenen is op basis van hoogtelijnen. Gebieden tussen hoogtelijnen, en rekeninghoudend met zogenaamde breeklijnen (wegen, rivieren). Dit gaat met een tussenstap. Afhankelijk van de afstand tussen de hoogtelijnen wordt een zogeheten Triangulated Irregular Network (TIN) kaart gemaakt. Dat is een kaart met allemaal driehoeken tussen de hoogtelijnen(punten). Hierbinnen moet dan aangenomen worden dat de hoogte binnen de zo ontstane driehoeken regelmatig afneemt of toeneemt. Voor elke driehoek is dan dus ook de helling te berekenen. In de getoonde groene kaart met driehoeken is een klasse-indeling gemaakt om te kunnen bestuderen of er niet te veel of te grote driehoeken voorkomen met uitzonderlijk lage of hoge hellingsklassen. Deze GIS-bewerking vereist dus zowel GIS-kennis (wat kan er met dit pakker en hoe voer ik dat uit) als GIS-ervaring. Hoe stel in de parameters voor deze GIS-bewerking in. GIS is géén toverdoos en niet elke opmerking als 'dit is dank zij een GIS uit te voeren met één druk op de knop' mag zomaar serieus genomen worden.
Hellingsklassekaart op basis van TIN's, o.b.v. een raster en de uiteindelijke erosiegevoeligheidskaart. Merk op dat de twee linker figuren inhoudelijk exact dezelfde data representeren! (zie verder tekst)
  • 5. GIS-BEWERKING2 CONVERSIE VAN VECTOR NAAR RASTER
De vakspecialist heeft verteld dat er enige onnauwkeurigheid zit in zijn voorspelling. De GIS-specialist kent de onnauwkeurigheid van de landgebruikskaart. Ook de vectordata (TIN-data zijn een vorm van vectordata) is te nauwkeurig gemodelleerd. De GIS-specialist en de vakspecialist bespreken hun ervaringen op dit gebied in een tweede aanvullend gesprek. Er wordt besloten om de hellingklassekaart en de landgebruikerskaart om te zetten naar rasterdata met pixels van 25 bij 25 meter. Die hellingklassekaart is te zien in de blauwe figuur in het midden. Tevens wordt besloten het eindresultaat (de erosiegevoeligheid) niet nauwkeuriger te representeren als met pixels van 50 bij 50 meter. De vakspecialist zal overigens in zijn publicatie gaan opmerken dat het model indicatief is; de pixels die de verschillende erosiegevoeligheden zullen gaan aangeven, zijn niet heilig. Het is en blijft een voorspelling, en het model kan er voor een beperkt deel van het gebied naast zitten. Hiermee is het model niet ongeldig. De GIS-specialist hoeft in dit geval naar de vakspecialist niet zijn vrees uit te spreken dat kaartlezers dit verkeerd kunnen interpreteren. De onderzoeker publiceert richting een goed opgeleid publiek en voorziet de kaart van een voorbehoud.
  • 6. GIS-BEWERKING3: OVERLAY-TECHNIEK EN RECLASSIFICEREN
De input is gereed, dat wil zeggen, twee rasterdatabestanden: de hellingklassekaart en de landgebruikskaart. Beide rasterdatabestanden worden als het ware over elkaar heen gelegd ('overlay'-techniek), waarna van elke pixel van 25 bij 25 meter wordt 'uitgelezen' door de GIS-software, wat het landgebruik is en wat de hellingsklasse is. Deze wordt vertaald naar een erosiegevoeligheid middels de eerder genoemde tabel. Deze techniek heet reclassicificatie. De gemiddelde erosiegevoeligheid van 4 cellen (50 bij 50 meter) wordt weggeschreven in een nieuw rasterdatabestand met de erosiegevoeligheid.
  • 7. REPRESENTATIE: DE KAART
Het laatst genoemde rasterdatabestand kan direct dienen binnen een GIS om er een kaart mee te maken (zie de geel/rode kaart rechts). Voor de kleur rood is gekozen vanwege de alarmerende werking. Veel erosie betekent dat er waarschijnlijk maatregelen moeten worden getroffen, of dat er vaak problemen zijn te verwachten. Geel als lichtere tint én andere kleur vertolkt minder zware risico's. Dergelijke overwegingen komen later in dit handboek aan de orde. Aardig om te constateren. De kleur grijs staat voor nauwelijks erosie. Er kan echter wel degelijk erosie plaatsvinden! De kleur grijs had daarom beter (heel) licht geel kunnen zijn. Grijs 'als kleur' vertolkt in een goede kaart vaak de functie van 'onbepaald', 'geen gegevens bekend'. Wit vertolkt vaak de functie van 'waarde is nul' of 'niet meegenomen in de studie'. Overigens, ook al is de doelgroep niet de lokale bewoners, maar de onderzoeker, dan nog had voor de duidelijkheid een deel van de topografische kaart als referentie moeten dienen. Met andere woorden, de dorpskernen, de namen en een aantal hoofdweg hadden moeten worden toegevoegd voor de oriëntatie.
CONCLUSIE: Met simpele overlay-technieken is GIS als voorspeller in te zetten. Dit gebeurt door de waarde uit verschillende thema's / datasets, al of niet op basis van een gewogen bijdrage, op te tellen per locatie. De optelsom bepaalt, een score met een minimum en een bepaald maximum, geeft dan met een relatieve score aan hoe waarschijnlijk daar iets zal voorkomen. Dit werkt voor de kans op erosie, zoals in deze case, maar dat geldt ook voor bodemgeschiktheid voor een bepaald gewas, de kans op archeologische vindplaatsen, de kans op natuurontwikkeling, et cetera.

Case 2: Risicokaarten; over de meerwaarde van GIS als combinatietool van data

Door het combineren van de datasets 'Risico's', 'Kwetsbare objecten' en 'woonwijken' blijkt de kaart van grote waarde voor de individuele burger, belangenorganisaties, calamiteitenorganisaties, beleidsambtenaren en vergunningverstrekkers van de gemeente. Dit figuur is op basis van gegevens van www.risicokaart.nl tot standgekomen, de ondergrond is afkomstig van www.openstreetmap.nl.

Zonder dat er meer informatie wordt gegenereerd, is het combineren van geografische informatie tot één kaart een - zelfs door GIS-specialisten - nog steeds onderschat fenomeen. Door het combineren van datasets krijgt een kaart per definitie een meerwaarde. Dat komt omdat zo ruimtelijke relaties te zien zijn die anders verborgen bleven. Dat zijn misschien relaties op algemeen of lokaal niveau, en misschien zijn die relaties pas nodig op het moment dat er een calamiteit is.

Kijk bijvoorbeeld eens naar de Risicokaart van (een deel van) Schiedam. Hiermee wordt de algemene meerwaarde zoals hierboven bedoeld aangetoond. In dit specifieke geval gaat het om het thema risico / calamiteiten. Het is meteen af te lezen waar de risico's zich voordoen en of die zich wel of niet ook over een of jouw woonwijk uitstrekken. Het is óók direct duidelijk hoe groot een risico is, niet alleen dát er een risico is. Een mogelijke overdreven reactie, wordt voorkomen. Zonder de contouren zou de kaart tot meer vragen dan antwoorden kunnen leiden. Op dergelijke kaarten is extra uitleg en een duidelijke legenda zéér belangrijk.

Overigens, vaak worden de verschillende datasets apart beheerd. In dit geval zijn dat: de verschillende woonwijken (of wellicht adreslocaties), de kwetsbare objecten en de bedrijven / locaties die risico's veroorzaken. Deze zullen vaak op verschillende plaatsen en met verschillende deskundigheid totstandkomen. Dankzij GIS is dat géén probleem. De risicokaart (voor alle provincies is die beschikbaar) toont aan dat een zeer complexe kaart, voor zowel burgers als professionals kan bijdragen aan goede informatievoorziening. NB: Het is in feite géén kaart in de 'oude' betekenis van het woord: de bestanden worden door de provincies continu up-to-date gehouden, en de detailinformatie is alléén ingezoomd te verkrijgen.

Overigens, vergelijken we de hier getoonde kaart met de eerder in Geo-visualisatie/Deel A: Theorie besproken kaart Afbeelding:Deventer mast fictief vals voorbeeld.JPG, dan zien we dat hier de risico's voor de burger een stuk beter gecommuniceerd worden. Waarom? We lopen misschien vooruit op een aantal zaken in de delen B en C, maar de antwoorden zijn:

  • de bron wordt genoemd
  • de risicocontouren worden met zwart aangegeven niet met rood of geel
  • het vlak dat binnen een risicocontour valt wordt niet met een rode kleur ingekleurd
  • de exacte risico's worden genoemd er wordt niets gesuggereerd en - althans op de originele site van [www.risicokaart.nl| www.risicokaart.nl]:
  • er staan links naar verdere verdieping, uitzonderingen, exacte definities.
  • het gebied is niet beperkt tot één risico / één gebied, maar ook de omgeving is in beeld, waardoor de risico's en de spreiding in zijn gehele context (ook in andere wijken) te zien is.

Al met al kan gesteld worden dat GIS in het geval van de Risicokaart van Nederland een goed voorbeeld is van zeer gedetailleerde publieksvoorlichting. Gecombineerd met het feit dat GIS-viewers in het algemeen als ingewikkeld worden beschouwd, is déze site er aardig in geslaagd om het detailniveau van de risico's in de buurt van elk individu in gebruiksvriendelijk in beeld te brengen. Gezien de aandacht die rampen als Volendam en Enschede trekken, is dit géén overbodige luxe. GIS draagt hiermee bij aan het beeld dat de overheid wenst te hebben: een transparante, eerlijke en professionele organisatie.

Overigens op [www.risicokaart.nl] wordt GIS niet alleen gebruikt om de individuele burger niet alleen goed voorgelicht. Hij wordt ook beschermd tegen zichzelf, tegen verkeerde conclusies die hij zou kunnen trekken uit onkunde, en hij wordt beschermd tegen potentieel misbruik die dergelijke nationale/provinciale datasets wellicht in zich zouden kunnen hebben. Dit is bereikt omdat op www.risicokaart.nl niet met kaarten, maar met een GIS gewerkt wordt. Hoe is dit concreet te zien? Onder andere aan:

  • Er kan niet alle risico's gelijktijdig bekeken worden. Met moet inzoomen tot op lokaal niveau.
  • Detail niveaus worden vermeden: er staan wél woonwijken op, maar niet: hoeveel mensen er waar en wanneer aanwezig zijn. Deze gegevens zijn er wel, echter, dat zijn gegevens die de (lokale) overheden voor zich zelf houden om bij calamiteiten, beleidzaken of vergunningen de juiste proporties te kennen. Het is niet nodig dat 'Jan en Alleman' deze details kent. Ook dit belangenorganisaties waarvan de goede naam vast staat, moeten dit vooral niet kennen; er is veel kennis en analysekracht nodig om dit goed te kunnen interpreteren.
CONCLUSIE: Het combineren van geo-informatie middels kaarten en GIS-viewers heeft een grote meerwaarde in zich. Het voorbeeld van de risicokaart van Schiedam, naar analogie op de Risicokaart van Nederland, maakt duidelijk dat bij het opzetten van (geo-) portalen en GIS-viewers, zeer zorgvuldig om moet worden gegaan wat op welk niveau zichtbaar is voor wie. Een GIS ontwerpen gaat dus verder dan geo-visualisatie, cartografie en kaartopmaak!

Referenties

  1. P. Hendriks en H. Ottens; Geografische Informatie Systemen in ruimtelijk onderzoek , Van Gorcum Assen 1997, pag 15.
  2. Zie H13.5, blz 189-195 Cartography, Visualisation of Spatial Data, M.J. Kraak en F.J. Ormeling, 2003, 2e editie, Pearson Education. Zie ook www.cartographybook.com.
  3. P. Hendriks en H. Ottens; Geografische Informatie Systemen in ruimtelijk onderzoek , Van Gorcum Assen 1997, fig 2.1, pag 21.
  4. Erosiegevoeligheidskartering met behulp van Geografische Informatie Systemen; B. van der Grift en T.C. Nijeholt, 1996
  5. Erosiegevoeligheidskartering met behulp van Geografische Infromatie Systemen; B. van der Grift en T.C. Nijeholt, 1996
  6. 'Bodemerosie en Wateroverlast in Zuid-Limburg' (Helm, P.P.M. van der, A.P.J. de Roo en R. Huigen (1989); komt overeen met Hoofdstuk 4 uit Syllabus KIHO, Faculteit der Ruimtelijke Wetenschapen, Universiteit Utrecht, Erpers Roijaards, T.van en M. Zeylmans van Emmichoven, 1996)

Literatuur

Zie voor literatuur: het laatste deel van dit handboek.


Ga verder met de module 'Inleiding Cartografie'.

Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.