Deze module gaat over de belangrijkste aspecten die spelen bij het visualiseren van data, oftewel het omzetten van data in een informatieve kaart. Het geeft regels en voorbeelden van hoe met name thematische informatie goed tot een leesbare en waardevolle kaart kan worden omgezet. Na deze module kent de lezer de criteria waarop een kaart beoordeeld kan worden en is hij bekend met de twee kerntaken van een thematische kaart. Hij kan systematisch kaarten van opbouwende kritiek voorzien en kent (het belang van) begrippen als normalisatie en (juiste) aggregatieniveau's. Hij weet wanneer hij verschijnselen of juist objecten moet karteren.
In geo-visualisatie - simpel gezegd het maken van een kaart met een GIS - zitten twee cartografische aspecten verborgen:
'richting de data'; de kaart dient de data verantwoord te ontsluiten.
'richting de gebruiker'; de kaart dient leesbaar te zijn.
In Deel B wordt geo-visualisatie in de 'enge' betekenis van het woord gebruikt. Er wordt in dit deel beschreven hoe, uitgaande van de data en het doel, die data gevisualiseerd dient te worden. Pas in Deel C, Kaartopmaak, wordt gekeken wat hier verder nog aan kaartlagen bij moet, hoe labels geplaatst moeten worden en hoe alle kaartonderdelen opgebouwd dienen te zijn. Deel C is meer gericht op het eindproduct, door meer aandacht te schenken aan de doelgroep en de verdere details. Voordat we met de kaartopmaak aan de slag kunnen, dienen we eerst te zien hoe we de geo-informatie kunnen kneden tot een van uit de data verantwoord startpunt. In deze visie betekent dat vaak dat we met een thematische kaart (een verschijnsel, de spreiding van criminaliteit, de temperatuur of de bevolking) aan de slag gaan. Vandaar dat Deel B start met thematische kaarten. Een enkele keer zal de kaart een meer topografisch karakter hebben. In die gevallen zal misschien direct met Deel C gestart kunnen worden, als we tenminste de juiste geo-informatie verzameld hebben.
There is no truth. There is only perception
There is no truth. There is only perception. is een veel gebruikt gezegde in de Amerikaanse politiek (en quote van Gustave Flaubert). Als een president of een senator iets goed aanpakt, maar het algemene beeld is anders, dan zijn de gevolgen niet te overzien. Dure publiciteitscampagnes ten spijt, hij of zij moet door het stof. Excuses aanbieden. Van dat imago kom je niet zo maar af. Dat geldt ook voor de cartografie. Dat data kan nog zo goed ingewonnen, geselecteerd of berekend zijn, als de visualisatie niet aansluit bij de belevingswereld van de doelgroep, is het leed geschied. De kaart wordt terzijde gelegd of - erger - er worden verkeerde conclusies getrokken. De met paars ingekleurde industrieterreinen worden door de kaartlezer als rustige heidegebieden gezien. Het fietsbord-symbool dat halverwege naast de fietsroute staat, wordt gezien als een fietsknooppunt, rustpunt of fietsenstalling. Terwijl dat puntsymbool versterkend bedoeld was om de route (een lijnsymbool) als fietsroute te classificeren. De fietstocht mislukt faliekant en de of deelnemers zullen nooit meer jouw kaart raadplegen. Of nooit meer iets afnemen van de organisatie achter die kaart. Voor goede cartografie is nodig kennis van het desbetreffende thema, kennis van GIS én van visualiseren. Met inhoudelijke kennis, gis-kennis, of ontwerpkennis alléén ben je er niet. Het is een samenspel. Cartografie is dus niet sec een niche uit de ontwerpwereld. Dat komt omdat het eigen, specifieke ontwerpregels toevoegt. Dit hele Deel B, maar ook het testen in Deel C gaat hier over. Wat cartografen en ontwerpers wél gemeen hebben is het communicatieve aspect. There is no truth. There is only perception onderstreept nog eens dat het niet naleven van ontwerpregels of cartografische regels funest kan zijn.
Geo-informatie geschikt maken voor visualisatie
Geo-informatie kan de ene keer 'slechts' als achtergrond dienen - denk aan alle landsgrenzen. De andere keer zal die geo-informatie - denk aan vlakken van alle landen - zelf allerlei kleuren moeten krijgen, afhankelijk van een thematische grootheid, zoals bevolkingsdichtheid. In beide gevallen kan het zijn dat de data (de omtrek, zoals de landsgrenzen) gegeneraliseerd moet worden. Dat is het geval als de kwaliteit van de kaart een grote rol speelt en / of als de geo-informatie te gedetailleerd is. De grenzen kennen dan te veel (visueel onnodige) tussenpunten (vertices).
In deel A (de GIS-theorie) zagen we eerder wat generaliseren is. Met een GIS kunnen we te gedetailleerde lijnen (zowel van lijnen als de omtrek van vlakken) generaliseren. De reden is vaak om een rustiger kaartbeeld te krijgen, vooral bij een thematische kaart is dit van belang. Zo leiden de vele inhammen en eilanden in Canada en Noorwegen (zie voorbeeld) na generalisatie niet meer af van waar het om gaat: de kleuren van de vlakken.
Bij kaart 1 is de beschikbare geo-informatie getoond. Duidelijk is dat de omtrek in Canada wel erg stoort; het groene landoppervlak is niet goed meer te zien. Wanneer deze gebieden in kleur (bij thematische kaarten) getoond moeten worden, leiden deze omtrekken niet alleen de aandacht af van de kleuren, hele delen van vlakken zullen zelfs geen kleur krijgen.
Bij kaart 2 is een cartografische oplossing geprobeerd: de lijn grijzer en dunner maken. Het lijkt visueel al iets beter, maar het probleem blijft; de landoppervlakten zijn nog steeds niet optimaal in beeld.
Bij kaart 3 is de omtrek zelfs helemaal uitgezet. Nadeel is dat de groene (land-) kleur dan niet mooi contrasteert met de witte achtergrond. Daarom is de zee maar grijs gemaakt. De landoppervlakten zijn nu redelijk te zien. Echter, de grenzen van de landen met de zee zijn verdwenen. Vaak zal het juist de bedoeling zijn om onderlinge landsgrenzen en landgrenzen met de zee dik en zwart in beeld te brengen, voor een duidelijk contrast.
Kaart 4 toont de enige juiste oplossing: generalisatie, in dit geval: versimpeling van de data; minder tussenpunten (vertices). In deze vorm van generalisatie, versimpeling of vereenvoudiging, zijn in dit geval minder punten gebruikt om dezelfde vlakken (of lijnen) te tekenen. Een GIS kan dit snel, eenvoudig en geautomatiseerd doen. In de praktijk zullen echter enkele pogingen nodig zijn om deze generalisatie optimaal uit te voeren. De gegeneraliseerde kaart 4 is een rustigere kaart dan kaart 3 en kan nu gebruikt worden voor een thematische kaart. NB: zou er een kaart van Indonesië gemaakt worden, dan is het originele bestand beter (uitvergroot in kaart 3b). De gegeneraliseerde versie toont Indonesië - eenmaal ingezoomd - vervormd.
SAMENVATTING: Generalisatie kan een oplossing bieden voor de visualisatie van te gedetailleerde kaartmateriaal. Generalisatie is nodig bij relatief teveel detail in de omtrek van vlakken of (gedetailleerde) lijnen.
TIP: GIS-pakketten kennen bij het verwijderen van tussenpunten (vertices) twee soorten generalisaties (dus twee soorten 'GIS-tools' om deze actie uit te voeren: 1) Generalisatie waarbij overbodige tussenpunten - tussenpunten die géén knikpunt zijn - worden verwijderd. Dit gebeurt dan uit topologische, performance of beheersmatige redenen. 2) Generalisatie waarbij het beeld wijzigt. Dit mag dan cartografisch gewenst zijn, de datakwaliteit gaat vanuit analytisch oogpunt gezien achteruit. Bewaar daarom in het tweede geval altijd het origineel! In deze paragraaf ging het voornamelijk om de tweede soort generalisatie.
In de volgende paragraaf worden meer soorten generalisaties besproken.
Generaliseren
Generaliseren is het zinvol vereenvoudigen van de kaartinhoud. Ormeling en Kraak [1] voegen aan deze definitie iets toe: generaliseren is het zinvol vereenvoudigen van de kaartinhoud bij schaalverkleining. Vaak zal dat laatste inderdaad het geval zijn, maar dat hoeft niet per se. Bij het gelijk blijven van de schaal kan de kaartinhoud voor sommige doelen ook beter vereenvoudigd worden. We kunnen dan dezelfde generalisatietechnieken gebruiken om de kaart te versimpelen of te verbeteren.
Generalisatie is in deel A (bij 'Eigenschappen van geo-informatie') al beperkt aan de orde geweest. Toen werd generalisatie echter geïntroduceerd om op de hoogte te zijn van eventueel nadelige eigenschappen van geo-informatie. Het lijkt er ook soms meer op dat het alleen voor cartografen is bedoeld die streven naar perfecte topografische kaarten. We kunnen generalisatie echter ook zelf heel goed gebruiken wanneer we kaarten gaan maken voor een specifiek doel. Denk aan routebeschrijvingskaarten, het uitleggen waar een nieuw wijkgebouw zal worden gepland, een kaart met omrijroute, of de locatie van een bepaald fenomeen waar ook een beperkt aantal wegen op moeten komen. Generalisatie kost vaak veel tijd en moeite. Maar soms is ook met een kleine ingreep aan de ligging van een punt, lijn of vlak, de kaart een stuk beter leesbaar en bruikbaar. Bijvoorbeeld door de locatie van een stad te veranderen. Zo komt de loop van een aangrenzende rivier beter uit. Of het staafdiagram bij die stad overlapt niet meer met de staafdiagram van een ander.
Essentieel uitgangspunt bij elke vorm van generaliseren is dat de wijziging aan de geo-informatie / kaartinhoud plaatsvindt, omdat de objecten (punten, lijnen en vlakken) op het eindresultaat - de kaart - nog duidelijk zichtbaar moeten zijn én iets toevoegen aan het doel van de kaart. Dat betekent zelfs dat we zonder problemen van één soort geo-informatie - bijvoorbeeld een wegen bestand - slechts één object - bijvoorbeeld één weg - kunnen laten zien. Bijvoorbeeld op een kaart van het aantal wildbewegingen in de buurt van een snelweg. Het is best mogelijk om dan alléén die snelweg, en niet de overige wegen er in op te nemen. Zeker als het doel is om te kijken waar dat wildviaduct over die snelweg moet worden aangelegd.
Denk dus niet dat generaliseren per definitie een zonde is. Integendeel. Generaliseren maakt (te) gedetailleerde kaarten geschikt voor kleinschaligere toepassingen. En denk ook niet dat generaliseren alleen iets is voor topografische (en referentie) kaarten. Juist voor thematische kaarten is het handig wanneer er niet te veel details op een kaart staan. Op een kaart om de weg te kunnen vinden naar dat ene afgelegen restaurant mogen niet alle details in beeld komen; de kaartlezer moet 's avonds bij het minieme lampje boven de bijrijderstoel niet vermoeid worden met irrelevante aftakkende voetpaden en gesloten winkels in de zijstraten!
Generalisatie is per definitie iets subjectiefs. Want hoe ver ga je met het vereenvoudigen of zelfs weglaten van wat in een onderliggende kaart als werkelijkheid is gekarteerd?
Sowieso hangt dat van de schaal af: hoe kleiner de schaal hoe sterker de generalisatie zal zijn.
Maar ook het doel en de doelgroep van de kaart bepalen of al die eilandjes nu wel of juist niet moeten worden weergegeven.
Er zijn twee soorten generalisaties: grafische generalisatie en conceptuele generalisatie. Hoewel beide als doel hebben de leesbaarheid te vergroten, grijpen ze op een verschillende manier in op de te generaliseren geo-informatie.
Grafische generalisatie poogt punten, lijnen en of vlakken zodanig te versimpelen of te wijzigen, dat het kaartbeeld overzichtelijker, sneller leesbaar wordt, zonder dat de betekenis echt wijzigt. De locaties van de punten, lijnen en vlakken wijzigen om grafische redenen. Zo komen lijnen plotseling niet zo dicht op elkaar te liggen en zijn er minder bochten in een rivier.
Conceptuele generalisatie heeft een vergelijkbare actie nodig en heeft een vergelijkbaar resultaat, echter, versimpelt en wijzigt de locatie niet om grafische redenen, maar om inhoudelijke redenen. De geo-informatie bevat bijvoorbeeld op attribuutniveau te veel detail. Op een kaart voor een gemiddelde toerist maakt het misschien niet uit of er onderscheid in loof- en naaldbos wordt gemaakt. Deze klassen kunnen dus worden samengevoegd. De grafische locatie wijzigt dus niet altijd bij conceptuele generalisatie.
Grafische én conceptuele generalisatie grijpen beide in op de visuele gedetailleerdheid van objecten op een kaart. Conceptuele generalisatie grijpt daarbij ook nog eens in op de soort informatie die wel of niet ontsloten worden. Bij conceptuele generalisatie worden de objecten plotseling heel anders (of niet) gesymboliseerd, terwijl bij grafische generalisatie 'slechts' de locatie anders (of niet) wordt getoond.
Wanneer er sprake is geweest van generalisatie, is de output niet altijd meer geschikt voor (nauwkeurige) geografische analyses. De cartografische locatie van een punt is na generalisatie immers niet meer (met zekerheid) gelijk aan de geografische locatie van dat punt. Misschien zijn er zelfs punten en hele objecten verdwenen. Het is duidelijk dat dit generaliseren gebeurt voor een bepaald einddoel. Voor het ene doel zal een bestand verder of anders gegeneraliseerd moeten worden dan voor het andere doel.
TIP1: Bewaar altijd het originele bestand voordat je gaat generaliseren, omdat je het misschien nog nodig hebt voor bepaalde ruimtelijke analyses of kaarten waarbij je niet of anders moet generaliseren. Er zijn ook GIS-pakketten - zoals ArcGIS vanaf versie 9.2 - die de cartografische locatie van punten, lijnen en vlakken apart opslaan van de geografische locatie. Daarmee kan je blijven rekenen met de juiste positie van de lijnen, terwijl 'dat ene voetpad langs die ene sloot' toch ruim er naast en dus goed zichtbaar wordt gevisualiseerd.
De verschillende soorten generalisatie worden hieronder besproken. In de figuur hier rechtsboven worden deze met voorbeelden duidelijk gemaakt.
Grafische generalisatie:
vereenvoudiging: details en tussenpunten worden weggelaten, omdat ze - op de grotere schaal - anders niet meer goed zichtbaar zouden zijn of het werkelijke beeld te veel vertroebelen (zie ook de kustlijn in de vorige paragraaf).
vergroting: details worden groter weergegeven dan ze zijn, omdat ze anders niet goed opvallen.
samenvoeging: objecten worden samengevoegd omdat ze als losse objecten anders niet meer goed leesbaar zouden zijn.
verplaatsing: is nodig bij vergroting van andere (belangrijkere) objecten, omdat ze visueel anders over of onder deze objecten komen te liggen.
selectie: objecten die klein zijn en minder relevant worden weggelaten, omdat ze anders niet goed of slecht zichtbaar zijn.
vloeiend maken: lijn- of vlakobjecten worden vloeiend gemaakt (vereffend) of geheel anders getoond, omdat de punten die bekend en zichtbaar zijn, naar verwachting niet nauwkeurig genoeg zijn. Een gemeentegrens of snelweg kan terecht erg recht zijn. Maar een meanderende rivier of een slingerende bergweg moet misschien bochtig (smooth) gemaakt worden. Dit is misschien een bijzonder soort generalisatie, omdat schijnbaar meer nauwkeurigheid wordt toegevoegd. De kaart wordt wel leesbaarder, omdat nu die bochtige weg en die meanderende rivier wél worden herkend. Uiteraard is er bij deze vorm van generaliseren wel enige kennis van zaken nodig. Die ene bergweg slingert misschien alleen maar op bepaalde plekken. En is die 'meanderende' rivier die je symbolisch overal mooie bochten wilt meegeven, op die ene plek niet gewoon een vlechtende, 'anastomoserende' of rechte rivier? Lastig als een wandelaar die kaart gaat gebruiken en bij de derde bocht van de rivier wilt afslaan...
Conceptuele generalisatie:
symbolisatie: gehele punten, lijnen of vlakken worden anders weergegeven door deze te aggregeren (samen te voegen).
samenvoeging: bij (gedetailleerde) thematische kaarten die gebruikt worden op een grotere schaal, zullen bepaalde klassen moeten worden samengevoegd. Dat kan zonder dat de waarheid geweld wordt aan gedaan door deze klassen anders (en met verstand van die thematische kaart én het doel van de te maken kaart) te classificeren.
overdrijving (en het tegenovergestelde:) verwaarlozing: objecten worden groter, langer of breder voorgesteld dan dat ze zijn. Hiermee vallen gebouwen die er toe doen (zoals postkantoor op een standplattegrond) beter op. Verwaarlozing is het tegenovergestelde; gebouwen of straten worden kleiner voorgesteld dan ze zijn.
selectie: zie bij grafische generalisatie. In dit geval wordt geselecteerd niet op grootte of ligging, maar op de belangrijkheid van de data en het einddoel van de kaart.
Bovenstaande generalisaties kunnen - op die van vereenvoudiging na - niet of nauwelijks geautomatiseerd plaatsvinden. Generaliseren zal daarom vaak handmatig moeten worden uitgevoerd. Dat komt omdat generaliseren een subjectief en op een bepaald doel geënt proces is.
SAMENVATTING: Generaliseren is het zinvol vereenvoudigen van de kaartinhoud. Hierbij gaat het om punten en (vertices van) lijnen en vlakken. Er zijn twee soorten generalisatie, grafische en conceptuele. Beide soorten versimpelen het kaartbeeld, met als doel een beter of sneller leesbare kaart, maar conceptuele generalisatie kan verder gaan, omdat hierbij bepaalde klasses niet meer zichtbaar zijn. Beide soorten generalisatie zijn subjectief en afhankelijk van de uiteindelijke kaartschaal en het doel van de kaart. Voor zowel thematische als topografische kaarten is generalisatie vaak nodig. Hoe algemener het doel van de kaart en hoe kleiner de schaal (dus hoe groter het schaalgetal, bij kleinschalige kaarten), hoe sterker de generalisatie zal moeten zijn.
TIP2: Bij het evalueren van je kaart kom je misschien bepaalde opmerkingen tegen die - bij nadere bestudering - voorkomen hadden kunnen worden door generalisatie.
TIP3: Bewaar altijd het origineel, als je een geo-informatie-bestand gaat generaliseren. Documenteer de verschillende gegeneraliseerde versies op doel. Gebruik gegeneraliseerde versies niet zonder meer voor geografische analyses. Gebruik hiervoor het originele bestand.
TIP4: Sommige GIS-pakketten kunnen (gevisualiseerde objecten van de) geo-informatie omzetten (kopiëren) naar grafische elementen. Je kan dan binnen je GIS deze grafische elementen vervolgens wijzigen. Er is dan geen enkel probleem wanneer je handmatig - voor die ene specifieke kaartproductie - sommige elementen gaat generaliseren; de oorspronkelijke geo-informatie blijft in zijn oorspronkelijke staat. Ook kan je er voor kiezen om het generaliseren geheel op te pakken in een grafisch pakket als Adobe Illustrator. (Zie eventueel ook Formaattypes en voor voorbeelden van 'Kaartopmaak-software': Overige sites.)
Joinen (of: hoe zet ik willekeurige informatie met één actie op een kaart)
Deze paragraaf gaat over joinen (Nederlands: koppelen), wellicht de belangrijkste functionaliteit van een GIS, zeker wanneer we gegevens in kaart willen brengen. Joinen is in veel gevallen het startpunt van een GIS-specialist bij het uitvoeren van een analyse of het maken van een kaart; met joinen wordt in feite de nieuwe data ingeladen of geschikt gemaakt voor geografische verwerking.
Met joinen wordt bij GIS-software meestal bedoeld het koppelen van informatie aan geo-informatie. Anders gezegd: bij joinen voorzie je een locatiecomponent. Dus gegevens zonder locatiecomponent - gegevens die nog geen x- en y- coördinaten hebben - krijgen zo een locatie; ze worden gekoppeld aan een punt-, lijn- of vlakobject in de kaart. Zo kan je bijna elke gegevensset in kaart brengen, hoe je ook aan die gegevens komt:
per plaats: gemiddelde huizenprijzen, aantal scholen, aantal coffeeshops, aantal inwoners
per gemeente: aantal inwoners, bevolkingsdichtheid, et cetera.
Om wat voor gegevens het gaat doet er feitelijk niet toe, als er maar een verwijzing naar een ruimtelijk object in zit, zoals plaatsnaam, gemeentenaam, provincienaam, landsnaam, enzovoort.
In onderstaand voorbeeld (zie figuur) gaan we ervan uit dat we een tabel hebben gevonden, ergens op internet (in dit geval: www.cbs.nl), met daarin het aantal inwoners dat géén EU-nationaliteit heeft.
Stel we willen deze gegevens in kaart brengen. Bijvoorbeeld omdat we inzicht willen krijgen in hoe het aantal mensen zonder EU-nationaliteit verspreid is in Overijssel. We besluiten om ons te concentreren op alleen de grote steden. In de nieuwe gegevenstabel wordt het aantal mensen zonder EU-nationaliteit per plaatsnaam beschreven (en niet bijvoorbeeld per gemeente, COROP-gebied, provincie). Daarom gaan we op zoek naar een GIS-bestand dat de locatie van diezelfde plaatsnamen beschrijft. In de figuur zien we in de bovenste helft de uitgangssituatie. We hebben enerzijds (links in beeld) een GIS-bestand dat van de plaatsnaam de locatie beschrijft en anderzijds (rechts in beeld) een bestand dat van de plaatsnaam het aantal mensen zonder EU-nationaliteit beschrijft. De overeenkomstige kolom is Plaatsnaam. Zo'n overeenkomstige kolom noemen we overigens een sleutelveld of unique key. Door deze twee kolommen aan elkaar te koppelen (of: te 'versleutelen') ontstaat een nieuwe tabel (zie onderste helft van de figuur). De join kan nu worden uitgevoerd door het GIS.
Na de join hebben we een situatie waarin we van elke locatie niet meer alleen de plaatsnaam hebben, maar óók het aantal mensen zonder EU-nationaliteit. En dat hadden gelijktijdig overigens veel meer of andere gegevens kunnen zijn, in veel meer kolommen. Het leuke is nu dat we op deze wijze gegevens van welke bron dan ook, zelfs als die niet 'GIS-waardig' zijn, toch in kaart kunnen brengen. En er is dus een locatie toegevoegd aan de oorspronkelijke tabel. De informatie is als het ware 'geo-informatie geworden'. Aangezien volgens menig GIS-boek en pleitbezorger van GIS 90% van alle informatie altijd wel een locatiecomponent heeft, is 90% van alle informatie met een join in kaart te brengen! Joinen is dus een zéér belangrijke en zeer veel gebruikte tool.
Bij het joinen zijn ook een aantal beperkingen of waarschuwingen te noemen.
Records die in de nieuwe gegevenstabel wél voorkomen, maar niet in het GIS-bestand, zullen uiteraard niet te zien zijn in de kaart. In het voorbeeld is dat het geval bij 'Haaksbergen'. Zo'n record is dan ook niet terug te vinden in de uiteindelijke gejoinde tabel (rechtsonder).
Records die in het GIS-bestand wél voorkomen, maar niet in de nieuwe gegevenstabel, zullen ook niet in beeld komen. Soms kan dit de bedoeling zijn, bijvoorbeeld - in dit geval - omdat er in die plaats nu eenmaal geen mensen zonder EU-nationaliteit voorkomen. Bij 'Nijverdal' had je bijvoorbeeld verwacht - dat er vast wel mensen zijn zonder EU-nationaliteit. Dit had óf in de tabel moeten staan, maar misschien is dit aantal ook nul. Zo'n record is wél terug te vinden in de uiteindelijke gejoinde tabel (rechtsonder), maar er is géén aantal (ook geen nul!) aan gekoppeld. Wellicht moet dit als nul gelezen worden, en moet jij dit als GIS-specialist aanvullen. Enige kennis van de nieuwe (te koppelen) gegevensset is dus noodzakelijk.
Records met verkeerd of verschillend gespelde namen in de sleutelvelden zullen niet gekoppeld worden. Records die zo buiten de boot vallen moeten handmatig hersteld worden. Afspraken over normeringen van deze (plaats)namen zijn dan ook niet voor niets belangrijk!
Records met dubbele namen kunnen ook onverwacht tot lastige situaties (fouten) leiden. Zoals de plaatsen Hengelo (O) (in Overijssel) en Hengelo (G) (in Gelderland). Of de gemeente Bergen (NH) (in Noord-Holland) en de gemeente Bergen (L) (in Limburg). Zonder de toevoeging die tussen haakjes staat zouden hier ernstige, lastig te ontdekken fouten in kunnen staan. Het is dan ook niet onlogisch dat dergelijke steden en gemeenten vaak met een betekenisloze 'id' worden gekoppeld. Zo hebben gemeenten vaak een TDN-code als ID.
Enkele records opgeslagen als / beschreven door meerdere vlakken. Denk aan de provincie Friesland, dat is één object, beschreven door 4 vlakken: het vaste land van Friesland, Vlieland, Terschelling, Ameland en Schiermonnikoog. In dergelijke gevallen zullen de hieraan gekoppelde waarden aan alle vlakken gekoppeld worden. Dus het gemiddelde criminaliteitscijfer dat voor Friesland geldt, wordt óók getoond op de eilanden. Veelal - bij kwantitatieve gegevens - zal dit ook de bedoeling zijn.
Join alleen als het kan, dus als beide sleutelvelden in beide tabellen ook echt daadwerkelijk dezelfde kwaliteit hebben en bij elkaar horen. Een lijst met gegevens over gemeentes uit 2003 koppelen aan een geo-informatie-bestand uit 2005 zal problemen opleveren: Enkele gemeentes komen niet in beeld, omdat die tussen 2003 en 2005 in gefuseerd zijn! Koppel ook geen plaatsnamenbestand aan een gemeentebestand.
Als GIS-specialist dienen we bovenstaande bij elke join in de gaten te houden, en te kijken of we dit erg vinden, of er in één van beide bestanden geen tekortkomingen of beperkingen hebben gezeten. Misschien hebben we een fout gemaakt bij het koppelen, of de bestanden zijn van een verschillend jaartal. Soms is een handmatige (herstel) actie genoeg.
SAMENVATTING: Joinen, of op zijn Nederlands: koppelen, is een belangrijke functionaliteit voor elke GIS-specialist. Door de join wordt een locatiecomponent toegevoegd aan een gegevensset. Hiermee kan vrijwel elke denkbare gegevensset van welke soort of bron dan ook, in kaart worden gebracht. Als GIS-specialist dient wel de kwaliteit van deze join in de gaten te worden gehouden. De input van een join is een GIS-bestand en een hieraan te koppelen gegevensset zonder locatie. Het koppelen gebeurt op basis van één overeenkomstig, identiek veld, het zogeheten sleutelveld.
Door het joinen beschikken we nu over nieuwe gegevens. Die kunnen kwantitatief (getalsmatig) zijn of kwalitatief (beschrijvend, of administratief, zoals regio's en vervuilingszones).
Het kiezen van de visualisatiemogelijkheden bij kwantitatieve gegevens
Nu de gegevens ingelezen zijn in het GIS-programma - al dan niet met de join van de paragraaf hierboven - kunnen we aan de slag met visualiseren. In deel C komen kaartindeling, titel, leesbaarheid van de tekens, kleuren en opleverformaat aan de orde. Maar laten we die opmaak even vergeten. Want voordat het zo ver is, moeten we eerst bedenken hoe we de ingelezen gegevens in kaart brengen.
Deze paragraaf laat de belangrijkste mogelijkheden zien bij kwantitatieve gegevens. En dan ook nog alleen van puntgegevens. Kwantitatieve gegevens zijn gegevens met een getalsmatige component. Met puntgegevens wordt bedoeld gegevens die betrekking hebben op één locatie, niet (direct) op een (exact begrensd) gebied.
Laten we eerst eens wat simpele voorbeelden bekijken en bespreken. Daardoor zien we wat er allemaal kan, maar ook wat niet goed is en wat beter is. Het is telkens op basis van dezelfde gegevens uit de vorige paragraaf.
NB1: Onderstaande kaartjes zijn gebaseerd op steeds dezelfde gegevens. De getoonde kaartenreeks lijkt op zomaar wat spielerei, maar in werkelijkheid gaat het kaarten maken net zo! De dataset wordt zo goed verkend en er ontstaat zo een breed beeld van het fenomeen. Soms kom je zo tot de conclusie dat een andere optie dan je opdrachtgever of jijzelf in je hoofd had, veel beter is. Of dat er twee kaartjes naast elkaar gemaakt moeten worden.
NB2: Er is bewust voor een mogelijk politiek gevoelig thema gekozen; hierdoor zie je sneller wat je fout of goed doet bij het visualiseren. Een 'foute' kaart zal snel genoeg opvallen...
Wat: aantal inwoners zonder EU-nationaliteit
Wat: aantal inwoners zonder EU-nationaliteit
Hoe: aangegeven met alléén blauwe labels. Het puntje is de ligging van de plaats
Hoe: aangegeven met zwarte labels en zwarte staafdiagrammen
Goed: De labels zijn extra opvallend gekleurd, om te laten zien dat dát het thema is, de plaatsnamen hebben een neutralere kleur.
Goed: De aantallen worden nu (proportioneel) gevisualiseerd; het thema, dus waar het om gaat - de aantallen inwoners met nationaliteit ongelijk aan die van EU - is zo beter zichtbaar. Een top 3 is snel af te leiden uit deze kaart, evenals gebieden waar het fenomeen juist weinig voorkomt. Dit in tegenstelling tot de linker kaart.
Slecht: Er is géén visualisatie van de aantallen, waardoor geen overzicht is van waar het verschijnsel veel / weinig voorkomt. In andere woorden: de tekst '1459' op de kaart is net zo groot en daardoor net zo opvallend als de tekst '5741'. Het is daardoor slechts een kaart waarop je getallen kan lezen. Er is niet snel een top 3 uit af te leiden, of de gebieden waar het fenomeen veel of juist weinig voorkomt.
Slecht: Slecht is dat bij dit mogelijk gevoelig onderwerp een zwarte (!) kleur is gekozen. Volstrekt incorrect en onnodig. Zwart wordt met gevaar geassocieerd, bovendien hebben deze mensen bij elkaar allerlei huidskleuren. De zwarte staven komen eerder als een probleem naar voren; ze lijken stemming te nemen / maken. Een minpuntje is misschien verder dat de onderkant van de staafdiagrammen niet op de plaats van de stad zelf begint. Ook is (visueel gezien) een staaf van 5000 niet exact tweemaal zo lang als 2500, en een staaf van 2500 is niet tienmaal zo lang als een staaf van 250. Wanneer hier (bij deze ver uiteenlopende dataset) voor gekozen moet worden, moet dat in de legenda duidelijker voren komen.
Overall: Deze kaart is niet fout, maar de kaart zegt gewoon niet veel; het is een 'leeskaart' waarbij je slechts aantallen kan aflezen. Het biedt als kaart op deze wijze nauwelijks een meerwaarde boven een tabel.
Overall: Een politiek gevoelig thema mag zo niet gekarteerd worden, dus ook cartografisch gezien is deze kaart ronduit slecht, al zou je dit wellicht niet direct zijn opgevallen.
OK, toegegeven, dat waren niet zulke geweldige kaartjes. Laten we daarom eens naar de volgende twee, redelijk vergelijkbare kaartjes kijken:
Wat: aantal inwoners zonder EU-nationaliteit
Wat: aantal inwoners zonder EU-nationaliteit
Hoe: aangegeven met proportionele cirkels (een figuratieve kaart) en blauwe labels
Hoe: aangegeven met proportionele staafdiagrammen (een figuratieve kaart) en blauwe labels
Goed: De neutrale kleur blauw. De cirkels geven een goede spreiding van waar meer en waar minder hoge aantallen voorkomen. Omdat de individuele cirkels niet zo goed zijn af te lezen is er een label aan toegevoegd.
Goed: De neutrale kleur blauw. Omdat de individuele staven niet zo goed zijn af te lezen is er een label aan toegevoegd. Balken (één dimensionaal) zijn beter qua onderlinge verhoudingen (grootte) in te schatten dan cirkels. Het is een simpele en daardoor rustige kaart.
Slecht: De cirkels lijken wel erg groot; "gaat dat wel goed, zó veel mensen in Enschedé?' zou iemand misschien kunnen zeggen die niet weet hoe groot die stad werkelijk is. Opnieuw lijkt er een probleem ("véél", schreeuwt de kaart) te worden gesuggereerd. Minpuntje: De verhouding van de cirkels onderling klopt overigens net niet helemaal 100% met de werkelijke aantallen. *)
Slecht: Misschien is nog matig te noemen het feit dat de lengte van de staafdiagrammen slechts 'ongeveer' proportioneel is. Kijk je goed naar de verhoudingen, dan zie je dat de kleine aantallen relatief met te lange staven wordt gevisualiseerd. Dat mag wel, maar dan moet dat duidelijker in de legenda naar voren komen, door meerdere hoeveelheden / klassen in de legenda op te nemen.
Overall: Deze kaart is matig, niet slecht, maar het beeldvullende karakter doet vermoeden dat er een overvol gebied met hoge aantallen in Twente is. De visuele grootte van de symbolen stemt niet overeen met de relatief kleine aantallen. Voor een normale, neutrale kaart is dat niet reëel en ongetwijfeld niet de bedoeling.
Overall: Deze kaart is iets beter, omdat de staven wat feitelijke (minder beeldvullend) ogen. Maar nog steeds; we weten niet wat nu veel of weinig is. Hoeveel is 5000 inwoners?
*) Ten opzichte van het voorbeeld rechts geldt voor het linker voorbeeld dat de cirkels (twee dimensionale figuren - het betreft immers oppervlakten) qua onderlinge verhoudingen (grootte) slechter zijn in te schatten dan staafdiagrammen; grote cirkels worden qua grootte onderschat, omdat het oog de straal ziet en niet de oppervlakte. Het voordeel van cirkels boven staafdiagrammen is echter weer dat op met cirkels een sterk uiteenlopende dataset (dat is hier ook het geval!) toch leesbaar gevisualiseerd kunnen worden. Overigens, bollen gebruiken om aantallen of volumes weer te geven (zoals m3 LPG in de Rotterdamse haven) is helemaal gevaarlijk. Onderlinge verhoudingen in groottes van 3D-figuren kan het oog (immers in 2D, plat op het scherm of papier weergegeven!) helemaal slecht inschatten. Grote bollen worden véél te klein ingeschat. Gebruik je cirkels als proportionele symbolen, maak deze dan 1,4 keer zo groot als dat je op grond van het oppervlakte zou verwachten. Deze overdrijvingsfactor is nodig omdat je oog de grootte van de cirkels op die wijze visueel toch goed inschat. Dit heet het Flannery-effect.
De visualisatie lijkt met bovenstaande twee voorbeelden al iets beter te worden. Maar het wordt nu tijd dat we echt gaan meedenken met de kaartlezer. Want wat doet zo'n kaartlezer met die symbolen waarvan de grootte door de getallen wordt bepaald? De kaartlezer zoekt automatisch de punten op waar veel en weinig symbolen voorkomen, én hij kijkt waar de kleinste (en vooral:) grootste symbolen staan. De dataset is in dit geval erg lastig om te visualiseren, want we hebben hier - en dat is vaak het geval! - te maken met een heel brede dataset; een aantal heel kleine getallen, en een aantal héél grote getallen. In de voorgaande twee gevallen zagen we dan ook dat de aantallen niet proportioneel, maar 'ongeveer' proportioneel worden weergegeven. Oftewel, de grootte van de symbolen (cirkels en staafdiagrammen) zijn niet recht evenredig met de aantallen. Kleine aantallen worden relatief te groot weergegeven, en grote aantallen relatief te klein. Dit kan bewust gedaan zijn. Het is dan wel zaak om dit in een legenda wat beter weer te geven dan hierboven. Bijvoorbeeld door de vijf verschillende klassen (5 soorten grootte van cirkels) in de legenda te zetten met de juiste klassengrenzen erbij (zie eventueel legenda's bij figuratieve kaarten).
Omdat het zo'n lastige dataset is met uiteenlopende waarden, is het goed om eens te kijken of we relatieve aantallen kunnen gebruiken. In dit geval komt dat neer op het visualiseren van niet de aantallen inwoners, maar op het percentage inwoners in een plaats zonder EU-nationaliteit. Dat levert natuurlijk wel een ander soort plaatje op, met misschien andere (reëlere of verrassendere?) conclusies over de spreiding van het fenomeen.
Goed: De neutrale kleur blauw; de toegevoegde labels.
Goed: De toegevoegde labels.
Slecht: Het is zo niet gebruikelijk percentages weer te geven met cirkels; bij oppervlakten (zoals gemeenten) zou dit wel kunnen, maar we beschikken (hier, helaas) niet over gemeentegegevens, maar over plaatsgegevens. Niet doen, zo! Zouden we wel over gebieden beschikken, dan hadden we een choropleet kunnen maken, waarin we de kleuren van de verschillende vlakken (=gemeentes) dus afhankelijk laten zijn van de relatieve aantallen; hoe donkerder blauw, hoe hoger het percentage.
Slecht: Zelfde als hiernaast. Daar komt bij dat dit wel een inktzwart kaartje is. Dit lijkt wel op de bekende stippenkaart (elke 10 joden in Amsterdam was één zwarte (!) stip), die de Duitse bezetter in de Tweede Wereldoorlog liet maken door Nederlandse ambtenaren om 'het probleem' (was dat er dan?) te vangen in een visueel beeld; waar veel zwart wordt gevisualiseerd, zal wel een probleem zijn? Nee; dit is onnodige stemmingmakerij. Zou het om criminaliteit gaan, dan was zwart misschien óók subjectief, maar daarvan zal de gemiddelde kaartlezer een hoog getal wél willen associëren met iets vervelends (zwart!). Dus in dat geval zou zwart misschien wél gemogen hebben. Overigens, het is niet logisch waarom de labels blauw zijn gemaakt? Waar horen die blauwe labels bij? Gewoon bij die zwarte cirkels? Maak dan ook die labels zwart.
Overall: Een slechte kaart.
Overall: Een zeer slechte kaart; politiek incorrect en cartografisch goed mis.
Overigens, merk op dat alle tot nu toe getoonde kaarten feitelijk gezien de juiste data bevatten; in die zin kan géén enkel kaartje (wiskundig gezien) fout genoemd worden. Dat de kaart toch fout of slecht genoemd wordt, slaat dan ook op het cartografische / visuele aspect; is wat visueel getoond wordt wel in overeenstemming met het beeld dat de kaartlezer krijgt wanneer hij de werkelijkheid buiten ziet, en / of wanneer hij zou beschikken over alle exacte cijfers? Later in de paragraaf Goede geo-visualisatie gaan we hier verder op in.
Maar we zijn dus nog steeds niets verder, want we hebben nog steeds geen enkele goede kaart weten te proberen. Laten we het nog eens anders proberen dan:
Wat: aantal inwoners zonder EU-nationaliteit
Wat: percentage inwoners zonder EU-nationaliteit
Hoe: aangegeven met punten waarvan de kleur gradueel blauwer wordt, afhankelijk van het aantal (inclusief labels)
Hoe: aangegeven met taartpunten (happen) uit cirkels van gelijke grootte (niet proportionele cirkels) inclusief labels
Goed: De neutrale kleur blauw.
Goed: Het percentage wordt inzichtelijk gemaakt op basis van een taartdiagram; de kleuren zijn goed; blauw (opvallende, harde, primaire kleur) op een geelbruine achtergrond (valt minder op, is een lichte (meng)kleur).
Slecht: Aantallen moeten met de grootte van een symbool worden aangeduid, niet (alleen) met een kleur, zoals hier het geval is. De labels zijn weg, terwijl die zo hard nodig zijn bij deze uiteenlopende getallen (zie ook Symbologie).
Slecht: Het idee is goed, echter, we hebben pech; de aantallen zijn zo klein dat de onderlinge percentages niet te vergelijken zijn. We zijn nu dus iets te eerlijk bezig. Nog een groot bezwaar: de cirkels per plaats zijn even groot. Daardoor wordt de kaartlezer niet bepaald geholpen met het feit dat het bij 5% in een kleine stad om minder inwoners gaat dan bij een grote stad. Zelfs een oplettende lezer kan dit visuele beeld - dat zijn mentale voorstelling van de werkelijkheid bepaalt - niet met zijn ratio corrigeren; op zijn netvlies blijft staan dat 5% voor een kleine plaats evenveel is als 5% voor een grote plaats.
Overall: Een slechte kaart; zo mag je nooit aantallen weergeven!
Overall: Een goede poging, echter hij valt toevallig slecht uit door de lage percentages in de gegeven dataset en levert een onjuist beeld bij de kaartlezer. Slecht afleesbaar.
Het blijkt dus een lastige dataset te zijn. Maar we hebben nu aanwijzingen genoeg om het beter te doen. Kijk eens naar de volgende twee figuren.
Wat: percentage én aantal inwoners zonder EU-nationaliteit in vergelijking met het aantal inwoners per plaats
Wat: percentage én aantal inwoners zonder EU-nationaliteit in vergelijking met het aantal inwoners per plaats
Hoe: aangegeven met taartpunten (het percentage) van een cirkel die proportioneel is ten opzichte van het aantal inwoners per plaats, inclusief labels
Hoe: aangegeven met een gedeelte (het percentage) van een vierkant die proportioneel is ten opzichte van het aantal inwoners per plaats
Goed: De neutrale kleur blauw. De harde kleur blauw valt ook mooi op ten opzichte van het roze. Maar belangrijker: De hoeveelheid blauw is visueel juist, omdat deze bepaald wordt door de grootte van de stad/cirkel, en door het percentage. Percentages zijn als getal vaak wat lastiger te interpreteren, maar door ze als taartpunten te laten oplichten in proportionele cirkels, is de betekenis véél duidelijker dan alleen een getalsmatig percentage, zoals 2,3%. De kaart heeft zo echt een meerwaarde ten opzichte van een tabel met allerlei percentages en aantallen. De percentages en aantallen worden (letterlijk en figuurlijk) hier namelijk in de juiste proporties geplaatst. De hoeveelheid blauw is ook goed opvallend. Omdat de lezer van links naar rechts leest is ook Hengelo (als percentage en label) naar rechts geplaatst, met een zogeheten aanhaallijn. Zie eventueel Plaatsing van labels.
Goed: Hier geldt vrijwel exact hetzelfde voor als bij de 'cirkel-'versie, links, echter, hier is de hoeveelheid blauw misschien wat te klein weergegeven; die had best groter (meer overdreven) weergegeven mogen worden, zodat de hoeveelheid blauw tussen de steden onderling beter vergelijkbaar zou zijn geweest
Slecht: Bijna alles is goed. Misschien hadden er nog (donkerroze) labels van de aantallen inwoners per plaats in moeten staan? Of (blauwe) labels van de aantallen inwoners zonder EU-nationaliteit? Alhoewel, zou de kaart meer plaatsen kennen, dan was dit wel weer een te drukke kaart geworden.
Slecht: De hoeveelheid blauw (het blauwe vierkantje) is te klein, ten opzichte van de grootte van de roze vlakken - én ten opzichte van elkaar niet goed relateerbaar - en had daarom licht overdreven weergegeven mogen worden; er staat toch een label bij met de exacte aantallen. De legenda tekst 'aantal inwoners' kan misschien beter zijn: 'totaal aantal inwoners per plaats', om mogelijke misstanden te voorkomen. En misschien had het blauwe label direct naast het blauwe vierkantje moeten staan, in plaats van buiten het roze vierkant; op die wijze was duidelijker geweest dat het blauwe vierkant het blauwe getal en dus het aantal inwoners zonder EU-nationaliteit visualiseert. Waarschijnlijk is de verhouding tussen de blauwe en roze vierkanten niet juist. De blauwe lijkt systematisch te klein weergegeven ten opzichte van de roze.
Overall: Een goede kaart.
Overall: Een redelijke kaart.
Zou dit linksboven dan de best mogelijke kaart zijn? Laten we het nog eens met staafdiagrammen proberen, en - met hetgeen we inmiddels geleerd hebben - nu eens géén percentages afbeelden:
Wat: aantallen inwoners inwoners zonder EU-nationaliteit tezamen met het totaal aantal inwoners per plaats
Wat: aantallen inwoners inwoners zonder EU-nationaliteit tezamen met het totaal aantal inwoners per plaats
Hoe: met een (dubbele) staafdiagram, inclusief labels
Hoe: met een onderverdeelde staafdiagram, inclusief labels
Goed: Het is eenvoudige voorstelling van zaken; er zijn getallen gevisualiseerd - en exact afleesbaar - en relateerbaar ten opzichte van het totaal aantal inwoners. Er is afgestapt van percentages (een 'relatief getal' is soms wat lastig grijpbaarder dan aantallen). De aantallen worden toch al relatief gemaakt omdat het aantal inwoners per plaats genoemd wordt. Er is ook gebruik gemaakt van (slim gekleurde) labels.
Goed: Zie links. Echter, nu is duidelijk dat de 'blauwe hoeveelheden' (inwoners zonder EU-nationliteit) gewoon deel uitmaken van de 'roze hoeveelheden' (totaal aantal inwoners) Kortom; er wordt méér uitgelegd, en daarmee wordt de figuur helderder en eenvoudiger te lezen voor de kaartlezer.
Slecht: De relatie tussen de linker blauwe en de rechter staaf is onduidelijk. Er moet daardoor onnodig veel gelezen worden. Het lijkt er zo op dat de 'niet-EU-inwoners' géén deel uitmaken van de overige inwoners, terwijl dat bij de aantallen wel het geval is. En nog een klein detail: getallen boven de 9999 (dus vanaf 10.000) zijn beter leesbaar indien deze van een punt (duizendtallenscheidingsteken) worden voorzien. Het tonen van staafdiagrammen NAAST elkaar is alleen juist indien de cijfers géén deel van elkaar uitmaken, maar aanvullend een object beschrijven. Bijvoorbeeld, het aantal tonnen steenkool, gas en olie dat Europa binnenkomt weergegeven met steeds drie staafdiagrammen per havenstad. Meer informatie over diagrammen (op kaarten) zie de literatuur: "Diagram en Kaart, als geografische hulpmiddelen" van C.I. Wieland, 1980. Dit lijkt verouderd, maar is nog steeds zeer verhelderend en leesbaar!
Slecht: Er is niet zoveel op aan te merken. Of het moet zijn het experiment van de kaartmaker om de labels nu bij de top van de staafdiagrammen te zetten. Waarschijnlijk is dat een verbetering, als is de afstand tot de blauwe tekst soms wat groot; hierdoor is de vergelijking met niet de aantallen inwoners zonder EU-nationaliteit minder goed te maken. Een test zou kunnen uitwijzen wat mooier en leesbaarder zou zijn geweest. Misschien is het géén verbetering. Daarnaast hadden de blauwe teksten, net als de roze, misschien beter rechts van de staafbalken geplaatst kunnen worden.
Overall: Een redelijke kaart, maar wat onduidelijk qua onderlinge betekenis van de blauwe en roze staafbalken.
Overall: Een goede kaart, waarschijnlijk het maximaal haalbare wanneer aantallen gevisualiseerd moeten worden.
Conclusie: er is veel mogelijk, maar afhankelijk van de dataset is niet alles zomaar goed toepasbaar. Sommige mogelijkheden leiden tot onleesbare kaarten, of kaarten die een verkeerd mentaal (spreidings)beeld achterlaten bij de kaartlezer. Er zijn toch meerdere goede kaarten te maken. Hieronder staan drie totaal verschillende kaarten - ook al is de uitgangsdataset steeds hetzelfde geweest. Ze zijn alle drie goed. Ze laten wél een verschillend beeld zien. De doelstelling (en ook doelgroep van de kaart) bepaalt de uiteindelijke keuze tussen deze drie. En de doelgroep (en het medium, de tijd die lezers hebben, het kennisniveau, de ervaring met het lezen van kaarten) bepaalt in hoeverre bepaalde verbeteringen nog mogelijk zijn aan de opmaak, de legenda en de labels en begeleidende tekst... Deze laatste aspecten komen overigens aan de orde in Deel C, over kaartopmaak, en het evalueren zelf in Het evalueren van kaarten.
De TOP3:
Wat: percentage én aantal inwoners zonder EU-nationaliteit in vergelijking met het aantal inwoners per plaats
Wat: aantallen inwoners zonder EU-nationaliteit in vergelijking met het aantal inwoners per plaats
Wat: aantal inwoners zonder EU-nationaliteit
Oordeel: Een goede kaart. Is misschien een wat volle kaart, bij meer steden zou het misschien minder overzichtelijk zijn, verschaft veel informatie, zeker als er nog een label bij zou moeten komen (totaal aantal inwoners per plaats). Een kleine waarschuwing: Maak de cirkels niet te groot (vermijd een te volle kaart) en niet te klein (onleesbare taartdiagrammen). Bij méér plaatsen, let er op dat de taartdiagrammen niet elkaar overlappen, verschuif eventueel de taartdiagrammen iets. Maak liefst één taartpunt per taart (zoals hier), en niet meerdere taartpunten (zoals percentage EU-ingezetenen buiten Nederland én het percentage ingezetenen zonder EU-nationaliteit... Spreid anders de informatie over twee kaarten.
Oordeel: Een goede kaart. Is misschien een wat volle kaart, bij meer steden zou het misschien minder overzichtelijk zijn, verschaft veel informatie. Een kleine waarschuwing: pas op voor overlap van staafdiagrammen.
Oordeel: Een goede kaart. Bevat weinig informatie, maar is daardoor zeer helder in wat bekeken moet worden: het aantal inwoners zonder EU-nationaliteit per plaats.
Doelstelling: Het tonen van de procentuele spreiding wanneer een discussie mogelijk gemaakt moet worden, wanneer het probleem van meerdere kanten bekeken moet worden, wellicht door een doelgroep die de tijd én interesse heeft om het plaatje eens goed te bekijken. Wanneer het om een goed beeld gaat van de werkelijke verhoudingen.
Doelstelling: Wanneer het vooral om exacte aantallen gaat. Zie linker doelstelling.
Doelstelling Het tonen van de spreiding van de aantallen en wanneer het daarbij om een simpele, snel leesbare kaart gaat. Er kunnen weinig extra vragen aan deze kaart gesteld worden. Ook worden er weinig extra vragen mee opgewekt. Is niet geschikt voor een totaalbeeld, wel voor het beantwoorden van één vraag: waar bevinden zich hoeveel inwoners zonder EU-nationaliteit. Wellicht is een soortgelijke, tweede kaart nuttig, waarin het aantal inwoners per plaats wordt gevisualiseerd. Uitleg in een begeleidende tekst ("je leest hier niet of de aantallen per plaats relatief veel of weinig is") is wellicht noodzakelijk.
De drie kaarten hierboven lijken tot nu toe de best mogelijke kaarten. Misschien is op visueel gebied (kleuren en labels) nog één en ander te verbeteren. Met méér gegevens per kaart zouden deze anders wel eens te ingewikkeld kunnen worden.
Of iets wel of niet te ingewikkeld is, bepaalt de doelgroep. Voor een haastige Spits! of DAG-lezer is zoiets op de maandagochtend te veel, de laatste kaart zou daar wellicht geschikt voor zijn.
Merk op dat de GIS-specialist in een aantal kaarten bewust de 'positie' van de plaatsen verschoven heeft. (Vergelijk maar eens de positie van de drie meest oostelijk gelegen steden van kaart tot kaart.) Op deze wijze komt de symbologie (dus het onderwerp) beter tot zijn recht. Dat de plaatsen 'verkeerd' liggen is niet erg, zolang de onderlinge ligging maar niet tot onduidelijkheden leidt bij de kaartlezer. De plaatsnamen zorgen er gelukkig voor dat er ook geen misverstand kan ontstaan.
TIP: Het oog van een kaartlezer gaat vaak al snel naar de gebieden waar veel (grote) symbolen voorkomen. Wil je ook nadruk leggen op plekken waar geen of weinig (maar juist kleine) symbolen vóórkomen, zorg dan dat die lege plekken ook echt leeg zijn. Dat kan door geen extra grenzen, wegen en labels op die plek neer te zetten. In bovenstaand voorbeeld had bijvoorbeeld nog de achtergrond (Overijssel) nog lichter gemaakt kunnen worden.
SAMENVATTING: Kwantitatieve (getalsmatige) gegevens kunnen met (alleen) labels, staafdiagrammen, taartpunten en proportionele symbolen (zoals cirkels en vierkanten) gevisualiseerd worden. Wanneer proportionele symbolen worden gekozen, is er het gevaar dat kleine aantallen niet goed meer zichtbaar zijn. Labels bij de symbolen en of het bewust verkleinen van de onderlinge groottes van de symbolen is dan een must. Kleine symbolen worden dan groter en grote symbolen worden dan relatief kleiner weergegeven. Een goede legenda (en eventueel het toevoegen van labels als het niet om te veel labels gaat) is dan wel een must.
Welke van de genoemde visualisatiemogelijkheden wordt gekozen is afhankelijk van:
de dataset (het onderwerp)
de spreiding binnen de dataset
het aantal te visualiseren getallen
de onderlinge ligging van de onderlinge plaatsen en
de doelstelling van de kaart.
Omdat de visualisatiemogelijkheden binnen een GIS ruimschoots aanwezig zijn, omdat de opdrachtgever van de kaart ook niet altijd de doelstelling van de kaart helder heeft én omdat verschillende visualisatietechnieken nu eenmaal tot verschillende en soms verrassende conclusies leiden, is het aanbevelenswaardig om bij elke kaart 'te spelen' met de verschillende visualisatiemogelijkheden. Er kan eenvoudig geswitcht worden ('met één druk op de knop') van de ene naar de andere mogelijkheid. Ook al is uit het bovenstaande duidelijk geworden dat niet elke mogelijkheid voor elke dataset gebruikt mag worden.
Goede geo-visualisatie
Jacques Bertin wordt door vele cartografen nu nog steeds gezien als dé persoon die systematisch en wetenschappelijk de (on)mogelijkheden van visualisatie binnen de cartografie heeft beschreven. Hij noemt [3] onder andere de volgende algemeen gangbare en inmiddels geaccepteerde normen voor wat een goede kaart is:
De twee kerntaken van een kaart
Een kaart dient twee vragen te kunnen beantwoorden:
vraag
voorbeeld
1) welk kenmerk speelt er op die plek?
wat is de bevolkingsdichtheid in de staat Utah?
2) hoe is de geografische spreiding van dat kenmerk?
waar liggen de staten met de laagste bevolkingsdichtheden?
Door het analyseren van deze vragen is af te leiden:
hoe de visuele rangorde moet worden bepaald;
wat het maximale aantal klassen mag zijn;
of in dat specifieke geval het wel zo goed is om 'polythematische' kaarten (kaarten die meerdere thema's in één keer beschrijven);
hoe de legenda, titel en kaart samen een eenheid moeten zijn, opdat een goede, snel te lezen kaart voorhanden is.
Dit laatste punt wordt beschreven in Deel C, bij kaartopmaak. De eerste twee punten worden in de paragrafen hieronder nader toegelicht.
Overigens, door de snelheid waarop de gebruiker dergelijke vragen kan beantwoorden, is af te leiden hoe goed de GIS-specialist zijn werk heeft gedaan.
'Lees-kaarten' en 'kaarten om te zien'
Een kaartlezer moet volgens Bertin beide vragen kunnen (leren) stellen aan een kaart. Gaan beide vragen hem snel af, dan is het een goede kaart. De cartograaf dient - rekening houdend met zijn doelgroep - namens hem diezelfde vragen stellen om tot een goede kaart te komen.
Soms gaat alleen vraag 1) goed af, zie figuur 1. In dat geval is de kaart een 'leeskaart' in de bewoordingen van Bertin. Bij elke plek kan gelezen worden hoeveel inwoners er zijn of wanneer in die provincie de eerste school is opgericht. Deze kaarten zijn hooguit goed genoeg voor iemand die (alléén) op die ene plek moet zijn. Deze kaarten geven alléén een meerwaarde boven teksten of tabellen, indien iemand een route weet, de topografie goed kent, en snel slechts één of enkele waarden wil weten.
Maar enig overzicht is er niet bij dergelijke kaarten. De lezer merkt dat wanneer hij iets over de spreiding van het fenomeen wil leren, dat hij:
veel tijd kwijt is, óf - erger - hij
een verkeerde inschatting van het fenomeen krijgt.
Is de lezer veel tijd kwijt (bv: kaart 1) dan is waarschijnlijk de rangorde van het fenomeen (bijvoorbeeld bevolkingsdichtheid) vertaald naar een visuele niet-rangorde van de legenda-eenheden (zomaar wat kleuren of grijswaarden zonder rangorde).
De lezer krijgt een verkeerde inschatting wanneer de rangorde van het fenomeen ongelijk is aan de visuele rangorde (kaart 2 en 3). De grijswaarden (van de kleuren) lopen niet gelijk op met de waarden van de klassenmiddens. De lezer onthoudt een verkeerde spreiding. Hij is mentaal niet in staat om dit beeld te corrigeren.
Via hedendaagse GIS-software is momenteel 'alles mogelijk'. Gelukkig begeleiden wizards en keuzeopties de GIS-ser vaak naar de juiste oplossing: hoe hoger de waarden, hoe hoger de grijswaarde (van de kleur). Echter, de GIS-ser kan dit teniet doen. Of door onkundig gebruik van de applicatie of te weinig cartografische kennis toch tot andere uitkomsten komen. Er worden dan verkeerde (beleids-) beslissingen genomen. Het kan zijn dat in dergelijke gevallen door de maker of opdrachtgever van de kaart desondanks gesteld wordt dat de legenda juist is en de kaart dus goed. Bijvoorbeeld met het argument dat de kaartlezer van de kaart uiteindelijk toch echt de juiste waarden uit de kaart kan halen door die legenda. Getalsmatig heeft hij gelijk. Echter de kaart is slechts 'leesbaar'. Omdat de spreiding niet juist zichtbaar is, 'ziet' niemand de echte spreiding. De visuele spreiding is ongelijk aan de spreiding van het fenomeen/kenmerk. Zo'n kaart blijft dus wetenschappelijk (cartografisch) gezien fout.
Gaat ook vraag 2) goed, dat spreekt Bertin van een kaart 'om te zien'. De kaart geeft dan de spreiding van het fenomeen goed weer. De vertaling van de rangorde van het fenomeen naar de visuele rangorde is goed gegaan. Deze kaarten zijn nodig voor elke onderzoeker, elke beslisser. Conclusies trekken zal nu wél gaan, én snel. Kaarten 4 en 5 zijn hier juiste voorbeelden van.
Er zijn over deze twee voorbeelden nog maar weinig opmerkingen te maken. Wellicht zou het onderscheid tussen de 3e en 4e klasse groter moeten zijn. Alaska ontbreekt... Een juiste titel en een noordpijl zou kunnen worden toegevoegd.
Het maximum aantal te gebruiken klassen
Het aantal visuele klassen dient bij het weergeven van kwantitatieve verschillen gelijk of kleiner te zijn dan het ingewonnen aantal klassen. Aan de kant van de lezer zit er ook een beperking. Hieronder wordt het maximum aantal door de oog-brein-combinatie te onderscheiden klassen weer gegeven, afhankelijk van of het verschijnsel door punten (bijvoorbeeld soorten steden), lijnen (bijvoorbeeld soorten transportstromen) of door vlakken (bijvoorbeeld soorten grondgebruik) wordt beschreven[4]:
Bovenstaande getallen zijn maxima, en richtlijnen. Dat wil zeggen dat bij polythematische kaarten, per thema, deze aantallen minimaal gehalveerd dienen te worden.
Grein is niet meer gebruikelijk. Sommige auteurs gebruiken net iets andere aantallen bij dergelijke overzichten, meestal nemen ze de getallen van Wieland over, of noemen voor grein dat er 2 tot 4 verschillende klassen mee te definiëren zijn. Gezien de eenvoud waarmee tegenwoordig aantrekkelijke kaarten in kleur kunnen worden gemaakt, en de visuele eigenschappen van de oog-brein combinatie, die bij kleuren duidelijk beter onderscheid in klassen kan maken, verdient het sterk de voorkeur om altijd te kiezen voor onderscheid in kleuren, ook wanneer het benodigde aantal klassen lager is.
Vorm wordt afgeraden: een kruis voor een middenklasse camping, en een vierkantje voor een 5-sterren-camping bijvoorbeeld levert immers geen enkele positieve bijdrage aan het antwoord op 'vraag 2 van Bertin'. De grootte of kleur (van een kruis) wel. Variatie in vorm kan juist wel gebruikt worden voor het weergeven van verschillende soorten (of: kwalitatieve verschillen).
Zie ook het hoofdstuk Symbologie waarin grafische variabelen worden behandeld.
De functie van kleur bij thematische kaarten
Kleur kan op twee manieren worden ingezet om klassen aan te duiden:
via de kleurtint (golflengte). Bijvoorbeeld: van rood naar oranje naar geel geeft een afnemende drukte van wegintensiteit.
via de grijswaarde. Bijvoorbeeld: van donkerrood naar lichtrood en zelfs naar wit geeft een afnemende bevolkingsdichtheid. (Overigens, verzadiging is iets anders. Verzadiging is de mate van verontreiniging van een kleur met grijs dat dezelfde grijswaarde heeft als die kleur. De verzadiging geeft de relatieve zuiverheid aan. Zie ook Het HSV-systeem.)
In het tweede geval, wanneer gevarieerd wordt in de grijswaarde van één kleur, kiest de cartograaf normaliter voor een logisch, bij het kenmerk behorende kleur. Voor waterdiepte of ijsdikte zou dat blauw kunnen zijn, voor bevolkingsdichtheid rood. Wanneer het eindresultaat van die kleurenkaart in zwart-wit zou worden omgezet, zal visueel (in het brein van de lezer) géén enkel verschil worden opgemerkt met de kleurenkaart. De verspreiding / clustering van het kenmerk over de kaart is even goed te zien. Het brein zag dus niet de (variatie in) kleur, maar de (variatie in) grijswaarde! De kleur wordt 'slechts' gebruikt om de kaart aantrekkelijker te maken. Bij een thematische kaart waarin de diepte van de zee (hoe dieper hoe donkerder blauw) wordt weergegeven is door het logische gebruik van de kleur blauw niet nodig dat de kaartlezer steeds maar weer naar de legenda moet kijken.
De noodzaak van het normaliseren, juiste objectkeuze en aggregatieniveau's
Deze paragraaf geeft regels bij geo-visualisatie voor:
(de noodzaak van) normaliseren
de keuze van de juiste objecten die het kenmerk moeten gaan visualiseren en
het juiste aggregatieniveau, gedetailleerd (per object) of samengesteld (per gebied).
Bij het visualiseren is het van belang het juiste object te visualiseren. Bovendien mag het kenmerk niet 'overdreven' worden, doordat het object dat het kenmerk visualiseert, feitelijk níet over het kenmerk gaat. Hoewel zo datatechnisch de juiste kaarten gemaakt kunnen worden, geven deze kaarten totaal verkeerde beelden. Onbewust of (erger) bewust, kunnen zo schadelijke kaarten gemaakt worden.
De voorbeelden hieronder tonen dat aan. Daarnaast zal blijken dat het maken van een kaart een iteratief proces is. Wanneer het eindresultaat eindelijk goed lijkt te zijn, komt de onderzoeker met de juiste antwoorden en nieuwe vragen. Er zal wellicht wéér een andere kaart gemaakt moeten worden. De analist/beleidsmaker is op die manier kaartenmaker/cartograaf geworden... Voor onderzoeksdoeleinden volstaat één kaart niet. Maar er kunnen bij dit proces veel fouten gemaakt worden indien er niet lang over de kaarten en de problematiek wordt nagedacht.
Stel, een beleidsmaker wil onderzoeken welke staten of welke snelwegen extra aandacht behoeven bij de bestrijding van het hoge aantal doden in de VS op de snelwegen / 'interstates'. In 2004 waren dat 42.636 doden, dus gemiddeld 0,88 doden per jaar per mijl snelweg, Alaska niet meegerekend (bron: usgovinfo.about.com/od/medicalnews/a/traffictoll.htm). (NB: de spreiding van het aantal doden over staten en snelwegen lijkt reëel, maar is in dit voorbeeld gebaseerd op fictieve aannames. Daarom deze gegevens niet gebruiken voor eigen onderzoek/VS-illustraties, e.d. Zie commentaar bij de afbeeldingen. Het enige dat klopt zijn de hierboven genoemde aantallen.)
De beleidsmaker maakt achtereenvolgens de volgende kaarten met zijn GIS, steeds op basis van dezelfde gegevens:
Kaart 6. Geeft het aantal doden per staat. Het lijkt een correcte 'kaart om te zien'. In de terminologie van Bertin is de visuele spreiding van de kleur (van geel naar rood) namelijk in overeenstemming met de spreiding van het kenmerk (van weinig aantal doden per staat naar meer doden per staat.
Gaan we bedenken - wellicht dankzij deze kaart - waarom Texas zoveel meer doden heeft dan South Dakota, dan schrikken we. Want hoeveel mensen wonen er in deze twee staten, en hoeveel snelwegen zijn er verhoudingsgewijs? Een staat als gebied zegt misschien wel iets over het aantal slachtoffers, maar niet over de oorzaak ervan. Een kleine staat met weinig of misschien zelfs géén snelwegen zal weinig/géén doden kennen, maar dat zegt niets over dat de snelwegen er veilig zijn. De oorzaak is het aantal snelwegen; hoe zijn die verspreid over de staten van de VS? De staat is dus het verkeerde object om 'snelwegdoden' mee te visualiseren.
Kaart 7. Exact dezelfde kaart als kaart 6, maar nu met het aantal snelwegen. Het lijkt nu logisch dat Texas veel doden kent: er zijn meer snelwegen dan in South Dakota. Bovendien is het een grote staat met veel inwoners. Zouden spreiding van de inwoners dan ook maar in beeld moeten komen? Nee. dat vertroebelt het overzicht verder. De kaart zou dan nog meer een rekensom worden. Bovendien hadden de staten niet ingekleurd mogen worden: hoe groter een (donkerrode) staat, hoe sterker het oog dit ervaart, terwijl de klasse (het aantal doden per staat) niet wijzigt.
Gaan we bedenken hoe het dan wél moet, dan moeten we letterlijk gaan kijken naar het aantal doden per snelweg. Dáár vallen de doden. Het kenmerk moet op die 'verantwoordelijke' (lijn-) objecten - en niet op de (vlak-) objecten - gevisualiseerd worden. Het moet dus dan dus ook bekend zijn op welke snelweg die doden per staat vallen.
Kaart 8. Ditmaal wordt het juiste object gebruikt; de snelweg zelf. Maar er is toch iets goed mis met deze kaart. Rijden automobilisten harder en roekelozer op de lange wegen? Zijn de automobilisten in het drukke oosten beter in autorijden, of zijn daar veiliger snelwegen? In alle steden en drukke knooppunten lijkt alles ook veel veiliger...
Kijken we naar lange snelwegen; hierop vallen inderdaad meer doden dan korte snelwegen. Lange snelwegen zijn - volgens de legenda - inderdaad ook roder. Het aantal doden op lange snelwegen is hoger omdat ze langer zijn... De kans dat er iets gebeurt is groter bij lange snelwegen. De snelweg had niet een kleur mogen krijgen van het totaal aantal doden. Algemener geformuleerd: het gehele (lijn)object had niet mogen visualiseren wat er op het gehele object in totaal gebeurt. NB: bij kwalitatieve data, zoals snelwegtype, had dit wel gemogen. Conclusie is in dit geval: er moet een andere kaart komen.
Kaart 9. Hierop wordt voor elke snelweg apart het aantal doden vermeld. Dit is eerlijker. Er is sprake van een kartogram. Met staafdiagrammen (opnieuw geldt: niet per staat, maar gelukkig per snelweg) wordt aangegeven waar de meeste doden vallen. Omdat die staafdiagrammen visueel niet worden uitgesmeerd over een hele lijn is dit een verbetering: staten met weinig snelwegen zijn 'witter / leger'. Plekken waar veel korte snelwegen zijn, laten veel lage staafdiagrammen zien. Plekken waar weinig maar lange snelwegen zijn, laten minder, maar hoge staafdiagrammen zien. Dit is eerlijk.
Toch is de beleidsmaker niet tevreden. Het is onoverzichtelijk, wanneer zoveel diagrammen in zo'n kartogram te voorschijn komen. Normaliseren is de oplossing.
Kaart 10. Hierop wordt voor elke snelweg het aantal doden per kilometer vermeld. Dit heet normaliseren. Bij lijnen moet het kenmerk dat gevisualiseerd moet worden, gedeeld worden door de lengte. Bij vlakken moet het kenmerk dat gevisualiseerd dient te worden, gedeeld te worden door de oppervlakte van dat vlak. Déze kaart is cartografisch goed en ondersteunt de analyse van de data op de juiste wijze.
Voor het eerst verschijnt een nuttige kaart. De andere kaarten waren 'slechts' nuttig om er achter te komen welke kaart dan wel gemaakt had moeten worden. Déze laatste kaart geeft eerlijk de getallen weer. De drukke knooppunten in de steden zijn dus wel degelijk gevaarlijk. Het visuele beeld dat nu ontstaat in cartografisch correct, grafisch aantrekkelijk en snel te lezen. Nog een detail. Wil de lezer bij een snelweg kunnen afleiden hoeveel doden er vallen, dan moet het aantal doden zoals dat in de legenda staat (per mijl) vermenigvuldigd worden met het aantal mijlen. Vandaar dat nu een schaalbalk een must is. Op deze wijze is het volgens Bertin niet alleen 'een kaart om te zien', maar ook een leeskaart.
Nawoord. De volgende verbeteringen hadden ook overwogen kunnen worden.
Bij kaart 6: Het aantal doden per staat normaliseren per kilometer snelweg in die staat. Er blijft dan echter een probleem. Grote staten, die een donkerrode kleur laten zien, vallen meer op dan kleine staten met diezelfde donkerrode kleur. Het is dus nog steeds het fout toepassen van een choropleet. Er had een voor een figuratieve kaart gekozen moeten worden. Deze kaart toont dan echter een minder gedetailleerd beeld dan kaart 10. In algemene bewoordingen: doordat een hoog aggregatieniveau (staten) is gekozen, worden verschillen die in de data voorkomen opgeteld, en gaat detailinformatie verloren. Er dient gedetailleerder, per object (in dit geval: snelweg) te worden gevisualiseerd. Een snelweg die een administratieve grens overgaat wordt niet plotseling veiliger. (Tenzij die staat andere snelwegen bouwt. Zou dat een conclusie of te testen vermoeden zijn, dan moet in de kaart onderscheid in snelwegtype worden aangegeven.)
Naar aanleiding van de kaart bij 10 zal de onderzoeker zich afvragen waarom bepaalde snelwegen zo veel doden opleveren. Er dient waarschijnlijk onderscheid gemaakt te worden tussen het soort snelwegen - wel of niet gescheiden weghelften - en de drukte.
Kaarten 6, 7 en 9 en 10 zijn alle choropleten.
'Helaas' zal een oplettende lezer merken dat kaart 10, 'de enige juiste kaart' laat zien dat op elke snelweg, in elke staat, per lengte-eenheid, evenveel doden vallen. Dit is in werkelijkheid niet het geval. Zou deze kaart op basis van gedetailleerde gegevens gemaakt zijn, dan was voor elke snelweg, ook per staat, meer variatie te zien. Voor dit voorbeeld doet dat niets af.
Het verschil tussen objecten en verschijnselen
Bij het karteren kunnen gegevens van objecten in beeld gebracht worden. Denk aan locaties van restaurants, gemeten temperaturen bij alle bekende weerstations in Nederland. Dit is al gauw een kaart die Bertin (zie ) een 'kaart om te lezen' zal noemen; kaarten die slechts een serie gegevens weergegeven / opsommen.
Bij het karteren kunnen diezelfde gegevens ook als een verschijnsel in beeld gebracht worden. Denk aan de restaurantdichtheid per gemeente, of het temperatuurspreiding op een bepaalde dag.
In het geval van de locaties van restaurants is het maken van een spreidingskaart misschien veel beter; de lezer van de kaart ziet waar hij het beste naar toe kan voor de meeste keus. Objecten en niet de restaurantdichtheid moet dan worden weergegeven. Restaurantdichtheid - zeker per gemeente - is niet zo interessant. Interessanter is de spreiding van die objecten.
In het geval van de gemeten neerslag (al of niet gemiddeld) gaat het waarschijnlijk niet om de objecten/locaties. Het gaat om het verschijnsel neerslag. Waar die ene hoge neerslagwaarde toevallig gemeten is, is niet zo interessant, of het moet verantwoorden hoe de kaart tot stand is gekomen, en met hoeveel meetstations. Maar belangrijker is dan dat het verschijnsel neerslag in beeld komt, en wel voor héél het gebied. Er moeten nu dus géén objecten worden gekarteerd middels een spreidingskaart, maar een choropleet. Het verschijnsel neerslag vindt immers overal plaats, het varieert slechts in locatie. Ook waar niet gemeten wordt, vindt neerslag plaats. Het is een zogeheten continu verschijnsel (Engels: 'continues data'). Laat - bijvoorbeeld door interpolatietechnieken die een GIS biedt - die variatie dus zien; karteer de neerslag als verschijnsel.
Hiernaast staan vier figuren die bovenstaande verder verduidelijken. Het gaat om twee thema's; boven de neerslag en onder caravanbranden. In het geval van de neerslag is al duidelijk; die dient als choropleet in beeld te worden gebracht. De grenzen zijn hier middels isolijnen weergegeven, door interpolatietechnieken tot stand gebracht. De onderste twee figuren tonen de spreiding van brandstichtingen van caravans, per woonplaats. (De linker kaart is opnieuw de uitgangssituatie. Deze data is gesimuleerd, en komt - niet geheel toevallig - overeen met één-tiende van de neerslag. Dit doet echter niets af aan de discussie.)
Je zou nu zeggen dat voor de kaart met brandstichtingen exact hetzelfde geldt als bij de neerslag: maak een choropleet en die kaart zal dan wel beter zijn dan die stippenkaart / spreidingenkaart. Niets is minder waar!
Bij de caravanbranden geldt: de linkerkaart is een goede, maar misschien lastig te lezen kaart. Er had een figuratieve kaart van gemaakt moeten worden. Daar staan dan ook weer rode bolletjes of staafdiagrammen op, maar de grootte is afhankelijk van het aantal branden. De tweede kaart is echter ronduit fout! Deze kaart had nooit gemaakt mogen worden! Het verschijnsel is het aantal branden op een bepaalde locatie. Dat verschijnsel is niet continu, maar de objecten hebben een locatie. Het is een zogeheten discontinue verschijnsel (Engels: discrete data). Die objecten hadden dus gekarteerd moeten worden. Dus als een figuratieve kaart, of middels een choropleet, waarbij het aantal branden per provincie (per 10.000 caravans, of per 100.000 mensen) wordt weergegeven. Zo'n kaart zou misschien nog iets toevoegen ook! Het is dan wel een andere kaart geworden, die een ander doel zal hebben.
Nu is er echter een isolijnen kaart van gemaakt (rechts in beeld) met dezelfde interpolatietechnieken als bij de neerslagkaart. Dit suggereert dat er tussenliggende dorpen zijn waar eenzelfde hoeveelheid branden is geweest... Dat kan nooit de bedoeling zijn geweest van de kaartenmaker en het is al helemaal niet waar. De waarde die je afleest op een (goede) choropleet op een bepaalde plek, geldt ook op die plek!
Blijkbaar is het vaak mogelijk om uit de acht beschikbare thematische kaartsoorten enkele kaarten te genereren die mooi ogen; het is echter niet altijd ook de juiste keuze.
SAMENVATTING: Karteer het verschijnsel, of het individuele object. Is het een continu verschijnsel - een verschijnsel dat overal in meer of mindere mate voorkomt - dat is dit als een choropleet of iso-lijnenkaart weer te geven. Geef aantallen ongelukken op snelwegen weer op snelwegen. Geef meetwaarden die gelden op bepaalde locaties niet als staafdiagrammen weer, of als figuratieve symbolen, als het om een continu verschijnsel gaat.
Individuele objecten of geaggregeerde objecten
Bekijk de eerste van de drie onderstaande figuren eens. Het toont de spreiding van alle (locaties van) moskeeën. Het is een zogenaamde stippenkaart. De kaart is niet fout, maar wellicht onoverzichtelijk. Het aantal moskeeën in Amsterdam is niet makkelijk af te lezen. En zou het aantal objecten nóg iets groter zijn, dan zou het niet meer duidelijk zijn bij welke plaats welke moskee hoort. Moskeeën zouden op de kaart over elkaar geplaatst moeten worden, of er zou voor een simpeler symbool (een rondje) gekozen moeten worden. De kaart wordt er niet aantrekkelijker op. Wat ook jammer is: de exacte positie van de moskee lijkt in beeld te zijn gebracht; echter, in feite staan ze allen veel dichter bij elkaar, dichter bij het centrum. De cartograaf dient hier een oplossing voor te vinden.
Bij het weergeven van objecten kan er gelukkig gekozen worden dit geaggregeerd te doen. Bijvoorbeeld wanner het aantal objecten (voor sommige gebieden) wel erg groot wordt, of simpelweg omdat de exacte locatie niet bekend is of er niet toe doet.
In plaats van de individuele objecten (moskeeën) kunnen de objecten geaggregeerd worden, zoals in de twee rechter figuren.
Op de middelste kaart lijkt het platteland (het noorden) van Noord-Holland, maar ook de streek ten westen van Amsterdam zeer vol te staan met moskeeën. Op de meest rechter kaart is het juist Amsterdam die de aandacht (terecht) trekt, iets dat op de middelste kaart helemaal niet (onmiddellijk) duidelijk wordt. Hoe zit dit precies? Laten we daarom deze twee (rechter) kaarten eens vergelijken.
De middelste figuur toont een kaart waarbij sprake is van geaggregeerde objecten. In één plaats staan één of meer objecten (moskeeën). Het aantal moskeeën is op de kaart middels een label weergegeven per plaats. Het symbool geeft visueel niet het (aantal) objecten (moskeeën) weer, maar plaatsen waar één of meer moskeeën voorkomen. Het plaatje oogt zeer aantrekkelijk. De labeling en het symbool (géén punt of vierkant, maar een moskee!) zijn creatief geplaatst. Er is echter één nadeel van dit figuur. Plaatsen met één moskee komen visueel net zo duidelijk naar voren als plaatsen met 4, 7 of 46 moskeeën. De werkelijke spreiding van het aantal moskeeën wordt daardoor niet duidelijk. Een dergelijke kaart kan dus niet (eerlijk) gebruikt worden om de spreiding van het verschijnsel in kaart te brengen. Slechts in het geval dat iemand bijvoorbeeld wil weten welke gemeentes überhaupt minimaal één moskee hebben, en waarvan het gemeentebestuur een brief moet ontvangen over nieuw beleid van omwonenden bij een moskee, is het relevant. Al had die persoon misschien nog wel meer aan een eenvoudig lijstje met gemeentes gehad! Zou de meest linker figuur dan toch het best haalbare zijn? Nee. Het is beter om de problemen bij de linker en middelste kaart te vermijden, door voor proportionele symbolen te kiezen; de rechter figuur...
De rechter figuur toont een kaart waarbij de objecten nog steeds zijn geaggregeerd, maar het aantal individuele objecten zijn toch gevisualiseerd. Daardoor wordt nu wél een juist beeld verkregen van de spreiding. Ook al is de individuele locatie van de objecten (bijvoorbeeld van alle moskeeën in Amsterdam) niet bekend. De derde figuur is dus waarschijnlijk het beste. Het platteland staat 'visueel gezien' - maar ook in werkelijkheid - helemaal niet zo vol met moskeeën. Misschien zou er nog wel gekozen kunnen worden om het aantal moskeeën (de labels) niet weer te geven, of direct in of naast de groene cirkels.
TIP: Er had bij de rechter kaart in plaats van abstracte, geometrische symbolen (hier: cirkels) ook gekozen kunnen worden voor figuratieve symbolen. Nadeel is dat bij het proportioneel weergeven van figuratieve symbolen de verhoudingen hiervan vaak niet zo goed worden geïnterpreteerd door de kaartlezer. Ook ontstaat soms een wat onrustig kaartbeeld. Zie ook Afbeelding:Noord holland moskeeën figuratieve proportionele symbolen.png zoals die besproken wordt in Puntsymbolen. In grootte variërende abstracte, geometrische symbolen worden onderling beter ingeschat en verdienen dus meestal de voorkeur.
SAMENVATTING: Afhankelijk van de boodschap van de kaart, kunnen geaggregeerde (=tot één object of symbool samengevoegde) objecten vaker beter met proportionele abstracte (geometrische) symbolen, in kaart gebracht worden. Dat is dus een figuratieve kaart. Het is een oplossing om stippenkaarten die een te grote spreiding in de dichtheden hebben beter af te beelden. Afhankelijk van de wijze van representatie die de kaartmaker kiest, kunnen twee totaal verschillende kaarten ontstaan, die een totaal verschillend beeld van de spreiding van het object weergeven.
Het weergeven van geaggregeerde gegevens
Geaggregeerde gegevens zijn - we zagen het in de paragrafen hiervoor - gegevens die alleen opgeteld per gebied bekend zijn en dus ook opgeteld per gebied dienen te worden weergegeven. We weten immers niet (meer) waar die ongelukken, binnen dat gebied, exact hebben plaatsgevonden. Denk aan het aantal ongelukken per wijk. Hoe kan je dergelijke geagregeerde gegevens nu het beste weergeven? Laten we uitgaan van de volgende voorbeeldgegevens:
Deze kunnen in theorie op de volgende vier verschillende wijzen kunnen worden getoond:
Echter, in de praktijk kunnen deze vier soorten kaarten niet dezelfde situatie visualiseren; de vier kaarten geven echt een verschillende indruk bij de kaartlezer over het fenomeen dat in kaart wordt gebracht:
1) Met een figuratieve kaart. Deze optie is wellicht het meest voor de hand liggend. De kaart brengt vooral de regionale verschillen goed tot uiting. Aan de andere kant is niet meer te zien dat er binnen elke regio een bepaalde verspreiding of clustering van toepassing zou zijn. De kaart doet bij de kaartlezer echter vermoeden - al of niet terecht, dat moet de maker van de kaart vooraf inschatten! - dat er per gebied maar één waarde is. De kaartlezer zal zich wellicht niet realiseren dat deze waarde een gemiddelde is. Hopelijk zijn de gebiedsgrenzen goed gekozen!
2) Met een choropleet. Deze optie wordt ook veel toegepast. Ook bij deze optie worden de verschillen op regionaal gebied - tussen de geaggregeerde gebieden - weergegeven. De waarden dienen genormaliseerd te zijn, dat wil zeggen, afhankelijk gemaakt van de oppervlakte van het gebied, althans, wanneer de geaggregeerde waarde per gebied een optelsom is. De kaart doet vermoeden dat de spreiding van het fenomeen iets met de buitengrens van de vlakken te maken moeten hebben. Dat is bijvoorbeeld juist wanneer het om criminaliteitscijfers gaat, opgeteld per wijk, en men weet inmiddels zeker dat deze binnen één wijk niet sterk variëren, bijvoorbeeld omdat de wijken erg klein zijn gedefinieerd en gelijktijdig die wijken zeer homogeen verdeeld zijn. Maar het blijft een gevaarlijke manier van visualiseren. Doe dit alleen wanneer de gebieden klein genoeg zijn, het fenomeen homogeen verdeeld is binnen de individuele vlakken, of wanneer alleen per gebied (beleids-) beslissingen genomen moeten worden. Bevolkingsdichtheden op deze wijze weergeven kan zeer juist zijn, op het moment dat je weet dat de wijkindeling is afgestemd op een bepaalde dichtheid van woningen; de bevolkingsdichtheid in de aangrenzende wijk - 'aan de andere kant van de ringweg' - is dan inderdaad plotseling heel anders. De gebiedsindeling is blijkbaar afgestemd op het fenomeen; binnen de getoonde (geaggregeerde) is het fenomeen homogeen verdeeld.
3) Met een stippenkaart. Indien de punten werkelijk de locaties zijn van de individuele gebeurtenissen of objecten, dan is dit de meest gedetailleerde weergave. Maar daardoor niet per se de beste weergave; soms is een figuratieve kaart - immers een 'samenvatting van een stippenkaart' - eenvoudiger en leesbaarder dan de stippenkaart. In dit voorbeeld is de eerder geaggregeerde waarde per vlak door een GIS kunstmatig omgezet in een puntenkaart. De stippen staan dus zodanig random geplaatst dat niet de locatie daarvan met de werkelijkheid overeenkomt. De stippen geven wel de gemiddelde dichtheid van al die punten per vlak goed weer. Visueel kan dit zeer aantrekkelijk en helder zijn, al zou het tot onjuiste conclusies kunnen leiden wanneer de data niet homogeen is verdeeld, maar heterogeen (zie bij isolijnenkaart).
4) Met een isolijnenkaart. Isolijnen suggereren dat het fenomeen overal aanwezig is als continu verschijnsel, en bovendien zich onafhankelijk manifesteert van de gebiedgrenzen. Daar moet je als kaartmaker dan wel enige weet van hebben (zie twee paragrafen hiervoor, bij Het verschil tussen objecten en verschijnselen). Bevolkingsdichtheden op deze wijze weergeven kan zeer juist zijn, op het moment dat je weet dat de gebiedsindeling (regio's op provincies) erg arbitrair is, en dat de bevolking vooral woont langs bepaalde rivieren, in dalen en in de grote bevolkingscentra in het midden van de kaart. De gebiedsindeling is blijkbaar niet afgestemd op de bevolking; binnen de getoonde (geaggregeerde) is de bevolkingsdichtheid heterogeen verdeeld.
Een ander - fictief - voorbeeld laat mogelijk de noodzaak tot normaliseren zien wanneer we voor een choropleet of figuratieve kaart zouden willen kiezen. Het is een kaart van een aantal gemeenten in de Zumbeispiel-regio. Het aantal stergevallen aan Aids over de periode van 1980 tot 2000 is hier vier keer weergegeven. Links zijn in beide kaarten de absolute aantallen weergegeven, rechts zijn in beide kaarten de aantallen per 10.000 inwoners weergegeven.
Duidelijk is dat de linker twee kaarten een geheel ander beeld geven van de spreiding van het fenomeen (het thema sterfgevallen aan Aids) dan de twee rechter kaarten. Het zijn twee andere kaartsoorten, echter, de spreiding die ze laten zien is hetzelfde. De twee linker figuren laten de absolute aantallen zien. Dat lijkt heel objectief, maar het blijkt gelijktijdig een erg 'klinische kaart'. Aangezien er in grote steden meer mensen wonen, zullen daar ook meer sterfgevallen te verwachten zijn. Wil je eerlijk zien in welke steden of in welke plattelandsgemeenten relatief nu veel Aids slachtoffers vallen, dan zal je eerder kiezen voor de twee rechter kaarten. De gebieden die in de linker twee kaarten donker hoge waarden kennen, donker gekleurd worden en daardoor extra aandacht krijgen in de linker figuur, zijn heel andere gebieden dan die in de rechter figuur. Terwijl het schijnbaar om dezelfde data ging! Ook gebieden die 'goed' scoren (lage aantallen sterfgevallen) zijn in de linker figuur elders te vinden dan in de rechter figuur.
Zijn dan de twee rechter figuren altijd de beste keus? Nee. Wanneer een hulpverlener gespecialiseerd in begeleiding van (familie van) Aidsslachtoffers, dan is de linker kaart beter; hij ziet in welke gebieden zijn aandacht vooral wel naar uit moet gaan. Een onderzoeker, subsidieverstrekker, beleidsbepaler of arts die wil weten waarom er in het ene gebied meer slachtoffers vallen zal echter aan de twee rechter figuren meer hebben. Hij ziet dat bepaalde plattelandsgemeentes onderling verschillend zijn; ook al zijn er evenveel inwoners, de ene gemeente is wellicht niet bekend met het begrip veilig vrijen. Misschien moeten juist die gemeentes meer aandacht krijgen in de voorlichting.
Of data genormaliseerd moet worden (hier: weergegeven moet worden per 10.000 inwoners), hangt met name van het doel van de te maken kaart af.
Intermezzo: Normaliseren per oppervlak of normaliseren per aantal inwoners
Je moet normaliseren per oppervlak wanneer het om een fysiek aantal objecten in een gebied gaat, wanneer dat onafhankelijk is van het aantal inwoners. Denk aan het aantal gesignaleerde dassen of zeearenden per provincie. Wanneer het echter gaat om aantallen objecten of gebeurtenissen die afhankelijk zijn van het aantal inwoners, dan zal je het aantal moeten delen door de inwoners. Je bent dan aan het normaliseren per aantal inwoners. Denk aan het aantal cafés per stad. Wanneer je wilt ontdekken dat er in Utrecht en Groningen relatief wel erg veel cafe's zijn, dan zal een kaartje van het aantal cafés in Nederland (per stad) je niet veel helpen. Amsterdam, Rotterdam, Heerlen en alle andere grote steden komen misschien nog wel hoger uit dan Groningen en Utrecht. Ga je het aantal cafés delen door het aantal inwoners, dan komt er een (klein) getal uit dat een maat is voor hoeveel mensen 'één café moeten delen'. Je kan overigens op nog veel andere data normaliseren dan alleen oppervlak en aantal inwoners. Deze laatste twee zijn echter wel de gebruikelijkste twee bij het maken van kaarten..
SAMENVATTING: Er zijn verscheidene methoden om gegevens te visualiseren indien het om geaggregeerde data gaat. Het kan met figuratieve kaarten, choropleten, stippenkaarten en isolijnenkaarten. Ze kunnen echter in de praktijk niet zondermeer door elkaar worden gebruikt. De ene situatie kan beter met een choropleet worden weergegeven, de andere met een isolijnenkaart, de volgende juist weer niet, enzovoorts. Dit hangt van het te karteren fenomeen af; is het homogeen of heterogeen verdeeld over de geaggregeerde gebieden. Normaliseren kan per oppervlak en per inwoner. Of data genormaliseerd moet worden, hangt onder andere van het doel van de te maken kaart af.
Het juiste verschijnsel karteren
Het is belangrijk om het juiste verschijnsel te karteren bij een bepaald onderwerp. Gaat het in een artikel om de verspreiding van de islam in Nederland, dan lijkt het misschien logisch om de kaart van de moskeeën in het bovenstaande voorbeeld er bij te nemen. Bedenk echter wat je exact wil karteren. Het aantal moskeeën zegt niets over hoe groot die moskeeën zijn, hoe goed ze bezocht worden en of er steden zijn waar de moslims nog niet naar een moskee gaan omdat ze hun geloof in kleinere groepen in (openbare) gebouwen belijden.
Het kennen van het thema alléén (hier: de verspreiding van de islam) is niet voldoende. Bedenk dus wat exact geïllustreerd moet worden. Welke vragen dient de kaart te beantwoorden? Bedenk ook of het om wijken, gemeentes, COROP-gebieden of provincies gaat. (COROP-gebieden zijn bij elkaar behorende gemeenten met min of meer dezelfde sociaal-economische kenmerken Het Centraal Bureau voor de Satistiek (CBS) houdt veel gegevens bij, maar doet dat niet altijd op gemeentelijk niveau, enkel op COROP-gebieden niveau). Vraag jezelf ook af, als de kaart eenmaal gereed is, wélke vragen die kaart weer oproept. In het voorbeeld van de moskeeën was één van de reacties: 'Hé, maar het aantal moskeeën zegt helemaal niets over of er 'op het platteland' wel of geen moslims zijn, maar de kaart lijkt dit wel te bevestigen'. Misschien is het dan zinvol de kaart te laten vergezellen met een tweede kaart (zie de twee figuren hierboven). Ze lijken over dezelfde spreiding te gaan, maar niets is minder waar. Misschien had de eerste kaart helemaal niet gemaakt hoeven te worden, en zegt de tweede kaart veel meer over de spreiding van de islam. En de tweede kaart suggereert niet dat het een lokaal, stedelijk of geconcentreerd verschijnsel is. Dat komt omdat de tweede kaart het percentage moslims per gebied (vlakken) laat zien. Feitelijk is dat correcter. Zouden deze percentages weer naar aantallen moslims worden omgezet. Dan zou het aantal moslims per COROP-gebieden met proportionele symbolen weergegeven kunnen worden. Dat geeft echter weer een heel ander soort beeld...
Nog een voorbeeld: gaat het om de groei van de industrie in een bepaald gebied, karteer dan de groei van de industrie, door de groeipercentages per gemeente weer te geven, of door de uitbreiding van de industriegebieden tussen 1990 en 2007 weer te geven. Een kaart van de industriegebieden is onvoldoende.
TIP: Plaats bij een artikel of betoog niet zomaar het eerste 'relevante' kaartje dat je over dat onderwerp hebt of snel kan maken.
SAMENVATTING: Zorg dat je kaart de antwoorden geeft die het moet geven. Een redelijk relevante kaart over het onderwerp of het thema, kan meer vragen oproepen dan beantwoorden. Kies wat je wilt illustreren exact uit. Bijvoorbeeld: Gaat het om de spreiding van de islam, karteer dat dan, en niet het aantal moskeeën.
Referenties
↑Kartografie, ontwerp, produktie en gebruik van Kaarten; Ormeling en Kraak, 1987, blz 59.
↑Tekening is op basis van terminologie en indelingen volgens 'GIS for the Urban Environment; J. Maantay en J. Ziegler, 2006, pag 34', 'Kartografie, ontwerp, produktie en gebruik van Kaarten; Ormeling en Kraak, 1987, pag 59-67', Cartography, Visualisation of Spatial Data, M.J. Kraak en F.J. Ormeling, 2003, 2e editie en 'Making Maps, A visual guide to Map Design for GIS, J. Kryger en D. Wood, 2005, pag 162-167'.
↑Jacques Bertin, 'Zien of lezen' (Voir ou lire) in een vertaling van René van der Schans. Bijlage bij 'Geodesia 1999-3', Uitgegeven door Stichting Geodesia.
↑Diagram en Kaart, als geografische hulpmiddelen C.I. Wieland, 1980. Dit werk lijkt overigens verouderd, echter is nog steeds zeer compleet en leesbaar, zeker wanneer het om kartogrammen gaat.
Ga verder met deel C: Classificatie. Hierin zal verder worden ingegaan op geo-visualisatie; data wordt via classificatie 'omgezet' in inzichtelijkere informatie.