Gebruiker:KKoolstra/Onderzoek/Onzekerheid

Uit Wikibooks
Naar navigatie springen Naar zoeken springen
Meten en onzekerheid
Hoofdstukken

2. Onzekerheid[bewerken]

Een veelgehoorde uitpraak is meten is weten. Waarom dan toch de nadruk op onzekerheid in dit boek over meten? Nu is het inderdaad zo dat metingen, in ieder geval valide metingen, ervoor zorgen dat de onzekerheid over de werkelijke situatie wordt verminderd. Toch is het een illusie te denken dat je door te meten alles kunt weten.

Waarom is meten onzeker?[bewerken]

Het doel van meten is om informatie te verzamelen over een werkelijke toestandsgrootheid van een object (meetvariabele). Er zijn echter goede redenen om te veronderstellen dat de werkelijke toestand van een object zelden exact zal overeenkomen met de gemeten waarden:

  • metingen hebben een beperkte precisie
  • meetinstrumenten geven niet altijd de juiste waarde aan
  • bij het bedienen van meetinstrumenten kunnen fouten worden gemaakt
  • de werkelijke waarde van de toestandsgrootheid varieert vaak in plaats en tijd
  • etc.

Een voorbeeld: stel dat we de hoogteligging van een toren willen meten ten opzichte van een bekende referentiehoogte. We kunnen hiervoor bijvoorbeeld een GPS gebruiken met een precisie op centimeter-niveau. We kunnen kiezen voor andere meetinstrumenten met een grotere nauwkeurigheid, maar de precizie van aflezen of waarmee digitaal meetresultaten worden getoond is echter altijd eindig. Belangrijker is echter dat de afgelezen waarde niet altijd juist is. Door kleine afwijkingen in de afstelling van het meetinstrument kunnen fouten in de meetwaarde ontstaan. Deze fouten kunnen nog groter worden indien de meetinstrumenten fout worden bediend. Ten slotte varieert de werkelijke waarde van de toestandsgrootheid vaak in plaats en tijd. Zelfs al definiëren we de hoogte van de toren als het verschil tussen het allerhoogste punt en het NAP, dan blijft het probleem dat de hoogte van de toren varieert in de tijd. Bij warm weer zal het gebouw uitzetten, bij koud weer krimpen. Zo varieert de hoogte van de Eiffeltoren ca. 15 cm afhankelijk van de temperatuur.

Steekproeven[bewerken]

De variabiliteit van het gemetene naar plaats en tijd is nog een relatief klein probleem bij het meten van de hoogte van een toren. Lastiger wordt het als de stijfheid van de ondergrond van een geheel bouwkavel of wegtracé moet worden gemeten, of bijvoorbeeld de gemiddelde intensiteit van het verkeer over de A10 op een gemiddelde werkdag. Gelukkig is het mogelijk om betrouwbare uitspraken te doen op basis van een beperkt aantal metingen, mits deze metingen een voldoende representatief beeld geven van het geheel. In dit geval spreken we van een steekproef. [1]

Er zijn echter meer goede redenen om te kiezen voor een steekproef van beperkte omvang:

  • Het is gemakkelijker en goedkoper om slechts een deel van de populatie te onderzoeken.
  • Als snelheid gewenst is, kan niet de hele populatie onderzocht worden.
  • Bij destructief onderzoek zou de hele populatie verloren gaan.

In de steekproeftheorie beschouwen we de hierboven genoemde objecten (bouwkavel, wegtracé, verkeer over een weg) als een populatie van verschillende plaatsen en tijdstippen. Men kan op verschillende manieren een steekproef verkrijgen. Als alle elementen uit de populatie dezelfde kans hebben om in de steekproef te worden opgenomen, spreekt men van een aselecte steekproef. Men spreekt van een selecte steekproef wanneer de elementen niet op toevalsbasis uit een populatie worden genomen. Zorgt men ervoor dat de verhouding mannen en vrouwen in de steekproef voorkomen ongeveer gelijk is aan deze verhouding in de bevolking dan heet de steekproef representatief (althans wat het kenmerk geslacht betreft). De keuze bepaalt in grote mate de validiteit van verdere analyse.

Voorbeelden van blijvende onzekerheid na meting[bewerken]

Stel dat we willen toetsen of de verdichtingsgraad van de fundering van een nieuwe weg voldoende groot is. Het weglichaam is 2,3 km lang en 15 m breed. We steken op 25 verschillende plekken een monster en bepalen met behulp van een proctorproef de verdichtingsgraad. Puur uitgaande van de meetresultaten, weet je eigenlijk niets meer dan de verdichtingsgraad die bereikt was op 25 verschillende plekken, notabene plekken die door het 'destructieve' karakter van de meting aangetast zijn.

Op basis van onze geotechnische kennis en ervaring mogen we echter veronderstellen dat de verdichtingsgraad tussen twee nabij gelegen plekken niet veel van elkaar verschilt. Bovendien kunnen we uit de 25 metingen ook iets afleiden over de orde grootte van de onderlinge verschillen.

Het vakgebied dat zich bezighoudt met het verbinden van algemene conclusies uit een beperkte steekproef is de statistiek. Dit vakgebied is nauw verwant aan - en volgens sommigen een onlosmakelijk onderdeel van - de kansrekening, welke zich bezighoudt met het rekenen met onzekerheid. Om een getalsmatige uitspraak te kunnen doen over de (on)zekerheid voor en na de metingen m.b.t. tot de verdichtingsgraad zullen we dus eerst een manier moeten vinden om onzekerheid in getallen uit te drukken. Dit kan met behulp van de begrippen kans en entropie.

Om het vochtgehalte te bepalen, wordt het monster gewogen, gedroogd in een oven en opnieuw gewogen.
Een machine met een gewicht van 2,5 kg met een oppervlakte van 50,8 mm slaat met 25 slagen per laag het monster aan.

Proctorproef [2]

De proctorproef is een testprocedure die wordt toegepast om de dichtheid van een grondmonster te bepalen zodat men de funderingsstabiliteit van de grond kan vaststellen. De naam verwijst naar de Amerikaanse ingenieur Ralph R. Proctor die in 1933 de eerste varianten van de proef ontwikkelde.

Er moet eerst worden bepaald wat het vochtgehalte van de genomen grondmonsters is. De grondmonsters worden genomen met een cilinder van een bepaalde inhoud. Het vochtgehalte wordt gemeten door ongeveer 150 gram nat zand uit een monster in de ovenschaal te doen, dit gewicht wordt dan genoteerd. Hierna wordt dit zand enkele minuten verwarmd in een oven. Op regelmatige tijdstippen wordt gewogen en indien het gewicht niet meer dan 0,1% afwijkt van de vorige meting wordt het monster als droog beschouwd. Nu wordt het droge gewicht gemeten, en zo is bekend hoeveel vocht het betreffende monster bevat.

De maximale dichtheid wordt bepaald aan de hand van een test. Een machine met een gewicht van 2,5 kg met een oppervlakte van 50,8 mm slaat met 25 slagen per laag het monster aan, het aantal lagen verschilt per inhoud van de cilinder (3 tot 5), de lagen zijn gemiddeld 40 mm dik. De foto toont de cilinder met inhoud die wordt aangeslagen door het betreffende gewicht.

Om vervolgens de maximale proctordichtheid te bepalen wordt als volgt te werk gegaan: Men begint met een normale waarde (het vochtgehalte zoals deze met het monster was geleverd) en vervolgens voegt men een x aantal % aan water toe en voert de test nogmaals uit. Dit gebeurt zo vaak totdat de dichtheid begint te dalen.

Onzekerheid en kansbegrip[bewerken]

Kansrekening is een tak van de wiskunde die zich bezighoudt met situaties waarin het toeval een rol speelt, met als gevolg dat er geen zekerheid is over allerlei uitkomsten. Kansrekening is ontstaan vanuit de maatschappelijke behoefte om zo effectief mogelijk om te gaan met onzekerheden. De kansrekening tracht mathematische hulpmiddelen aan te reiken aan een zeer breed scala van maatschappelijke activiteiten en wetenschappen, om binnen een omgeving met onzekerheden toch gefundeerde keuzes te kunnen maken of conclusies te kunnen trekken.Zie voor een (wiskundige) inleiding in de Discrete Kansrekening het gelijknamige wikiboek.

Intuïtieve uitleg van het begrip kans [3][bewerken]

In een situatie waarin het toeval een rol speelt zal tevoren vaak niet bekend zijn wat de uitkomst van een gebeurtenis (een waarneming of meting) is. Wel kan meestal van tevoren aangegeven worden wat de mogelijke uitkomsten zijn. De kans is dan een maat voor de waarschijnlijkheid van iedere uitkomst. Deze kansmaat heeft een aantal (wenselijke) eigenschappen. Als alle uitkomsten even waarschijnlijk (of, zo je wilt, onwaarschijnlijk) zijn, dan hebben ze logischgewijs dezelfde kans. Verder moeten we, net als bij meetvariabelen, een schaal definiëren om een getalswaarde te kunnen gaan geven. Dit doen we door 0% waarschijnlijkheid (het minimum) te laten overeenkomen met een kans van 0 en 100% waarschijnlijkheid (het maximum) overeen te laten komen met een kans van 1. Ten slotte willen we dat tussen een kans van 0 en 1 er een logische schaling is, zodat we een kans van 1/2 mogen opvatten als dat de betreffende uitkomst even waarschijnlijk wel als niet kan gebeuren.

We gaan nu proberen in een aantal situaties op intuïtieve gronden kansen toe te kennen aan mogelijke uitkomsten.

Voorbeeld 1
Drie rode ballen en één zwarte heb je gestopt in een schaal. De ballen voelen allemaal hetzelfde. Je pakt, zonder in de schaal te kijken, ‘willekeurig’ een bal. Wat is de kans dat de bal rood is?

In dit voorbeeld is er sprake van vier gelijkwaardige mogelijkheden, waarvan er drie leiden tot de uitkomst rood. De meeste mensen zullen daarom ervoor kiezen om aan deze gebeurtenis de kans toe te kennen.

Voorbeeld 2
We werpen een zuivere dobbelsteen (dwz. een exacte kubus, gemaakt van een homogeen materiaal en de 6 zijden voorzien van de ogenaantallen 1 tot en met 6, zonder de gewichtsverdeling te verstoren). Wat is de kans op het gooien van een '6'? En wat is de kans op het gooien van een even aantal ogen?

Ook hier is er sprake van een (fysische) symmetrie. Op grond van de symmetrie van de dobbelsteen zeggen we dat elk van de mogelijke uitkomsten (ogenaantallen) 1 tot en met 6 gelijke kans van optreden heeft. Het begrip symmetrie is de basis voor de klassieke definitie van het begrip kans. Het werd geïntroduceerd door Laplace (1749-1827). In een symmetrisch experiment wordt de kans op een gebeurtenis A gegeven door de fractie voor A gunstige (dat wil zeggen tot A behorende) uitkomsten #A ten opzichte van het totaal aantal mogelijke uitkomsten #S:

De kans op een '6' is daarmee en de kans op een 'even aantal ogen' .

Voorbeeld 3
Er is een longontsteking bij je geconstateerd. Uit onderzoek weet de behandelend arts dat in gelijkwaardige gevallen 92% van de patiënten geneest na een behandeling met antibiotica. Verder heeft de arts geen relevante informatie om de kans op genezing na deze behandeling in te schatten. Hoe groot acht je de kans dat je geneest na de behandeling?

In dit voorbeeld is het niet mogelijk om alleen op basis van 'symmetrie' kansen toe te kennen. Toch zullen veel mensen bereid zijn om de genoemde 92% patiënten die geneest te vertalen naar een kans(schatting) van 0,92. Als we intuïtief twijfelen aan de 'hardheid' van deze kans, dan heeft dat waarschijnlijk als oorzaak dat we (1) de betrouwbaarheid niet weten van het empirische gegeven dat 92% geneest en (2) niet weten of we, als we andere informatie zouden hebben, niet tot andere conclusies zouden komen. Bijvoorbeeld: wat nu als uit ander onderzoek blijkt dat mensen met een vergelijkbare medische geschiedenis lagere kans hebben om te genezen na deze ene kuur?

Naar een algemene kansdefintie[bewerken]

Illustratie van de convergentie van de relatieve frequentie naar de kans bij 1000 worpen met een symmetrische munt. [4]

Op basis van de bovenstaande voorbeelden kunnen we concluderen dat er verschillende aanknopingspunten zijn om het begrip 'kans' te definiëren. In situaties met een symmetrische uitkomstenruimte kunnen we de (klassieke) kansdefinitie van Laplace toepassen. Deze kansdefinitie heeft echter twee belangrijke beperkingen. De klassieke definitie veronderstelt een eindige uitkomstenruimte, terwijl we ook experimenten in onze beschouwingen willen betrekken waarbij de uitkomstenruimte oneindig veel elementen bevat. Bovendien is in veel situaties niet duidelijk hoe je een dergelijke 'symmetrische' uitkomstenruimte moet definiëren, bijvoorbeeld als het gaat om het gooien van een asymmetrisch voorwerp als een punaise in plaats van een symmetrische munt of dobbelsteen.

Een andere intuïtieve benadering is het ervaringsfeit dat het herhaald uitvoeren van hetzelfde experiment leidt tot dezelfde relatieve frequentie op de lange duur. Op basis hiervan kun je wanneer bijvoorbeeld een uitkomst in 30% van een lange reeks waarnemingen optreedt, dit interpreteren als dat deze uitkomst (globaal) 30% kans van optreden heeft voor ieder experiment.

De overeenkomst is voor eindige aantallen experimenten echter nooit exact; alleen bij een fictieve oneindige rij experimenten komt de denkbeeldige relatieve frequentie overeen met de kans. Het gelijkstellen van het begrip 'kans' aan deze denkbeeldige relatieve frequentie in een oneindige reeks heeft echter een zware prijs: hierdoor verliest het begrip alle relatie met onze (eindige) werkelijkheid.

Bovenstaande modellen (symmetrie en relatieve frequentie) zijn nodig om het begrip kans te koppelen aan onze waarneembare werkelijkheid en helpen het begrip intuïtief te begrijpen. Voor een wiskundig éénduidige definitie zijn deze echter niet voldoende. Daarom wordt het begrip kans in de volgende paragraaf axiomatisch ingevoerd. De kans, aangeduid met 'P', zal aan een gebeurtenis de kans van optreden P(A) toekennen volgens een drietal vastgestelde regels (zie onder formele definitie van het begrip kans). De begrippen: uitkomst, gebeurtenis en kans vormen de basis waarop de gehele kansrekening rust.

Formele definitie van het begrip kans [5][bewerken]

De axioma's van de kansrekening zijn enkele door de Russische wiskundige Kolmogorov geformuleerde wiskundige uitganspunten, op basis waarvan alle regels van de kansrekening kunnen worden afgeleid. Het is als het ware een formele wiskundige definitie van het begrip kans. Hierdoor is het mogelijk om te redeneren over en rekenen met kansen als abstract begrip, onafhankelijk van de vraag hoe we in werkelijkheid bepalen wat de 'kans' is van een reële gebeurtenis zoals beschreven in de drie bovenstaande voorbeelden.

Kansruimte[bewerken]

Bij kansrekening hebben we te maken met een willekeurige (niet-lege) verzameling Ω en een collectie deelverzamelingen daarvan, , de gebeurtenissen. Op de collectie gebeurtenissen is een kans P (van 'Probabilitas') gedefinieerd. De verzameling Ω kan worden gezien als de verzameling van de mogelijke uitkomsten van een kansexperiment; daarom wordt Ω de 'uitkomstenruimte' genoemd en de elementen van Ω uitkomsten.

Er is echter wel een technische beperking die voor niet-wiskundigen lastig uit te leggen is, maar wel van belang is om paradoxale uitkomsten te voorkomen in situaties waarbij de uitkomstenruimte uit een 'oneindig' aantal elementen bestaat. Niet iedere deelverzameling van Ω kan als gebeurtenis optreden; de deelverzamelingen die wel als gebeurtenis kunnen optreden vormen een speciale collectie . Om te garanderen dat allerlei met een of meer gebeurtenissen samenhangende deelverzamelingen van Ω ook tot de gebeurtenissen behoren, wordt gëeist dat een σ-algebra is. Een dergelijk drietal heet kansruimte en is een bijzonder geval van wat in de wiskunde, specifiek de maattheorie, een maatruimte wordt genoemd.

Over het algemeen kan niet iedere deelverzameling van Ω als gebeurtenis optreden; de deelverzamelingen die wel als gebeurtenis kunnen optreden vormen een speciale collectie . De kans P moet voldoen aan de volgende voorwaarden, de zgn. axioma's van Kolmogorov:
Axioma 1: de kans van een gebeurtenis E is niet-negatief:

Axioma 2: De kans op een zekere gebeurtenis (de vereniging van alle mogelijke gebeurtenissen is genormeerd op 1:

Axioma 3: Voor gebeurtenissen die niet tegelijkertijd kunnen optreden, kun je de kans dat een van deze gebeurtenissen optreedt, berekenen als de som van de kansen op de afzonderlijke gebeurtenissen:

voor iedere aftelbare rij disjuncte gebeurtenissen .

Voorbeeld[bewerken]

Bij eenmaal gooien met een dobbelsteen is de uitkomstenruimte (verzameling mogelijke uitkomsten) Ω = {1,2,3,4,5,6}. Welk ogenaantal boven zal komen bij een worp met een dobbelsteen, weten we tevoren niet - dat is ook juist de bedoeling - maar we weten wel dat er slechts de mogelijkheden 1 tot en met 6 zijn. De verzameling van de mogelijke uitkomsten van zo'n toevalsexperiment wordt 'uitkomstenruimte' (of 'uitkomstenverzameling') genoemd en veelal aangeduid met Ω. De kans op een van de ogenaantallen 1 tot en met 6, dus de kans op heel Ω, is 1. De kans op een van de ogenaantallen uit {1,2,3,5,6} is gelijk aan de kans op een uitkomst uit {1,5} plus de kans op een uitkomst uit {2,3,6}. Bij een zuivere dobbelsteen zal de kans op elk van de gebeurtenissen {1}, {2}, ...,{6} hetzelfde zijn en dus gelijk aan . Voor de hiervoor genoemde gebeurtenissen geldt dan:

.

Behalve de vraag welke uitkomst de worp met de dobbelsteen heeft, is er ook behoefte om vragen als "Is de uitkomst een even ogenaantal?" of "Heb je meer dan 4 gegooid?" te beantwoorden. Deze vragen hebben betrekking op meer dan een uitkomst, de eerste op de uitkomsten 2, 4 en 6, en de tweede op de uitkomsten 5 en 6. Het resultaat 'even uitkomst' en evenzo 'meer ogen dan 4' wordt een gebeurtenis genoemd en voorgesteld door respectievelijk de deelverzamelingen {2,4,6} en {5,6} van de uitkomstenruimte.

Vergelijking met intuïtief geformuleerde eigenschappen[bewerken]

Eerder in dit hoofdstuk hebben we op basis van wat gevoelsmatig logisch is (plus bepaalde vrij arbitraire afspraken, zoals dat we de maximale kans normeren op 1), een aantal eigenschappen genoemd die wenselijk zijn voor een kansmaat. We vertalen deze naar de volgende desiderata (wenselijke eigenschappen) ten aanzien van een kansmaat:

  1. Aan uitkomsten die equivalent of anderszins even waarschijnlijk zijn, kennen we dezelfde unieke kans toe.
  2. Een onmogelijke gebeurtenis (een gebeurtenis die geen deel uitmaakt van de set van mogelijke gebeurtenissen) heeft kans 0.
  3. Een zekere gebeurtenis Ω (de vereniging van alle mogelijke gebeurtenissen) heeft kans 1.
  4. Een gebeurtenis A die even waarschijnlijk is als zijn complement (de gebeurtenis niet-A), heeft als kans

Met uizondering van eigenschap 1, die meer te maken heeft met hoe wij kansen toekennen aan gebeurtenissen, kunnen deze eigenschappen direct uit de axioma's van Kolmogorov worden afgeleid. Zo garandeert de combinatie van het tweede en derde axioma de eigenschap dat als gebeurtenis A even waarschijnlijk is als gebeurtenis niet-A, deze allebei kans moeten hebben. Immers:

  • A en niet-A zijn twee disjuncte gebeurtenissen, waarvan de vereniging per definitie gelijk is aan de hele kansruimte Ω. De kans op A of niet-A is 1 op grond van het tweede axioma.
  • A en niet-A (_A) zijn disjuncte gebeurtenissen, dus volgens het derde axioma is P(Ω)de som van P(A) en P(_A).
  • A en niet-A zijn even waarschijnlijk, dus per definitie geldt P(A) = P(_A).
  • De enige oplossing voor P(A) + P(A) = 1 is P(A) = .

Het onderstaande gedeelte is echt nog 'klad'

Het bepalen van kanswaarden[bewerken]

Theoretisch: verschillende benaderingen

  • frequentistisch: kansen bepalen uit relatieve frequentie bij groot aantal waarnemingen

(traditie Von Mises e.a.)

  • epistemisch

Verschillende interpretaties van het begrip kans[bewerken]

Het begrip kans is axiomatisch gedefinieerd en kan op verschillende wijze geïnterpreteerd kan worden. De belangrijkste interpretaties zijn: [6]

  • Klassiek: als uitdrukking voor het optreden van gelijk mogelijke uitkomsten.
  • Frequentistisch: als relatieve frequentie of frequentiequotiënt.
  • Subjectief: als subjectieve mate van persoonlijke overtuiging
  • Logisch: als uitbreiding op de deterministische logica, waarbij logische implicaties niet enkel waar of onwaar kunnen zijn, maar een mate van waarschijnlijkheid bezitten.

Klassiek[bewerken]

In de klassieke opvatting wordt aan elk van een eindig aantal, zeg n, uitkomsten die alle even waarschijnlijk zijn, de kans 1/n toegekend. Men spreekt ook wel van symmetrie. Deze definitie heeft als voordeel dat zij bruikbaar is zonder het experiment te hoeven uitvoeren. Deze interpretatie heeft dus niets van doen met (denkbeeldige) experimenten, maar geeft uitdrukking aan een kennispositie (epistemologische kans-interpretatie).

Frequentistisch[bewerken]

Bij de frequentie-interpretatie vatten we de kans p op het optreden van een onzekere gebeurtenis op als het frequentiequotiënt van het optreden van die gebeurtenis in een zeer lange reeks experimenten. De kans is altijd een getal tussen 0 en 1, of in procenten uitgedrukt tussen 0 en 100%.

Subjectief[bewerken]

In de subjectieve kansopvatting is kans een subjectief begrip waarmee de mate van iemands persoonlijke overtuiging wordt aangegeven. Vaak wordt deze kansopvatting Bayesiaans genoemd, maar dat is in feite niet correct. Bayesiaanse statistiek is een logisch gevolg van een subjectieve kansopvatting, maar ook van de hieronder genoemde logische kansopvatting.

Logisch[bewerken]

...

Voorbeelden[bewerken]

Dobbelstenen

Een voorbeeld van de frequentie-interpretatie is het werpen met een duidelijk niet zuivere munt. In een lange reeks worpen zal bv. blijken dat de kans op "kop" rond de waarde 0,57 varieert en deze waarde lijkt te naderen. We zeggen dan dat voor deze munt de kans op de uitkomst "kop" gelijk is aan 0,57.

Een voorbeeld van symmetrie is het werpen met een zuivere munt. Zonder te werpen stellen we de kansen op de uitkomsten "kop" en "munt" beide op 1/2.

Stel nu echter dat ons verteld wordt dat onze munt onzuiver is, maar dat wijzelf geen enkel experiment met de munt hebben gedaan. Bij de epistemologische kans-opvatting is de kans op "munt" bij onze eerste experiment nog steeds 1/2, terwijl de frequentist zal beweren dat dat nu juist niet zo is. Zelfs na een enkel experiment weten we al meer en de aanhanger van de epistemologische kans-opvatting zal zijn kans aanpassen. [7]

Bij een worp met een ideale (of: zuivere) dobbelsteen, heeft vanwege de symmetrie elke zijde dezelfde kans, dus 1/6, om boven te komen. Ook hier is het onze kennispositie die ons deze toewijzing laat maken.

De uitkomst van het gooien van dobbelstenen is bij een experiment niet alleen gegeven door het al of niet zuiver-zijn van de dobbelsteen, ook de beginvoorwaarden van het werpen spelen een rol. Dit laat nogmaals zien dat de kans 1/6 niets anders is dan een epistemologisch verantwoorde toekenning, men kent immers de experimentele situatie niet.

Monty Hall probleem[bewerken]

Toelichting: aan de hand van het Monty Hall probleem

Onzekerheid en entropie[bewerken]

De kans op een bepaalde uitkomst is, losjes gedefinieerd, een getal dat uitdrukt in welke mate je deze uitkomst wel of niet mag verwachten in een gegeven situatie. Iedere mogelijke uitkomst heeft daarbij een eigen kanswaarde. Het is echter ook interessant om de totale onzekerheid over de uitkomst uit te drukken in één enkel getal. Hiervoor zijn verschillende maten beschikbaar, elk met eigen voor- en nadelen. Niet alle maten zijn echter bruikbaar voor alle meetniveaus. Zo kan de variantie voor interval- en ratiovariabelen worden gebruikt als maat van onzekerheid, maar deze is niet geschikt voor variabelen met een ordinaal of nominaal meetniveau. Een maat die echter bruikbaar is voor alle meetniveaus is entropie.

Hoewel er verschillende maten zijn voor entropie, is de meest gebruikte - vanwege een aantal interessante eigenschappen die we hier niet verder zullen behandelen - de Shannon Entropie.



Voetnoten:

  1. De onderstaande paragraaf is een bewerking van het lemma steekproef van nl.wikipedia. Versie: [1]; auteurs: [2].
  2. Deze tekst is een bewerking van het lemma Proctorproef op nl.wikipedia. Versie: zie [3]; auteurs: zie [4]
  3. Deze paragraaf is een bewerking van het lemma Kansrekening van nl.wikipedia; zie: [5]; auteurs: zie [6] en de module Discrete Kansrekening/Basisbegrippen/Intuïtief kansbegrip uit het wikiboek Discrete Kansrekening. Versie: zie [7]; auteurs: zie [8]
  4. Bron: Nijdam, W. & W. Albers, Discrete Kansrekening. [9].
  5. Deze paragraaf is een bewerking van het lemma Axioma's van de kansrekening van nl.wikipedia. Versie: [10]; auteurs: [11].
  6. Deze paragraaf is een bewerking van het lemma kans (statistiek) van nl.wikipedia. Versie: [12]; auteurs: [13].
  7. Zie Jaynes, E.T., 2003, Probability Theory, the Logic of Science; hoofdstukken 6, 18
Informatie afkomstig van http://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.