Discrete Kansrekening/Printversie

Discrete Kansrekening

Dit boek is de praktisch ongewijzigde tekst van het overeenkomstige collegedictaat geschreven door drs. W. Nijdam en prof. dr. W.Albers van de Universiteit Twente en is met toestemming van beide auteurs hier opgenomen.
Het boek biedt een eerste kennismaking met kansrekening op universitair niveau voor wiskundestudenten.

Inhoud

0. Inleiding
   1. Algemene opmerkingen
   2. Geschiedenis
   3. Literatuur
1. Basisbegrippen
   1. Experiment en uitkomstenruimte
   2. Intuïtief kansbegrip
   3. Kans
   4. Eigenschappen van kansen
   5. Vraagstukken
2. Symmetrische kansruimten
   1. Inleiding
   2. Combinatorische kansrekening
   3. Vraagstukken
3. Voorwaardelijke kans en onafhankelijkheid
   1. Voorwaardelijke kans
   2. Onafhankelijke gebeurtenissen
   3. Samengestelde experimenten
   4. Vraagstukken
4. Stochastische variabelen
   1. Inleiding
   2. Kansverdeling
   3. Enkele bekende discrete verdelingen
   4. Vraagstukken
5. Simultane kansverdelingen
   1. Inleiding
   2. Voorwaardelijke kansverdelingen
   3. Onderling onafhankelijke stochastische variabelen
   4. Functies van stochastische variabelen
   5. Gelijkverdeelde stochastische variabelen
   6. Vraagstukken
6. Verwachtingswaarde
   1. Inleiding
   2. Verwachting van bekende discrete verdelingen
   3. Verwachting van functies van stochastische variabelen
   4. Eigenschappen van verwachtingswaarde
   5. Voorwaardelijke verwachtingswaarde
   6. Vraagstukken
7. Momenten
   1. Inleiding
   2. Variantie en standaardafwijking
   3. Variantie van bekende discrete verdelingen
   4. Covariantie en correlatie
   5. De ongelijkheid van Chebyshev
   6. De zwakke wet van de grote aantallen
   7. Vraagstukken
8. Tabellen
   1. Binomiale verdeling
   2. Poisson-verdeling
9. Register

Wikipedia heeft een encyclopedisch artikel over Kansrekening

Algemene opmerkingen

In natuur, techniek en samenleving treffen we veel verschijnselen aan die niet met zekerheid te voorspellen zijn, maar niettemin bepaalde wetmatigheden vertonen. Bijvoorbeeld de hoeveelheid neerslag op een bepaalde dag, het geslacht van een baby die geboren wordt, het defect raken van een auto. Deze verschijnselen kunnen we niet met zekerheid voorspellen. Toch weten we dat het in Nederland meer regent dan in Ethiopië, dat bijna de helft van de pasgeboren baby's meisjes zijn en dat een oude auto vaker defect raakt dan een nieuwe.

Kansrekening is een wiskundige theorie die zulke wetmatigheden beschrijft en bestudeert. Deze theorie is gebaseerd op enkele veronderstellingen waarvan we aannemen dat ze redelijk aansluiten bij de werkelijkheid. De juistheid van deze veronderstellingen wordt in de kansrekening echter nooit geverifieerd. De statistiek houdt zich bezig met methodes om de juistheid van veronderstellingen omtrent de werkelijkheid te verifiëren en de parameters van een probleem te "meten".

Een streng wiskundige behandeling van de kansrekening vereist het gebruik van maattheorie. In dit boek wordt geen maattheorie gebruikt, maar ligt de nadruk op een intuïtieve benadering. Kansrekening vindt toepassing in vele gebieden van wetenschap en techniek. We noemen slechts enkele voorbeelden: statistiek, statistische mechanica, operationele research, verzekeringswiskunde, econometrie, informatie- en communicatietheorie, biologie en psychologie.

Geschiedenis

De kansrekening is in de zeventiende eeuw ontstaan uit problemen in verband met het dobbelspel. Vragen van de dobbelende Chevalier DeMéré (1610-1685) werden in 1654 aanleiding tot een briefwisseling tussen Pascal (1623-1662) en Fermat (1601-1665). Een van de vragen luidde ongeveer: "Wat is waarschijnlijker: met één dobbelsteen in vier worpen minstens één zes te gooien óf met twee dobbelstenen in 24 worpen minstens één dubbelzes te gooien". De kansen op deze gebeurtenissen zijn ongeveer 0,5177 en 0,4914. Dat DeMéré door ervaring (en tot zijn verbazing) had geconstateerd dat de eerste kans groter dan een half was en de tweede kleiner dan een half, zegt wel iets over zijn hartstocht voor het dobbelen.

De frivole oorsprong van de kansrekening is nog altijd merkbaar in de moderne leerboeken en komt zeer duidelijk tot uiting in de vroegste literatuur. Het eerste boek over kansrekening werd in 1657 geschreven door Christiaan Huijgens (1629-1695): De ratiociniis in ludo aleae (Over berekeningen bij het dobbelspel). Andere boeken uit de begintijd zijn: Essai d'Analyse sur les Jeux de Hasard in 1708 door DeMontmort (1678-1719), Ars conjectandi (de kunst van het gissen (gokken?)) in 1713 door Jacob Bernoulli (1654-1705) en The Doctrine of Chances in 1718 door DeMoivre (1667-1754). Namen van anderen die in belangrijke mate hebben bijgedragen tot het ontstaan van de kansrekening, zijn Laplace (1749-1827), Gauss (1777-1855) en Poisson (1781-1840). De eerste definitie van het begrip "kans" werd gegeven door Laplace in zijn Théorie analytique des probabilités (1812). Van de zeer vele wiskundigen die de kansrekening verder hebben ontwikkeld, noemen we nog Chebyshev (1821-1894), Markov (1856-1922), Borel (1871-1956), Lévy (1886-1972), Khintchine (1895-1959), Bernstein (1878-1956), Fréchet (1878-1973), Kolmogorov (1903-1987) en Feller (1906-1970).

Literatuur

De volgende boeken bevatten ongeveer de stof die hier behandeld wordt en bovendien verdere uitbreidingen van de theorie:

C.R. Heathcote, Probability, Elements of the Mathematical Theory, George Allen & Unwin Ltd., London, 1971.
S.M. Ross, A First Course in Probability, 4th edition, MacMillan, New York, 1994.
A.J. Stam, Inleiding tot de waarschijnlijkheidsrekening, H. Stam, Haarlem 1964.
W. Feller, An Introduction to Probability Theory and Its Applications, Vol. I, Third Edition, Wiley, New York, 1968 (verkrijgbaar als paperback).

Terug naar Inhoud

1.1 Experiment en uitkomstenruimte

In de kansrekening (of waarschijnlijkheidsrekening) houden we ons bezig met (wiskundige) modellen voor het beschrijven van experimenten waarin het toeval een rol speelt. We kunnen daarbij denken aan het werpen van een dobbelsteen of het meten van de levensduur van een bepaald type gloeilamp. In deze gevallen is duidelijk welke handelingen we moeten verrichten om een uitkomst van het experiment te verkrijgen. De uitkomst zelf staat echter in het algemeen niet van te voren vast, maar pas nadat het experiment is uitgevoerd. Dergelijke experimenten noemen we stochastisch.

Onder een toevalsexperiment (of stochastisch experiment) verstaan we een experiment dat, onder gelijke omstandigheden herhaald, niet noodzakelijk tot gelijke uitkomsten leidt.

Opmerking 1

In het vervolg zullen we steeds van experiment spreken als we een stochastisch experiment bedoelen.

Het uitvoeren van een experiment leidt altijd tot een resultaat: de uitkomst van het experiment. Bij het werpen van een dobbelsteen is de uitkomst het aantal geworpen ogen; de geboorte van een baby leidt tot een van de uitkomsten "jongen" of "meisje"; de uitkomst bij het meten van de levensduur van een gloeilamp is de vastgestelde levensduur, een positief reëel getal, en het lanceren van de satelliet leidt tot een van de uitkomsten "succes" of "mislukking".

Bij de uitvoering van een experiment kan de uitkomst zelf van veel belang zijn. Denk aan een spelletje dobbelen of roulette, of aan ouders die graag een zoon willen hebben. In de kansrekening gaat het echter niet om een specifieke uitkomst, maar om de mogelijke uitkomsten. Hoewel de uitkomst van een stochastisch experiment niet a-priori vaststaat, kunnen we wel vaststellen welke uitkomsten mogelijk zijn. Deze mogelijke uitkomsten horen onverbrekelijk bij het experiment en staan, in tegenstelling tot de uitkomst, ook vast voordat het experiment is uitgevoerd. De verzameling van alle mogelijke uitkomsten noemen we de uitkomstenruimte van het experiment. Deze verzameling duiden we gewoonlijk aan door S (van Engels: Sample space).

De uitkomstenruimte S (S ≠ ∅) van een experiment is de verzameling van alle mogelijke uitkomsten; een element s ∈ S heet uitkomst. We spreken van een discrete uitkomstenruimte als de uitkomstenruimte eindig dan wel aftelbaar oneindig is.

Opmerking 2

We zullen ons in dit boek uitsluitend bezighouden met discrete uitkomstenruimten; vandaar de titel Discrete Kansrekening. Met de bestudering hiervan wordt een goed beeld gekregen van wat kansrekening inhoudt en een goede basis gelegd voor verdere bestudering van de algemene theorie.

Een experiment geeft aanleiding tot bepaalde gebeurtenissen. Zo kunnen we bij het werpen van een dobbelsteen spreken over de gebeurtenis dat het geworpen aantal ogen even is of de gebeurtenis dat dit aantal groter dan 3 is. De gebeurtenis "aantal ogen is even" treedt op als de uitkomst 2, 4 of 6 is. Daarom identificeren we deze gebeurtenis met de deelverzameling {2,4,6} van de uitkomstenruimte. Zo is de gebeurtenis "aantal ogen groter dan 3" identiek met de deelverzameling {4,5,6}. Algemeen zullen we gebeurtenissen opvatten als deelverzamelingen van de uitkomstenruimte.

Een gebeurtenis is een deelverzameling van de uitkomstenruimte S.

We geven gebeurtenissen veelal aan met hoofdletters uit het begin van het alfabet, dus A, B, C etc.

Voorbeeld 1 (ontaarde situatie)

Een experiment met één mogelijke uitkomst u. De uitkomstenruimte is een verzameling met slechts één element: S = {u}. Er is eigenlijk geen sprake van toeval.

Voorbeeld 2 (alternatief)

We werpen een munt. Er zijn twee mogelijke uitkomsten K(ruis) en M(unt). We nemen dus als uitkomstenruimte de verzameling S = {K,M}. Een gebeurtenis is bv. {K} = "we hebben kruis geworpen"; deze gebeurtenis is praktisch niet verschillend van de uitkomst K.

Voorbeeld 3 (dobbelsteen)

We werpen een dobbelsteen; het aantal geworpen ogen is de uitkomst van het experiment. De uitkomstenruimte is dus S = {1,2,3,4,5,6}. Gebeurtenissen zijn bv. E = {2,4,6} (we gooien een even ogenaantal), D = {1,2} (we gooien minder dan 3) of A = {1,6} (we gooien 1 of 6).

Voorbeeld 4 (twee worpen met een dobbelsteen)

We werpen twee maal een dobbelsteen. Als uitkomst van dit experiment nemen we het getallenpaar bestaande uit het aantal geworpen ogen bij de eerste worp en dat bij de tweede worp. De uitkomstenruimte is S = {(1,1),...,(1,6),(2,1),...,(2,6),...,(6,6)} = {(i,j)|i = 1,2,...,6 en j = 1,2,...,6} en bevat dus 36 uitkomsten. Grafisch kan men deze uitkomstenruimte als volgt voorstellen:

Figuur 1.1.1: uitkomstenruimte bij twee worpen met een dobbelsteen.

Een gebeurtenis is bv. A = {(1,3),(2,2),(3,1)} (de som van de ogen van beide dobbelstenen is 4); in de figuur zijn de uitkomsten die tot A behoren aangegeven door "x". De gebeurtenis B dat beide worpen hetzelfde aantal ogen opleveren is B = {(1,1),(2,2),...,(6,6)}.

Voorbeeld 5

Uit een partij bestaande uit 1000 IC's worden er 10 gekozen. Deze 10 IC's worden elk getest en goedgekeurd of afgekeurd. De uitkomst van dit experiment is het aantal afgekeurde IC's; als uitkomstenruimte nemen we: S = {0,1,...,10}. Een gebeurtenis is A = {0,1,2} (dwz. er zijn ten hoogste twee afgekeurde IC's).

Voorbeeld 6

We werpen een dobbelsteen zo vaak tot voor het eerst 6 boven komt. Het aantal worpen vatten we op als uitkomst van het experiment; de uitkomstenruimte is dan S = {1,2,...}. Deze uitkomstenruimte is niet eindig, zoals in de voorgaande voorbeelden, maar aftelbaar oneindig. Een gebeurtenis is bv. A = {1,2,3,4,5} (dwz. om 6 te gooien, hoefden we niet meer dan 5 keer te werpen).

Voorbeeld 7

De levensduur van een gloeilamp kan men beschouwen als de uitkomst van een experiment. Aangezien een lamp op ieder willekeurig tijdstip defect kan raken, moeten we als uitkomstenruimte nemen S = [0,∞). Deze uitkomstenruimte is niet meer aftelbaar. Een gebeurtenis is bv. A = (1000,∞) (de lamp brandde langer dan 1000). Met zulke niet-discrete uitkomstenruimten houden we ons in dit boek niet bezig.

Aangezien gebeurtenissen gedefinieerd zijn als verzamelingen, kunnen we aan verschillende begrippen uit de verzamelingenleer een voor de kansrekening eigen interpretatie geven (de begrippen worden bekend verondersteld).

-De uitkomstenruimte S zelf, in de verzamelingenleer als universele verzameling aangeduid, is ook een gebeurtenis, die we de zekere gebeurtenis noemen; aangezien elke uitkomst in S ligt, treedt deze gebeurtenis dus altijd op.

-Ook de lege verzameling ∅ is een gebeurtenis; we noemen die de onmogelijke gebeurtenis, omdat geen enkele uitkomst element is van ∅ en deze gebeurtenis dus nooit optreedt.

-Een gebeurtenis {s} die slechts één uitkomst s bevat, een singleton, noemen we een elementaire gebeurtenis. Zo'n gebeurtenis is praktisch gesproken niet verschillend van de uitkomst s, maar formeel daarvan verschillend.

-Het complement (t.o.v. S) van A:

{\overline {A}}=A^{c}=S\setminus A

,

heet complementaire gebeurtenis van A, dus de gebeurtenis die optreedt als A niet optreedt.

-De vereniging A ∪ B van twee gebeurtenissen A en B is de gebeurtenis die optreedt als A optreedt of B optreedt.

-De doorsnede AB (= A ∩ B) van twee gebeurtenissen A en B is de gebeurtenis die optreedt als A en B (beide) optreden.

-Indien A ⊂ B (A is een deelverzameling van B), dan zeggen we: A impliceert B, dwz. als A optreedt, treedt ook B op.

In de kansrekening spelen gebeurtenissen die niet gelijktijdig kunnen optreden een belangrijke rol; we geven daarom de volgende definitie:

De gebeurtenissen A en B noemen we disjunct (of elkaar uitsluitend) als AB = ∅, dwz. A en B kunnen niet gelijktijdig optreden.

We kunnen deze definitie op voor de hand liggende wijze uitbreiden naar een rij gebeurtenissen, bestaande uit een aftelbaar aantal gebeurtenissen (A_i), dwz. de rij is eindig (A₁,A₂,...,A_n) of de rij is aftelbaar oneindig (A₁,A₂,...). In beide gevallen duiden we de rij aan met (A_i).

We spreken van een rij disjuncte (of elkaar uitsluitende) gebeurtenissen (A_i), als A_iA_j = ∅ voor elk mogelijk paar (i,j) waarvoor i ≠ j.

-Voor een rij gebeurtenissen (A_i) bedoelen we met $\bigcap A_{i}$ (zowel in het eindige als in het aftelbaar oneindige geval) de gebeurtenis die optreedt als elk van de gebeurtenissen A_i optreedt en met $\bigcup A_{i}$ de gebeurtenis die optreedt als ten minste een van de gebeurtenissen A_i optreedt.

De volgende eigenschappen van verzamelingen worden bekend geacht:

Stelling 1.1.1 (eigenschappen van gebeurtenissen)

(a) $A(B\cup C)=AB\cup AC;\,A\cup BC=(A\cup B)\cap (A\cup C)$

(b) $A\cup B=A\cup A^{c}B;\,B=AB\cup A^{c}B$

(c) $(\bigcup A_{n})^{c}=\bigcap A_{n}^{c};(\bigcap A_{n})^{c}=\bigcup A_{n}^{c};$ (regels van De Morgan).

De rij disjuncte gebeurtenissen (A_i) noemen we een partitie van de gebeurtenis B als

B=\bigcup A_{i}

. Een partitie wordt ook wel aangeduid als categorisch systeem.

Voorbeeld 8

Op een school zitten 1000 leerlingen waaronder 600 meisjes. De school bestaat uit de afdelingen MAVO, HAVO en VWO. Uit deze leerlingen wordt er één gekozen. Bij dit "experiment" kunnen we de volgende gebeurtenissen omschrijven:

M treedt op als de gekozen leerling een meisje is,

J treedt op als de gekozen leerling een jongen is,

A treedt op als de gekozen leerling MAVO volgt,

B treedt op als de gekozen leerling HAVO volgt,

C treedt op als de gekozen leerling VWO volgt.

De uitkomst van het experiment is een leerling s en de uitkomstenruimte S is de verzameling van alle 1000 leerlingen. M is een deelverzameling van S, namelijk de verzameling van alle meisjes, J die van alle jongens, A die van alle MAVO-leerlingen, enz. We zien nu onder meer het volgende:

J = M^c;
A ∪ B is de verzameling van leerlingen die MAVO of HAVO volgen, dus de gebeurtenis dat de gekozen leerling MAVO of HAVO volgt;
AB = ∅, dus A en B sluiten elkaar uit: de gekozen leerling kan niet tegelijk MAVO en HAVO volgen;
A ∪ B ∪ C = S, dus A, B en C vormen een partitie van S, dwz. een opdeling van S in elkaar uitsluitende gebeurtenissen.
M ∪ J = S; ook M en J vormen een partitie van S.
MC is de verzameling van meisjes die VWO volgen, dus de gebeurtenis dat de gekozen leerling een meisje is dat VWO volgt;
J ∪ B is de verzameling van leerlingen die van het mannelijk geslacht zijn of HAVO volgen.

1.2 Intuitief kansbegrip

Om tot een kansbegrip te komen, bespreken we eerst een tweetal intuïtieve benaderingswijzen van het begrip kans. Als eerste baseren we ons op het ervaringsfeit dat, als een uitkomst in bv. 30% van een lange reeks waarnemingen optreedt, we dit getal van 30% als de kans van optreden van die uitkomst interpreteren (Von Mises, 1920). We beschouwen daartoe een experiment waarbij de gebeurtenis $A$ kan optreden. Voeren we het experiment $n$ maal uit, dan noemen we de fractie keren dat de gebeurtenis $A$ optreedt, het frequentiequotiënt van $A$ bij $n$ uitvoeringen van het experiment.

Definitie 1.2.1

Het frequentiequotiënt $\mathrm {fq} (A)$ van de gebeurtenis $A$ bij $n$ herhalingen van een experiment is de fractie malen dat $A$ optreedt, dus

\mathrm {fq} (A)={\frac {N(A)}{n}}

;

daarin is $N(A)$ het aantal keren dat $A$ bij die $n$ herhalingen optreedt.

Voor vaste $n$ heeft het frequentiequotiënt de volgende eigenschappen.

Stelling 1.2.1 (eigenschappen van frequentiequotiënt)

Voor het frequentiequotiënt $\mathrm {fq} (A)$ van een gebeurtenis $A$ geldt:

(a)

\mathrm {fq} (A)\geq 0

(b)

\mathrm {fq} (S)=1

(c1) als

A

en

B

twee disjuncte gebeurtenissen zijn, is:

\mathrm {fq} (A\cup B)=\mathrm {fq} (A)+\mathrm {fq} (B)

(c2) algemeen geldt voor aftelbaar oneindig veel disjuncte gebeurtenissen

A_{1},A_{2},\ldots

dat:

\mathrm {fq} (\bigcup _{i=1}^{n}A_{i})=\sum _{i=1}^{n}\mathrm {fq} (A_{i})

.

Voorbeeld 1

We doen het volgende experiment. We voeren achtereenvolgens 1000 worpen met een munt uit en noteren voor elke $n=1,2,3,\ldots ,1000$ de waarde van $\mathrm {fq} (A)$ , waarbij $A$ de gebeurtenis "kruis komt boven" is. In figuur 1.2.1 staat de grafiek van $\mathrm {fq}$ getekend voor de eerste 35 worpen en in figuur 1.2.2 voor alle 1000 worpen.

Figuur 1.2.1 Diagram van $\mathrm {fq} (A)$ bij de eerste 35 worpen

Figuur 1.2.2 Diagram van $\mathrm {fq} (A)$ bij de eerste 1000 worpen

Uit figuur 1.2.1. zien we dat de uitkomsten van de eerste 35 worpen waren: KMKMM KKKMK MMKKM KMMMM KKKKK MKMKK KMKKK. Ook zien we dat de frequentiequotiënten in het begin (als $n$ nog klein is) vrij sterke schommelingen vertonen; echter als $n$ eenmaal vrij groot is, vertoont $\mathrm {fq} (A)$ niet veel variatie meer, zoals we kunnen zien in figuur 1.2.2. Het lijkt veeleer alsof $\mathrm {fq} (A)$ met toenemende $n$ tot een limietgetal nadert.

Wat we in het voorbeeld constateerden, is geen incidenteel verschijnsel; algemeen blijkt dat, wanneer we een zeer lange serie experimenten (van hetzelfde type) uitvoeren, van welke aard ook, de frequentiequotiënten op den duur steeds minder variëren en als het ware tot een limietgetal naderen. Dit experimenteel gevonden verschijnsel heet de experimentele wet van de grote aantallen.

Intuïtief correspondeert dit denkbeeldige limietgetal met de betekenis die we gewoonlijk aan het begrip kans hechten. Het geeft immers de fractie malen aan dat een gebeurtenis optreedt in een "oneindig lange" serie herhalingen van een experiment. Toch kunnen we op deze wijze niet het begrip kans invoeren, omdat we oneindig lange series experimenten nooit kunnen uitvoeren. We zullen later het begrip kans zo invoeren dat het de bovenstaande eigenschappen heeft.

Ook op andere wijze krijgen we een intuïtieve benadering van het kansbegrip. We laten dat zien aan het volgende voorbeeld.

Voorbeeld 2

We werpen een zuivere dobbelsteen (dwz. een exacte kubus, gemaakt van een homogeen materiaal en de 6 zijden voorzien van de ogenaantallen 1 tot en met 6, zonder de gewichtsverdeling te verstoren). Op grond van de (fysische) symmetrie van de dobbelsteen zeggen we dat elk van de mogelijke uitkomsten (ogenaantallen) 1 tot en met 6 gelijke kans van optreden heeft.

Definitie 1.2.2

Een experiment met een eindig aantal uitkomsten noemen we symmetrisch, als alle uitkomsten even waarschijnlijk zijn (dwz. als er geen voorkeur van optreden is voor een van de uitkomsten).

Het idee van symmetrie is wel geschikt voor een definitie van het begrip kans. Het werd geïntroduceerd door Laplace (1749-1827).

Definitie 1.2.3 (kansdefinitie van Laplace)

In een symmetrisch experiment wordt de kans op een gebeurtenis $A$ gegeven door de fractie voor $A$ gunstige (dwz. tot $A$ behorende) uitkomsten.

Voorbeeld 3

Voor een opiniepeiling wordt willekeurig een volwassen Nederlander uitgekozen uit de gehele bevolking. Omdat er willekeurig wordt gekozen, is er sprake van symmetrie. De kans dat de gekozen persoon uit Limburg komt, kunnen we dus berekenen als

{\frac {\mbox{aantal volwassen Limburgers}}{\mbox{aantal volwassen Nederlanders}}}

Eenvoudig is in te zien dat de kans volgens Laplace voldoet aan de voor het frequentiequotiënt genoemde eigenschappen.

Stelling 1.2.2

De kans volgens Laplace voldoet aan de eigenschappen 1.2.1.a - c.

Toch heeft de kansdefinitie van Laplace twee ernstige beperkingen. De definitie veronderstelt een eindige uitkomstenruimte, terwijl we ook experimenten in onze beschouwingen willen betrekken waarbij de uitkomstenruimte oneindig veel elementen bevat. Bovendien, al telt de uitkomstenruimte van een experiment eindig veel elementen, de veronderstelling dat iedere elementaire gebeurtenis dezelfde kans heeft, sluit zeker niet altijd aan bij de realiteit. We zoeken daarom naar een definitie van het begrip kans die meer algemeen is.

Opmerking 1

De frequentie-interpretatie van kansen is gebaseerd op een lange rij herhalingen van het experiment. Het is daarbij niet nodig dat dergelijke herhalingen werkelijk uitgevoerd worden. We denken ons in dat het experiment een groot aantal malen herhaald zou worden. Maar ook met deze ruime opvatting is de idee van herhaalbaarheid nogal eens gewrongen.

Opmerking 2

Een arts vertelt een patiënt dat de slaagkans van een operatie 80% is. Wat moeten we ons bij een dergelijke uitspraak voorstellen? Allereerst zouden we moeten weten waar een dergelijke uitspraak op gebaseerd is. Vaak is een dergelijke uitspraak niet erg gefundeerd. Beschouwen we echter de uitspraak op zichzelf en stellen we ons op het standpunt van de arts dan is een frequentie-interpretatie zeer wel denkbaar. Als de arts de operatie vele malen uitvoert, slaagt de operatie in zo'n 8 van de 10 gevallen. Stellen we ons op het standpunt van de patiënt, dan lijkt een dergelijke interpretatie niet erg zinvol. De patiënt ondergaat de operatie niet vele malen. Het is meestal een eenmalige aangelegenheid. Om toch een beeld te vormen van de betekenis van die 80%, doen we het volgende gedachte-experiment. In een kamer staat een bak met 100 knikkers, 80 witte en 20 zwarte. Er wordt op goed geluk één knikker uit de bak getrokken. Is de knikker wit, dan slaagt de operatie; is de knikker zwart, dan mislukt de operatie. Helaas wordt ons niet verteld of er een witte dan wel een zwarte knikker getrokken is.

Met een dergelijk beeld in het achterhoofd groeit, naarmate we meer voorbeelden en toepassingen tegenkomen, de operationele betekenis van de intuïtieve interpretatie van het begrip kans.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

1.3 Kans

In 1933 legde de Russische wiskundige A. N. Kolmogorov (1903-1987) in zijn boekje "Grundbegriffe der Wahrscheinlichkeitsrechnung" de basis voor de moderne kansrekening. Hierdoor kwamen de in de vorige paragrafen genoemde beperkingen te vervallen. Bij deze aanpak is een willekeurige (niet-lege) verzameling als uitkomstenruimte toegestaan. Zo is bv. de verzameling van alle reële getallen toegestaan, waardoor het o.a. mogelijk is dat er oneindig veel verschillende gebeurtenissen zijn. Voor de elementaire gebeurtenissen is niet meer vereist dat ze alle "gelijkelijk mogelijk" zijn. Kolmogorov poneerde drie axioma's waaraan een kans moet voldoen. Deze drie axioma's zijn het analogon van de eigenschappen 1.2.1.a - c uit paragraaf 2, waaraan het frequentiequotiënt zowel als de kans volgens Laplace voldoet.

Definitie 1.3.1 (axioma's van Kolmogorov)

Zij $S$ een willekeurige uitkomstenruimte. Een functie $P$ die aan elke gebeurtenis $A\subset S$ een reëel getal $P(A)$ toevoegt, noemen we een kans op $S$ , als $P$ voldoet aan de volgende eisen:

(a)

P(A)>0

voor elke gebeurtenis

A

;

(b)

P(S)=1

;

(c) voor elke aftelbaar oneindige rij disjuncte gebeurtenissen

(A_{i})

geldt:

P\left(\bigcup _{i=1}^{n}A_{i}\right)=\sum _{i=1}^{n}P(A_{i})

Op deze drie rekenregels voor kansen berust de gehele kansrekening!

Opmerking

De axioma's van Kolmogorov zijn van toepassing op willekeurige uitkomstenruimten. In dit boek zullen we ons echter alleen met discrete uitkomstenruimten bezighouden.

In de vorige paragraaf hebben we al opgemerkt dat een kans volgens de definitie van Laplace voldoet aan de axioma's en dus terecht de naam kans verdient. Op welke andere manieren kunnen we nu een kans construeren? Voor discrete uitkomstenruimten kunnen we op natuurlijke wijze de kans $p(s)=P(\{s\})$ op een elementaire gebeurtenis vastleggen door de kansfunctie $p$ .

Definitie 1.3.2

Zij $S$ een willekeurige (discrete) uitkomstenruimte. Een functie $p\colon S\to \mathbb {R}$ die aan iedere uitkomst $s$ een getal $p(s)$ , dat we ook kans op $s$ noemen, toevoegt, heet kansfunctie als:

p(s)\geq 0

en

\sum _{s\in S}p(s)=1

We kunnen nu bij een kansfunctie een kans definiëren, door de kans op een gebeurtenis te berekenen als de som van de kansen op de uitkomsten die tot die gebeurtenis behoren. Dat zo inderdaad een kans gedefinieerd is blijkt uit de volgende stelling.

Stelling 1.3.1

Als $p$ een kansfunctie is op de uitkomstenruimte $S$ , is de functie $P$ , gedefinieerd voor iedere gebeurtenis $A$ door:

P(A)=\sum _{s\in A}p(s)

een kans op $S$ .

Bij iedere kansfunctie $p$ op een discrete uitkomstenruimte $S$ hoort dus een kans $P$ op $S$ . Omgekeerd hoort bij iedere kans $P$ op een discrete uitkomstenruimte $S$ een kansfunctie $p$ op $S$ .

Stelling 1.3.2

Als P een kans is op de uitkomstenruimte $S$ , dan is de functie $p\colon S\to \mathbb {R}$ gedefinieerd door:

p(s)=P(\{s\})

een kansfunctie.

Uit het voorgaande blijkt dus dat kansen $P$ en kansfuncties $p$ op een-eenduidige wijze bij elkaar horen.

Definitie 1.3.3

Zij $S$ een uitkomstenruimte en $P$ een kans op $S$ , dan noemen we het paar $(S,P)$ een kansruimte. Ook het paar $(S,p)$ , waarin $p$ de bij $P$ behorende kansfunctie is, zullen we als kansruimte aanduiden.

Voorbeeld 1 (alternatief; vervolg)

De uitkomstenruimte is $S=\{K,M\}$ . We geven een willekeurige kansfunctie aan door $p(K)=1-p(M)=p$ , met $0\leq p\leq 1$ . Er zijn maar vier gebeurtenissen; de bij $p$ behorende kans $P$ kent daaraan de volgende kansen toe: $P(\varnothing )=0,\,P(\{K\})=p,\,P(\{M\})=1-p,\,P(S)=1$ . We kunnen de kansruimte ook in een tabel geven:

$s$	$K$	$M$	$S$
$p(s)$	$p$	$1-p$	1

Voorbeeld 2 (zuivere dobbelsteen; vervolg)

De uitkomstenruimte is $S=\{1,2,3,4,5,6\}$ . Voor een zuivere dobbelsteen is de kans op elke uitkomst gelijk, dus $p(1)=p(2)=...=p(6)=1/6$ . De bijbehorende kans $P$ is gedefinieerd volgens Laplace, dus is bv. $P(E)=3/6$ voor de gebeurtenis $E=\{2,4,6\}$ (we gooien een even ogenaantal) en $P(D)=2/6$ voor $D=\{1,2\}$ (we gooien minder dan 3). Als tabel ziet de kansruimte er als volgt uit:

$s$	1	2	3	4	5	6	totaal
$p(s)$	1/6	1/6	1/6	1/6	1/6	1/6	1

Voorbeeld 3 (twee worpen met een dobbelsteen; vervolg)

De uitkomstenruimte is $S=\{(i,j)|i=1,2,\ldots ,6{\text{ en }}j=1,2,\ldots ,6\}$ en voor een zuivere dobbelsteen zijn alle 36 uitkomsten even waarschijnlijk, dus is $p(s)=1/36$ voor alle $s\in S$ . De bijbehorende kans $P$ is weer gedefinieerd volgens Laplace; zo heeft de gebeurtenis $A=\{(1,3),(2,2),(3,1)\}$ (de som van de ogen van beide worpen is 4) een kans $P(A)=3/36$ van optreden.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

1.4 Eigenschappen van kansen

Uit de axioma's van Kolmogorov kunnen we enkele eigenschappen afleiden die het rekenen met kansen vereenvoudigen of overzichtelijker maken.

Stelling 1.4.1 (eigenschappen van kansen)

Omdat ∅ = ∅ ∪ ∅ ∪ ... geldt volgens axioma 1.3.1.c dat P(∅) = P(∅) + P(∅) + .... Uit deze gelijkheid volgt:

(a)

P(\varnothing )=0

Als A₁,A₂,...,A_n disjuncte gebeurtenissen zijn en we stellen A_k = ∅ voor k > n, dan volgt uit axioma 1.3.1.c, dat:

(b)

P\left(\bigcup _{i=1}^{n}A_{i}\right)=P\left(\bigcup _{i=1}^{\infty }A_{i}\right)=\sum _{i=1}^{\infty }P(A_{i})=\sum _{i=1}^{n}P(A_{i})

Voor elke twee gebeurtenissen A en B kunnen we schrijven B = AB ∪ A^cB; omdat AB en A^cB disjunct zijn, volgt uit b:

(c) P(B) = P(AB) + P(A^cB).

Kiezen we B = S in c, dan vinden we in het bijzonder:

(d) P(A^c) = 1 - P(A).

Is A ⊂ B dan is AB = A, zodat uit c volgt:

(e) als A ⊂ B, dan is P(A) ≤ P(B).

Tevens volgt uit c dat in het algemeen geldt:

(f) P(A∪B) = P(A) + P(A^cB) = P(A) + P(B) - P(AB).

Uit f blijkt weer dat (ongelijkheid van Boole):

(g) P(A∪B) ≤ P(A) + P(B).

Opmerking 1

Eigenschap b is niet equivalent met axioma 1.3.1.c. Het voert echter te ver om hier nader op in te gaan.

Voorbeeld 1

We werpen net zolang een zuivere dobbelsteen tot we zes gooien. Hoe groot is de kans dat we meer dan drie keer moeten werpen? Als uitkomstenruimte nemen we {1,2,3,...}, waarin we de uitkomst "n keer werpen" aangeven door n, en als kansfunctie p(n) = (5/6)^n-1(1/6). Laat A de gebeurtenis "meer dan drie keer werpen" zijn. De gevraagde kans is dan P(A) = p(4) + p(5) + p(6) + ... Het is nu gemakkelijker om naar het complement van A te kijken; immers P(A^c) = p(1) + p(2) + p(3) = 1/6 + 5/36 + 25/216 = 91/216, zodat P(A) = 1 - P(A^c) = 125/216. We zullen later zien dat we deze kans ook kunnen bepalen door de gevraagde gebeurtenis op te vatten als "de eerste drie worpen geen zes". Bij elke worp is de kans 5/6 dat we geen zes gooien en we zullen dan zien dat we de gevraagde kans door vermenigvuldiging van deze kansen moeten berekenen, dus als (5/6)³ = 125/216.

Voorbeeld 2

In een bepaalde stad leest 30% van de inwoners krant A, 20% krant B en 5% is geabonneerd op beide kranten. Wat is de kans dat een willekeurig gekozen inwoner tenminste een van beide kranten leest? Er geldt: P(A∪B) = P(A) + P(B) - P(AB) = 0,3 + 0,2 - 0,05 = 0,45.

Eigenschap f laat zich gemakkelijk generaliseren naar meer dan twee gebeurtenissen. Begripsmatig is deze generalisatie niet ingewikkeld, maar wel het opschrijven ervan; we zullen dit dan ook alleen expliciet doen voor drie gebeurtenissen. Door herhaald toepassen van f volgt dan:

Stelling 1.4 (algemene somregel)

Voor een drietal gebeurtenissen A, B en C geldt:

P(A∪B∪C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC).

Voorbeeld 3 (ONS DORP)

In ONS DORP, een dorp van 8123 inwoners, is een bloeiend cultureel leven, hetgeen blijkt uit het bestaan van drie toneelverenigingen: ACHTER DE COULISSEN (A) met 42 leden, BURGERTONEEL (B) met 30 leden en de CHRISTELIJKE TONEELVERENIGING (C) met 57 leden. Hoe groot is de kans dat een willekeurig gekozen dorpsbewoner toneel speelt? Die kans is niet (42+30+57)/8123, want 10 dorpsbewoners zijn lid van A zowel als van B, 12 zijn lid van A zowel als van C, 9 van B zowel als van C en 8 zijn zelfs lid van alle drie toneelverenigingen. We vinden dus: P(A∪B∪C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC) = (42 + 30 + 57 - 10 - 12 - 9 + 8)/8123 = 106/8123.

2.1 Inleiding

In het voorgaande hoofdstuk hebben we al gesproken over symmetrie, dwz. over situaties waarin alle uitkomsten gelijke kans hebben. Als voorbeeld zijn we het werpen van een zuivere munt of zuivere dobbelsteen tegengekomen. Symmetrie komen we vaker tegen, zoals in de belangrijke gevallen van het lukraak trekken van knikkers (loten) uit een vaas. Uiteraard kunnen er in het geval van symmetrie maar eindig veel uitkomsten zijn.

Definitie 2.1.1

Een kansruimte (S,p) noemen we symmetrisch als S eindig is en iedere uitkomst s ∈ S gelijke kans heeft.

Aangezien we in dit hoofdstuk veel over het aantal uitkomsten in een gebeurtenis zullen spreken, voeren we een aparte notatie in voor het aantal elementen van een verzameling

Definitie 2.1.2

Het aantal elementen van een verzameling A geven we aan door #A.

Omdat de som van alle kansen op uitkomsten in een uitkomstenruimte gelijk is aan 1, heeft elke uitkomst s in een symmetrische kansruimte een kans p(s) = 1/#S.

Stelling 2.1.1

In een symmetrische kansruimte (S,p) wordt de kansfunctie p gegeven door:

p(s)={\frac {1}{\#S}}

,

voor alle s ∈ S.

De kans P(A) op een gebeurtenis A is in een symmetrische kansruimte juist de kans volgens de definitie van Laplace. We kunnen de kans op A bepalen door te tellen hoeveel uitkomsten tot A behoren (gunstig zijn voor A) en dat aantal te delen door het totale aantal mogelijke uitkomsten.

Stelling 2.1.2 (kansdefinitie van Laplace)

In een symmetrische kansruimte wordt de kans op een gebeurtenis A gegeven door

P(A)={\frac {\#A}{\#S}}

Bewijs:

P(A)=\sum _{s\in A}p(s)=\sum _{s\in A}{\frac {1}{\#S}}={\frac {\#A}{\#S}}

We bespreken nu enkele voorbeelden van symmetrische kansruimten.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)

De uitkomstenruimte S bestaat uit de 36 paren (s₁,s₂), met s_i= 1,2,...,6. Omdat de dobbelsteen zuiver is en we er lukraak mee gooien, zullen alle 36 uitkomsten dezelfde kans hebben. Dit experiment beschrijven we dus met een symmetrische kansruimte; dwz. de kansfunctie p is eenvoudigweg voor alle 36 uitkomsten gelijk en wel: p(s₁,s₂) = 1/36. Wat is de kans dat het totaal aantal geworpen ogen gelijk is aan 4? Die gebeurtenis noemden we A, dus P(A) = #A/#S = 3/36, want 3 van de 36 uitkomsten zijn gunstig voor A.

Voorbeeld 2

Op de school van voorbeeld 7 uit par. 1.1 wordt willekeurig één leerling gekozen uit het totaal van 1000 leerlingen. Dat we willekeurig kiezen, betekent dat elke leerling dezelfde kans heeft om gekozen te worden; die kans is dus 1/1000. We hebben te maken met een symmetrische kansruimte. De gebeurtenis dat deze leerling een meisje is, duiden we aan met M; dan is P(M) = 600/1000 = 0,6.

Voorbeeld 3

Uit een spel van 52 kaarten trekken we lukraak één kaart. Er is weer symmetrie. We berekenen bv.:

P("ruiten") = aantal ruiten / totaal aantal = 13/52 = 1/4,

P("aas") = 4/52 = 1/13

en

P("ruiten" of "aas") = 16/52 = 4/13.

De laatste kans kunnen we ook berekenen met de algemene somregel, dan is:

P("ruiten" of "aas") = P("ruiten") + P("aas") - P("ruitenaas") = 13/52 + 4/52 - 1/52 = 16/52.

Voor we beslissen dat er bij een experiment sprake is van symmetrie, dienen we ons er terdege van te overtuigen dat het experiment zo is ingericht dat inderdaad alle uitkomsten even waarschijnlijk zijn. Het volgende historische voorbeeld laat zien hoe hier gemakkelijk fouten kunnen ontstaan.

Voorbeeld 4

We werpen tegelijk twee munten. De uitkomsten kunnen we voorstellen door 2×kruis, 1×kruis en 0×kruis. D'Alembert (1717-1783) stelde ten onrechte dat de bijbehorende kansruimte symmetrisch is.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

2.2 Combinatorische kansrekening

Veel problemen in de kansrekening kunnen worden opgelost door gebruik te maken van symmetrie, dus door de kansdefinitie van Laplace toe te passen. Het berekenen van kansen komt dan neer op het tellen van uitkomsten. Het zal duidelijk zijn dat de theorie van het tellen, de combinatoriek, een belangrijk hulpmiddel in de kansrekening is. In dit hoofdstuk zullen we een aantal belangrijke resultaten uit de combinatoriek herhalen en toepassen in de kansrekening.

Telkens blijkt goed tellen toch meer een kunst te zijn, dan op het eerste gezicht het geval lijkt. Een eerste moeilijkheid doet zich voor als er een of andere opsplitsing van het probleem is gebruikt en de vraag opduikt of we in dat het geval het totale aantal verkrijgen door optelling dan wel door vermenigvuldiging. Het antwoord luidt - uiteraard - dat het afhangt van de aard van de opsplitsing. De beide volgende stellingen geven hierover uitsluitsel.

Stelling 2.2.1 (speciale somregel)

Voor de vereniging van een collectie disjuncte verzamelingen A₁,A₂,...,A_n geldt: #(A₁∪A₂∪...∪A_n) = #A₁+#A₂+...+#A_n.

Als we het aantal elementen van elke A_i geteld hebben en de A_i's hebben onderling geen gemeenschappelijke elementen, dan hoeven we niet opnieuw te gaan tellen om het totale aantal elementen te bepalen, maar kunnen we gewoon de afzonderlijke aantallen bij elkaar optellen. We kunnen zeggen dat we moeten optellen als de verschillende mogelijkheden naast elkaar kunnen voorkomen, dus de een of de ander.

In de bovenstaande regel ligt een bron van veel fouten besloten. Er wordt nogal eens over het hoofd gezien dat geëist wordt dat de verzamelingen disjunct zijn. Is dat niet het geval, dan moeten we de algemene somregel gebruiken. Voor twee verzamelingen luidt die:

Stelling 2.2.2 (algemene somregel)

Voor een tweetal verzamelingen A en B geldt: #(A∪B) = #A + #B – #AB

Het totale aantal elementen in A en B verkrijgen we door de afzonderlijke aantallen bij elkaar optellen en te verminderen met het aantal gezamenlijke elementen; die gezamenlijke elementen zouden we anders dubbel tellen.

De algemene somregel kan, op analoge wijze als de overeenkomstige somregel voor kansen, op voor de hand liggende wijze worden uitgebreid naar meer dan twee verzamelingen. We geven alleen een voorbeeld.

Voorbeeld 1 (ONS DORP; vervolg)

In ONS DORP zijn drie toneelverenigingen, A met 42 leden, B met 30 leden en C met 57 leden. Hoeveel dorpsbewoners spelen toneel? Dat zijn er niet 30+42+57, want 10 dorpsbewoners zijn lid van A zowel als van B, 12 zijn lid van A zowel als van C, 9 van B zowel als van C en 8 zijn zelfs lid van alle drie toneelverenigingen. We vinden dus: #(A∪B∪C) = #A + #B + #C – #AB – #AC – #BC + #ABC = 106.

Voorbeeld 2

We werpen driemaal een zuivere dobbelsteen. Voor de uitkomstenruimte S geldt #S = 6³ = 216. Zij A de gebeurtenis dat we tenminste één keer zes gooien. Er geldt dat A = A₁∪ A₂∪ A₃, waarin A_i de gebeurtenis is dat de ie worp (i=1,2,3) een zes opleverde. Omdat de gebeurtenissen A₁, A₂ en A₃ geen disjunct drietal vormen, mogen we niet de speciale somregel toepassen op dit drietal. Wel kunnen we deze regel toepassen op een partitie van A. Daartoe delen we A op in disjuncte stukken:

A=A_{1}A_{2}^{c}A_{3}^{c}\cup A_{1}^{c}A_{2}A_{3}^{c}\cup A_{1}^{c}A_{2}^{c}A_{3}\cup A_{1}A_{2}A_{3}^{c}\cup A_{1}A_{2}^{c}A_{3}\cup A_{1}^{c}A_{2}A_{3}\cup A_{1}A_{2}A_{3}

zodat volgt:

\#A=\#A_{1}A_{2}^{c}A_{3}^{c}+\#A_{1}^{c}A_{2}A_{3}^{c}+\#A_{1}^{c}A_{2}^{c}A_{3}+\#A_{1}A_{2}A_{3}^{c}+\#A_{1}A_{2}^{c}A_{3}+\#A_{1}^{c}A_{2}A_{3}+\#A_{1}A_{2}A_{3}=

=25+25+25+5+5+5+1=91

.

Dit antwoord kan ook verkregen worden door op te merken dat A de gebeurtenis is dat er geen zes bij de drie worpen is; dan is dus #A^c = 5³ = 125 en #A = #S – #A^c = 216 – 125 = 91. We kunnen #A ook door toepassing van de algemene somregel bepalen:

\#A=\#A_{1}+\#A_{2}+\#A_{3}-\#A_{1}A_{2}-\#A_{1}A_{3}-\#A_{2}A_{3}+\#A_{1}A_{2}A_{3}=

=36+36+36-6-6-6+1=91

.

Als een experiment bestaat uit het uitvoeren van n deelexperimenten en het aantal mogelijke uitkomsten van elk deelexperiment is onafhankelijk van het resultaat van de overige deelexperimenten, dan vinden we het totale aantal mogelijke uitkomsten door de afzonderlijke aantallen met elkaar te vermenigvuldigen. We moeten vermenigvuldigen als de verschillende mogelijkheden tegelijkertijd moeten voorkomen, dus de een en de ander.

Het kan echter ook zijn dat we iedere mogelijkheid van het ene experiment weliswaar niet kunnen combineren met alle mogelijkheden van een ander, maar wel met een gelijk aantal mogelijkheden van het andere experiment. Ook dan krijgen we het totale aantal mogelijkheden door vermenigvuldiging. De productregel zegt hierover:

Stelling 2.2.3 (productregel)

Als ieder van de n₁ uitkomsten van een eerste experiment gecombineerd kan worden met een gelijk aantal uitkomsten n₂ van een tweede experiment en elk van deze combinaties weer met een gelijk aantal uitkomsten n₃ van een derde, etc., dan wordt het totale aantal uitkomsten gegeven door het product n₁× n₂× n₃×... van deze aantallen.

Een toepassing van de productregel is:

Stelling 2.2.4

Voor het Cartesisch product van de verzamelingen A₁,A₂,...,A_n geldt dus volgens de productregel: #(A₁× A₂×...× A_n) = #A₁× #A₂× ... × #A_n.

Voorbeeld 3

Op een menukaart staan 3 voorgerechten, 5 hoofdgerechten en 4 nagerechten. Hoeveel menu's van 3 gangen kunnen we van de kaart samenstellen? De productregel zegt dat er 3 × 5 ×4 = 60 menu's mogelijk zijn.

Voorbeeld 4

De 3 voorgerechten op de menukaart laten zich elk combineren met 4 van de 5 hoofdgerechten en elk van deze combinaties met slechts 2 van de 4 nagerechten. Volgens de productregel zijn er dan nog 3×4×2 = 24 menu's van 3 gangen mogelijk.

De productregel maakt het mogelijk te bepalen hoeveel verschillende rangschikkingen er mogelijk zijn van een aantal onderscheidbare objecten. Een rangschikking heet permutatie en het aantal permutaties van n dingen blijkt volgens de productregel gelijk te zijn aan n! (n faculteit, het product van de getallen 1 tot en met n).

Definitie 2.2.1

Onder een permutatie van n onderscheidbare objecten verstaan we een rangschikking op volgorde van die objecten.

Voorbeeld 5

De permutaties van de cijfers 1, 2 en 3 zijn: 123, 132, 213, 231, 312 en 321.

Stelling 2.2.5

Het aantal permutaties van n onderscheidbare objecten is gelijk aan n!.

Voorbeeld 5 (vervolg)

Inderdaad bleken er 3! = 6 permutaties te zijn van de drie getallen 1, 2 en 3.

We beschouwen nu het volgende - klassieke en karakteristieke - combinatorische probleem: hoeveel verschillende resultaten zijn er mogelijk als we uit een verzameling van n onderscheidbare elementen er k kiezen? Het antwoord zal afhangen van de wijze waarop we de trekkingen verrichten, nl. met of zonder terugleggen, en van de manier waarop we tegen de resultaten aankijken, nl. geordend of ongeordend. In figuur 2.1 is dit schematisch in beeld gebracht. De volgende voorbeelden illustreren de diverse mogelijkheden.

Voorbeeld 6

Uit de 100 leden van de vereniging COMBI moet een bestuur van 3 leden gekozen worden. Het bestuur bestaat uit voorzitter, secretaris en penningmeester. Twee functies kunnen niet in één persoon verenigd zijn. We moeten dus trekkingen zonder terugleggen verrichten en het resultaat moet geordend zijn. Hoeveel besturen zijn er mogelijk? Dat zijn er 100×99×98 = 100!/(100-3)!; we kunnen het bestuur samenstellen door eerst de voorzitter te kiezen, hiervoor zijn 100 mogelijkheden, daarna de secretaris, waarvoor nog 99 mogelijkheden zijn en tenslotte de penningmeester, met nog 98 mogelijkheden. We kunnen een mogelijkheid beschrijven door de namen van de bestuursleden in volgorde van de functies te vermelden; zo'n mogelijkheid heet variatie.

Voorbeeld 7

Voor het komende lustrum kiest COMBI een feestcommissie bestaande uit 3 leden. De leden van de feestcommissie hebben geen verschillende taak. We moeten trekken zonder terugleggen, maar het resultaat hoeft niet geordend te zijn. Net als in het vorige voorbeeld kunnen we op 100!/97! een geordend drietal kiezen; echter de ordening is nu niet van belang, zodat de 3! rangschikkingen van elk zo'n drietal dezelfde commissie voorstelt. Er zijn dus $100!/(3!97!)={\tbinom {100}{3}}$ mogelijkheden. We kunnen een mogelijkheid beschrijven door de namen van de drie leden te vermelden; de volgorde van de namen is niet van belang. Een mogelijkheid heet combinatie (of greep).

Voorbeeld 8

Bij COMBI moeten 3 verschillende klussen gedaan worden. Het bestuur vraagt de leden om vrijwilligers. Omdat een lid best meer dan één klus kan doen, moeten we nu trekken met terugleggen; wel moet het resultaat geordend zijn aangezien de klussen verschillen. We kiezen nu achtereen- volgens steeds een lid uit de 100 voor elk der klussen; er zijn dus 100×100×100 = 100³ mogelijkheden. We kunnen een mogelijkheid beschrijven door bij elke klus de naam te vermelden van degene die de klus uitvoert; de vermelde namen hoeven nu niet verschillend te zijn. Een mogelijkheid heet hier herhalingsvariatie.

Voorbeeld 9

Voor het lustrum bij COMBI moeten 3 biertonnen opgeschilderd worden. De feestcommissie vraagt de leden om vrijwilligers. Nu zijn de klussen niet van elkaar te onderscheiden, zodat het resultaat niet geordend hoeft te zijn; we moeten wel weer trekken met terugleggen. We beschrijven het resultaat op eenduidige wijze door voor elk van de 100 leden te vermelden hoeveel biertonnen hij zal opschilderen. We kunnen dit schematisch doen door de biertonnen voor te stellen door een o en de biertonnen voor de opgestelde leden neer te zetten; tussen de leden zetten we een streep |. Een mogelijkheid is dan bv.

1

2

3

4

5

\cdots

100

\mid

\mid

\circ

\mid

\mid

\circ \circ

\mid

\cdots

\mid

hetgeen wil zeggen dat lid 1 geen bierton opschildert, evenals lid 2; nr 3 schildert één ton op, nr 4 weer geen, nr 5 schildert 2 tonnen op en de overigen geen. Elke mogelijkheid bestaat dus uit een rijtje van 3 nullen (de tonnen) en 99 enen (de scheidingsstrepen); er zijn

{100-1+3 \choose 3}={102 \choose 3}

van zulke rijtjes. Hier heet een mogelijke uitkomst herhalingscombinatie.

De bovenstaande voorbeelden beschrijven we wel mbv. een vaasmodel. We trokken drie keer uit een vaas met 100 genummerde knikkers, de ene keer met terugleggen, de andere keer zonder terugleggen. In twee gevallen beschouwden we geordende drietallen als uitkomsten, in twee andere gevallen ongeordende. In de volgende figuur is een en ander schematisch weergegeven.

Figuur 2.1. Trekkingen uit een vaas.

In de voorbeelden kwamen de volgende begrippen en resultaten aan de orde.

Definitie 2.2.2

Onder een variatie van k uit n (onderscheidbare objecten) verstaan we de uitkomst van een geordende trekking zonder terugleggen van k van de n objecten.

Stelling 2.2.6

Het aantal variaties van k uit n is gelijk aan n!/(n–k)!.

Definitie 2.2.3

Onder een combinatie (of greep) van k uit n onderscheidbare objecten verstaan we de uitkomst van een ongeordende trekking zonder terugleggen van k van de n objecten.

Stelling 2.2.7

Het aantal combinaties van k uit n is gelijk aan:

{n \choose k}={\frac {n!}{k!(n-k)!}}

.

Definitie 2.2.4

Onder een herhalingsvariatie van k uit n onderscheidbare objecten verstaan we de uitkomst van een geordende trekking met terugleggen van k van de n objecten.

Stelling 2.2.8

Het aantal herhalingsvariaties van k uit n is gelijk aan n^k.

Definitie 2.2.5

Onder een herhalingscombinatie van k uit n onderscheidbare objecten verstaan we de uitkomst van een ongeordende trekking met terugleggen van k van de n objecten.

Stelling 2.2.9

Het aantal herhalingscombinaties van k uit n is gelijk aan:

{n-1+k \choose k}

.

In het volgende schema geven we een overzicht van het trekken van k elementen uit een verzameling (vaas) van n onderscheidbare elementen (knikkers).

uitkomst	trekking
uitkomst	zonder terugleggen	met terugleggen
geordend	variatie	herhalings- variatie
ongeordend	combinatie	herhalings- combinatie

In het volgende voorbeeld hebben we het geval n=4 en k=3 helemaal uitgeschreven.

Voorbeeld 10

123 132 213 231 312 321	124 142 214 241 412 421	134 143 314 341 413 431	234 243 324 342 423 432\|	24 variaties (rijtjes) 4 combinaties (hokjes)								64 herhalings─ variaties (rijtjes) 20 herhalings─ combinaties (hokjes)

112 121 211	113 131 311	114 141 411	221 212 122	223 232 322	224 242 422	331 313 133	332 323 233	334 343 433	441 414 144	442 424 244	443 434 344

111	222	333	444

In het vaasmodel denken we ons de trekkingen altijd aselect, dwz. bij iedere trekking hebben de resterende knikkers alle gelijke kans om getrokken te worden. We realiseren aselecte trekkingen door de vaas goed te schudden en er willekeurig (blindelings, lukraak) een knikker uit te trekken.

Definitie 2.2.6

Onder een aselecte trekking uit een populatie verstaan we een symmetrisch experiment met die populatie als uitkomstenruimte.

Aselecte trekkingen leiden in de gevallen van variaties, combinaties en herhalingsvariaties tot symmetrische kansruimten. We zullen pas in een volgend hoofdstuk, na de invoering van het begrip voorwaardelijke kans, het waarom hiervan goed kunnen inzien. Voorlopig, en dat ligt ook in de lijn van dit hoofdstuk, zullen we ons moeten beroepen op de symmetrie van de situatie. In het geval van herhalingscombinaties ontstaat geen symmetrie ondanks aselect trekken!

Stelling 2.2.10

Als we k keer aselect trekken uit een verzameling van n verschillende elementen, dan is de kansruimte in de volgende gevallen symmetrisch:

(a) trekken zonder terugleggen, geordende uitkomsten:

S={variaties},

\#S={\frac {n!}{(n-k)!}}

;

(b) trekken zonder terugleggen, ongeordende uitkomsten:

S={combinaties},

\#S={n \choose k}={\frac {n!}{k!(n-k)!}}

;

(c) trekken met terugleggen, geordende uitkomsten:

S={herhalingsvariaties},

\#S=n^{k}

;

De ontstane kansruimte is niet symmetrisch in geval:

(d) trekken met terugleggen, ongeordende uitkomsten.

Bewijs: De gevallen a, b en c volgen op grond van de symmetrie in de uitkomsten. In het geval d vatten we de uitkomsten op als gebeurtenissen in de kansruimte van de herhalingsvariaties. De uitkomst (k,0,...,0), dus k keer is object nummer 1 getrokken, komt dan overeen met de gebeurtenis {(1,1,...,1)} bij de herhalingsvariaties en heeft dus een kans 1/nk. De uitkomst (k-1,1,0,...,0), dus k-1 keer is object nummer 1 en 1 keer nummer2 getrokken, komt overeen met de gebeurtenis {(1,1,...,1,2),(1,1,...,1,2,1),...,(2,1,...,1)} en bevat k elementen, nl. alle herhalingsvariaties met k-1 keer een 1 en 1 keer een 2; de kans hierop is k/n^k.

We geven nu enkele toepassingen.

Voorbeeld 11

We trekken lukraak achtereenvolgens (dus geordend resultaat₀ zonder terugleggen k knikkers uit een vaas met n genummerde knikkers. Wat is de kans dat de eerste getrokken knikker nummer i is? De uitkomsten zijn variaties en de kansruimte is symmetrisch; #S = n!/(n–k)!. De gebeurtenis dat de eerste knikker nummer i heeft, noemen we A; A bevat alle variaties met op de 1e plaats nummer i. De uitkomsten uit A kunnen we krijgen door als eerste knikker nummer i te pakken en vervolgens nog k–1 andere, dus nog een variatie van k–1 uit n–1. A bevat dus (n–1)!/(n–k)! uitkomsten. De gevraagde kans is: P(A) = #A/#S = 1/n, hetgeen ons niet zal verbazen.

Hoe groot is de kans dat de tweede getrokken knikker nummer i is? Op dezelfde manier beredeneren we dat deze gebeurtenis, zeg B, de variaties bevat met op de tweede plaats nummer i. Dat zijn er evenveel als in A; zet nummer i alvast op de tweede plaats en vul de overige plaatsen met een variatie van k–1 uit n–1. We vinden dus P(B) = P(A) = 1/n.

Op analoge wijze vinden we dat de kans dat de knikker die als je getrokken wordt, nummer i is, steeds 1/n is.

De kans dat nummer i getrokken wordt, is P("nummer i") = P("nummer i als 1^e" of "als 2^e" of ... of "als k^e") = = P("als 1^e") + P("als 2^e") + ... + P("als k^e") = k/n.

Voorbeeld 12

We trekken lukraak zonder op de volgorde te letten en zonder terugleggen k knikkers uit een vaas met n genummerde knikkers. De uitkomsten zijn combinaties en de kansruimte is symmetrisch;

\#S={n \choose k}

.

P("nummer i wordt getrokken") =

{\frac {n-1 \choose k-1}{n \choose k}}={\frac {k}{n}}

,

want de bedoelde gebeurtenis bevat de combinaties waar nummer i bij is. We krijgen die combinaties door nummer i alvast te pakken en aan te vullen met een combinatie van k–1 uit de overige n. Merk op dat deze kans dezelfde is als bij het vorige voorbeeld.

Voorbeeld 13

We trekken lukraak uit een goed geschud kaartspel een tiental kaarten. Er is dus sprake van ongeordende uitkomst en trekken zonder terugleggen. De kansruimte is symmetrisch. Wat is de kans dat bij de getrokken tien kaarten 2 azen en 3 heren zijn? We geven de situatie schematisch weer:

	azen	heren	rest	totaal
populatie	4	4	44	52
steekproef	2	3	5	10

In totaal zijn er ${52 \choose 10}$ mogelijke uitkomsten (combinaties); de genoemde gebeurtenis kan op ${4 \choose 2}{4 \choose 3}{44 \choose 5}$ manieren gerealiseerd worden, dus de gevraagde kans is:

{\frac {{4 \choose 2}{4 \choose 3}{44 \choose 5}}{52 \choose 10}}=0,0016

.

Voorbeeld 14 (sinterklaaslootjes; enveloppe-probleem)

Met sinterklaas stoppen n mensen een briefje met hun naam in een hoge hoed. Na goed schudden trekt elk er lukraak weer een lootje uit. Hoe groot is de kans p_n dat niemand z'n eigen naam trekt? (Als enveloppe-probleem: een secretaresse stopt n brieven lukraak in de reeds geadresseerde enveloppen.) Noem A_i de gebeurtenis dat nummer i z'n eigen naam trekt; dan is de gevraagde kans:

p_{n}=P({\overline {A_{1}\cup A_{2}\cup ...\cup A_{n}}})=1-P(A_{1}\cup A_{2}\cup ...\cup A_{n})=

=1-\left(\sum P(A_{i})-\sum P(A_{i}A_{j})+\sum P(A_{i}A_{j}A_{k})-....\pm P(A_{1}A_{2}...A_{n})\right)=

=1-{n \choose 1}{\frac {(n-1)!}{n!}}+{n \choose 2}{\frac {(n-2)!}{n!}}-{n \choose 3}{\frac {(n-3)!}{n!}}+\ldots \pm {n \choose n}{\frac {0!}{n!}}=

=1-{\frac {n \choose 1}{n}}+{\frac {n \choose 2}{n(n-1)}}-{\frac {n \choose 3}{n(n-1)(n-2)}}+\ldots \pm {\frac {n \choose n}{n!}}=

=1-\left({\frac {1}{1!}}-{\frac {1}{2!}}+\ldots \pm {\frac {1}{n!}}\right)\approx {\frac {1}{e}}\approx 0{,}368

De kans p_n verandert vanaf n = 6 à 7 niet veel meer; 1/e is dan al een goede benadering.

In een tabel:

$n$	1	2	3	4	5	6	7	...
$p_{n}$	0	0,500	0,333	0,375	0,367	0,365	0,365	...

Het geval van het ongeordend trekken zonder terugleggen van k knikkers uit een vaas met n knikkers, kunnen we ook beschrijven als het verdelen van de n knikkers uit de vaas in twee groepen ter grootte van k en n–k, nl. de wel getrokken k en de niet getrokken n–k. We generaliseren dit experiment door de knikkers te verdelen in m groepen met aantallen n₁,n₂,...,n_m, waarvoor dus geldt: n₁+ n₂+...+ n_m= n. We doen dit door de knikkers te rangschikken, hetgeen kan op n! manieren, en de eerste n₁ aan groep 1 toe te wijzen, de volgende n₂ aan groep 2, etc. Omdat de volgorde van de n₁ knikkers in groep 1 er niet toe doet (er zijn n₁! rangschikkingen) en evenzo niet voor de andere groepen, is het totaal aantal verdelingen over de m groepen, de zgn. multinomiaalcoëfficiënt.

Definitie 2.2.7

Onder de multinomiaalcoëfficiënt ${n \choose n_{1},n_{2},...,n_{m}}$ verstaan we het aantal manieren om n onderscheidbare objecten te verdelen in m groepen met aantallen n₁,n₂,...,n_m, waarvoor n₁+ n₂+...+ n_m= n.

Stelling 2.2.11

Voor de multinomiaalcoëfficiënt geldt:

{n \choose n_{1},n_{2},...,n_{m}}={\frac {n!}{n_{1}!n_{2}!\cdots n_{m}!}}

De tweede schrijfwijze van de multinomiaalcoëfficiënt in deze stelling laat zien dat we de stelling ook kunnen bewijzen door de verschillende groepen achtereenvolgens te vullen met het juiste aantal knikkers.

Voorbeeld 15

Op hoeveel manieren kunnen we 30 personen verdelen over 4 groepen van resp. 6, 7, 8 en 9 personen? Dit kan op

{30 \choose 6,7,8,9}={\frac {30!}{6!7!8!9!}}={30 \choose 6}{24 \choose 7}{17 \choose 8}{9 \choose 9}

manieren. De laatste schrijfwijze laat zien hoe de 4 groepen achtereenvolgens gevuld worden. We kunnen daarvoor ook schrijven:

{30 \choose 24}{24 \choose 17}{17 \choose 9}{9 \choose 0}

daarmee suggererend dat we de gewenste verdeling tot stand brengen door steeds de overblijvende personen weg te nemen.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

3.1 Voorwaardelijke kans

Het komt dikwijls voor dat over de uitkomst van een experiment tevoren al iets bekend is of iets verondersteld wordt. Als we een willekeurige voorbijganger in Amsterdam aanspreken, dan is de kans dat hij op de PVDA stemt een andere dan voor iemand uit Wassenaar. We kunnen ons het experiment zo voorstellen dat we lukraak een Nederlander aanwijzen, echter als extra voorwaarde stellen dat hij in Amsterdam moet wonen. Onder deze voorwaarde kunnen we vragen naar de kans dat hij op de PVDA stemt. Deze "kans" is niet een kans zoals we die tot nu toe kennen. Er is een nieuwe definitie nodig voor dit begrip. In het voorbeeld vragen we naar de voorwaardelijke kans dat een willekeurige Nederlander op de PVDA stemt, gegeven dat hij in Amsterdam woont. Intuïtief ligt het voor de hand om deze voorwaardelijke kans gelijk te stellen aan de kans dat een willekeurige Amsterdammer op de PVDA stemt. Als we met A de Nederlanders aangeven die op de PVDA stemmen en met B de Amsterdammers, dan is deze voorwaardelijke kans gelijk aan #AB/#B, waarbij #B het aantal Amsterdammers is en #AB het aantal daarvan dat op de PVDA stemt. We duiden deze voorwaardelijke kans aan met P(A|B); als N het totale aantal Nederlanders is, geldt:

P(A|B)={\frac {\#AB}{\#B}}={\frac {\#AB/N}{\#B/N}}={\frac {P(AB)}{P(B)}}.

Op deze manier kunnen we de voorwaardelijke kans uitdrukken in onvoorwaardelijke kansen. Dit intuïtieve resultaat voor deze symmetrische kansruimte gebruiken we nu als definitie van het begrip voorwaardelijke kans voor willekeurige kansruimten.

Definitie 3.1.1
Als A en B gebeurtenissen zijn en P(B) > 0, dan noemen we:

P(A|B)={\frac {P(AB)}{P(B)}}

de voorwaardelijke kans op A gegeven B. We spreken ook wel van de kans op A onder de voorwaarde B.

Opmerking 1
De notatie P(A|B) voor de voorwaardelijke kans op de gebeurtenis A gegeven de gebeurtenis B is historisch bepaald, maar kan gemakkelijk verwarrend werken. Zo moeten we dit niet lezen als de kans P op de gebeurtenis (?) "A|B". Het zou logischer zijn om P_B(A) te schrijven, daarmee aanduidend dat het gaat om een andere kans, nl. P_B, en niet om de (onvoorwaardelijke) kans P zelf. Het heeft echter nadelen om gecompliceerde gebeurtenissen B als index aan P te hangen, zodat we de notatie P(A|B) handhaven.

Voorbeeld 1
We trekken geordend en zonder terugleggen lukraak 5 keer een knikker uit een vaas met 10 rode en 20 witte knikkers. De kans dat de eerste knikker rood is, is 1/3. De kans dat de tweede knikker rood is, is ook 1/3. Echter de voorwaardelijke kans dat de tweede knikker rood is, gegeven dat de eerste rood is, is:

P("2e rood"|"1e rood") = P("2e rood" en "1e rood")/P("1e rood") =

{\frac {\frac {10\times 9}{30\times 29}}{\frac {1}{3}}}={\frac {9}{29}}

.

Dat antwoord zal ons niet verbazen. Deze voorwaardelijke kans leiden we direct af door naar het experiment te kijken dat ontstaat als we als eerste een rode knikker getrokken hebben en vervolgens weer een knikker gaan trekken.

Voorbeeld 2
Een doos bevat twee munten, waarvan er één zuiver is, dwz. kruis en munt worden met gelijke kans geworpen, terwijl de andere aan beide zijden kruis heeft. We kiezen nu lukraak een van de munten en werpen deze. Als het resultaat van deze worp kruis is, wat is dan de kans dat de andere kant van deze munt ook kruis is? Zij A de gebeurtenis dat de uitkomst kruis is en B de gebeurtenis dat de geworpen munt aan beide zijden kruis heeft dan is P(B|A) de gevraagde voorwaardelijke kans. Nu geldt P(A) = 3/4, immers drie van de in totaal 4 zijden van de munten zijn kruis en deze zijden komen alle met gelijke kans boven. Bovendien geldt P(BA) = P(B) = 1/2, want B ⊂ A en beide munten hebben gelijke kans om getrokken te worden. Dus P(B|A) = P(BA)/P(A) = 2/3.

Uit de definitie van voorwaardelijke kans volgt eenvoudig dat voor vaste B met P(B) > 0 de voorwaardelijke kans P(W|B) een kans is op S zowel als op B, dwz. dat hij net als P voldoet aan de axioma's van Kolmogorov.

Stelling 3.1.1
Als (S,P) een kansruimte is en B een gebeurtenis met P(B) > 0, is de voorwaardelijke kans P(.|B) zowel een kans op S als op B.

Bewijs: Beschouw de bijbehorende kansfunctie p_B. Daarvoor geldt: p_B(s) ≥ 0, voor alle s ∈ S en:

\sum _{s\in S}p_{B}(s)=\sum _{s\in B}p_{B}(s)=1

.

Uit de definitie van voorwaardelijke kans volgt direct voor twee gebeurtenissen A en B: P(AB) = P(A)P(B|A). We kunnen deze relatie uitbreiden tot meer dan twee gebeurtenissen en krijgen dan de zgn. productregel voor kansen.

Stelling 3.1.2 (productregel)
Voor de gebeurtenissen A₁,A₂,...,A_n met P(A₁A₂...A_n–1) > 0 geldt: P(A₁A₂...A_n) = P(A₁).P(A₂|A₁)...P(A_n|A₁A₂...A_n–1).

Voorbeeld 3 (vervolg voorbeeld 1)
Zij A_i de gebeurtenis dat de i^e getrokken knikker rood is. Dan is: P(A₁) = 1/3 en P(A₂|A₁) = 9/29, zodat P(A₁A₂) = P(A₁)P(A₂|A₁) = 3/29. We kunnen op de volgende manier P(A₂) berekenen:

P(A_{2})=P(A_{2}A_{1}\cup A_{2}A_{1}^{c})=P(A_{2}A_{1})+P(A_{2}A_{1}^{c})=

=P(A_{2}|A_{1})P(A_{1})+P(A_{2}|A_{1}^{c})P(A_{1}^{c})={\frac {9}{29}}\times {\frac {10}{30}}+{\frac {10}{29}}\times {\frac {20}{30}}={\frac {10}{30}}

.

De laatste berekening in het voorbeeld kunnen we heel algemeen formuleren. We hebben daar de kans op de gebeurtenis A₂ bepaald door een opsplitsing (partitie) van A₂ te bekijken. We zeggen wel dat we de totale kans op A₂ berekenen via de voorwaardelijke kansen van de partitie. We bekijken nog een voorbeeld.

Voorbeeld 4
Stel dat we de fractie Nederlanders die op de PVDA stemmen willen bepalen. We kunnen daartoe het aantal Nederlanders N en het aantal #A onder hen die op de PVDA stemmen bepalen. De gevraagde fractie is dan p = #A/N. Stel dat voor elke provincie i de fractie

p_{i}={\frac {\#A_{i}}{N_{i}}}

al bekend is; dan is:

p={\frac {\#A}{N}}=\sum {\frac {\#A_{i}}{N}}=\sum {\frac {\#A_{i}}{N_{i}}}{\frac {N_{i}}{N}}=\sum p_{i}{\frac {N_{i}}{N}}

.

In een symmetrische kansruimte met S = {alle Nederlanders} en A = {PVDA-stemmers} correspondeert deze relatie met

P(A) = ∑ P(A|provincie i).P(provincie i).

De algemene formulering luidt:

Stelling 3.1.3 (Wet van de totale kans)
Laat de (ten hoogste aftelbaar veel) gebeurtenissen A₁,A₂,..., met P(A_n) > 0 voor alle n, een partitie vormen van de uitkomstenruimte S, dan geldt:

P(B)=\sum _{n}P(B|A_{n})P(A_{n})\,

.

In de praktijk is het dikwijls zo, dat we de voorwaardelijke kansen P(B|A_n) uit het model afleiden en gebruiken voor het berekenen van de onvoorwaardelijke kans P(B), die vaak niet direct uit het model volgt. In deze zin wordt de wet van de totale kans gebruikt in het volgende voorbeeld.

Voorbeeld 5
Een bedrijf bezit drie fabrieken A, B en C, waar scheerapparaten van hetzelfde type worden gemaakt. Gedurende een bepaalde periode maakte fabriek A 2000 scheerapparaten, waarvan er 200 defect waren, fabriek B maakte in die periode 5000 apparaten, waarvan er 300 defect waren en C maakte 3000 apparaten, waaronder 150 defecte. Uit de totale productie wordt lukraak een scheerapparaat gekozen; wat is de kans dat dit apparaat defect (D) is? De gegevens van die periode kunnen we op de volgende overzichtelijke manier weergeven:

fabriek $F$	$P(F)$	$P(D\|F)$	$P(D\|F)P(F)$

$A$	2000/10000	200/2000	200/10000
$B$	5000/10000	300/5000	300/10000
$C$	3000/10000	150/3000	150/10000

totaal	1		650/10000

De berekening in de laatste kolom laat zien hoe met behulp van de wet van de totale kans de gevraagde kans berekend wordt: P(D) = P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(C) = 0,065.

Het gekozen scheerapparaat blijkt defect te zijn! Wat is de kans dat het afkomstig is van fabriek A? We vragen dus naar P(A|D), de voorwaardelijke kans dat het van A afkomstig is, gegeven dat het defect is. We berekenen:

P(A|D)={\frac {P(A\cap D)}{P(D)}}={\frac {P(D|A)P(A)}{P(D)}}={\frac {0{,}020}{0{,}065}}={\frac {4}{13}}

.

In het voorbeeld is de laatste berekening een toepassing van de zgn. regel van Bayes. Terwijl de voorwaardelijke kansen op de gebeurtenis D, gegeven elk van A, B en C, bekend zijn, laat deze regel zien hoe we de "omgekeerde" voorwaardelijke kans op elk van A, B en C, gegeven D, moeten berekenen.

Stelling 3.1.4 (Regel van Bayes)
Zij B een gebeurtenis met P(B) > 0 en A₁,A₂,... een partitie van S met P(A_i) > 0 voor alle i, dan geldt voor iedere i:

P(A_{i}|B)={\frac {P(B|A_{i})P(A_{i})}{P(B)}}={\frac {P(B|A_{i})P(A_{i})}{\sum _{j}P(B|A_{j})P(A_{j})}}

.

Bewijs: Volgt direct uit de definitie van voorwaardelijke kans en de wet van de totale kans.

Voorbeeld 6
Een prototype van een machine om bij banken geldstukken te sorteren vertoonde nogal wat gebreken. De machine accepteerde een mengsel van guldens, rijksdaalders en vijfjes (5-guldenstukken) en telde de munten, maar maakte nogal wat fouten. Uit proeven bleek dat een vijfje soms voor een rijksdaalder of een gulden werd gehouden of andersom. Van 1000 vijfjes werden 16 als rijksdaalder en 33 als gulden gezien. van 1000 rijksdaalders werden slechts 5 als vijfje geteld, maar 71 als gulden en van 1000 guldens werden 14 als rijksdaalder gezien en 32 als vijfje. Hoe groot is de kans dat een munt werkelijk een vijfje is {5!} als de machine aangeeft een vijfje te tellen {5?}? We gaan er daarbij van uit dat 10% van de aangeboden munten vijfjes zijn en 40% rijksdaalders. We kunnen de gegevens ordelijk in de volgende tabel weergeven.


munt $M$	$P(M)$	$P(2?\|M)$	$P(2?\|M)P(M)$

2	0,10	0,951	0,0951
1	0,40	0,005	0,0020
0,5	0,50	0,032	0,0160

totaal	1,00		0,1131	= $P(2?)$

Met de regel van Bayes berekenen we:

P(5!|5?) = P(5?|5!)P(5!)/P(5?) = 0,0951/0,1131 = 0,841.

De wet van de totale kans wordt ook wel weergegeven in een kansboom. Aan de hand van een voorbeeld zullen we dit duidelijk maken.

Voorbeeld 7 (kansboom)
We beschouwen de situatie van voorbeeld 5 en geven die op de volgende wijze weer. Deze figuur, die kansboom wordt genoemd, spreekt verder voor zich.

Een kansboom laat zich op voor de hand liggende wijze ook gebruiken in gecompliceerdere situaties. We geven daarvan verder geen voorbeeld.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

3.2 Onafhankelijke gebeurtenissen

Als ik willekeurig een Nederlander aanwijs, zal het voor de kans dat ik iemand uit Friesland aanwijs, geen verschil maken of ik weet dat ik een vrouw zal aanwijzen. anders wordt het als ik weet dat degene die ik aanwijs, blond haar heeft. Er zijn immers relatief meer blonde Friezen dan blonde Nederlanders. Als het optreden van een gebeurtenis B geen invloed uitoefent op de kans van optreden van een andere gebeurtenis A, dus als P(A|B) = P(A), zeggen we dat A onafhankelijk is van B. Omgekeerd geldt dan ook dat het optreden van A geen invloed heeft op de kans van optreden van B, want uit P(A|B) = P(A) volgt dat ook P(B|A) = P(AB)/P(A) = P(A|B)P(B)/P(A) = P(B).

Dus als A onafhankelijk is van B, is ook B onafhankelijk van A. We zeggen daarom dat A en B (onderling) onafhankelijk zijn. Daarbij laten we vaak de toevoeging "onderling" weg, hoewel dat strikt genomen niet juist is. Omdat beide relaties P(A|B) = P(A) en P(B|A) = P(B) ook equivalent zijn met de relatie P(AB) = P(A)P(B), gebruiken we deze laatste voor de definitie.

Definitie 3.2.1
De gebeurtenissen A en B heten (onderling) onafhankelijk (afgekort o.o.) als P(AB) = P(A)P(B).

Opmerking 1
Het begrip onafhankelijk wordt nog al eens verward met het begrip disjunct. Twee disjuncte gebeurtenissen A en B, dus met AB = ∅, kunnen echter alleen dan onderling onafhankelijk zijn, als een van beide kans 0 heeft, immers dan is P(A)P(B) = 0 = P(∅) = P(AB).

Voorbeeld 1
Uit een spel van 52 speelkaarten trekken we lukraak één kaart. H is de gebeurtenis dat de getrokken kaart een hartenkaart is en B is de gebeurtenis dat de getrokken kaart een boer is. Dan geldt P(H) = 13/52 = 1/4 en P(B) = 4/52 = 1/13. Omdat HB de gebeurtenis is dat we de hartenboer trekken, is P(HB) = 1/52 = P(H).P(B). De gebeurtenissen H en B zijn dus onderling onafhankelijk.

In het voorbeeld kunnen we de onafhankelijkheid van twee gebeurtenissen aantonen. Vaak echter kennen we de kansen niet en besluiten we op andere gronden tot onderlinge onafhankelijkheid van twee gebeurtenissen. Als gevolg kunnen we dan de kans op het gelijktijdig optreden van beide gebeurtenissen berekenen als het product van de kansen op elk afzonderlijk.

Voorbeeld 2
Een apparaat bestaat uit twee componenten. A₁ is de gebeurtenis dat de ene component werkt en A₂ de gebeurtenis dat de tweede werkt. Het apparaat werkt slechts als beide componenten werken en we hebben goede redenen om aan te nemen dat het werken van de ene component geen invloed heeft op het werken van de andere, dwz. dat A₁ en A₂ o.o. zijn. Onder deze modelveronderstelling geldt voor de kans dat het apparaat werkt: P(A₁A₂) = P(A₁).P(A₂).

Voorbeeld 3 (twee worpen met een dobbelsteen; vervolg)
We werpen tweemaal achtereen een dobbelsteen. Zij A de gebeurtenis dat we de eerste keer een 5 werpen en B de gebeurtenis dat we de tweede keer een 3 of meer werpen. Als we uitgaan van een zuivere dobbelsteen, is P(A) = 1/6 en P(B) = 2/3. Gaan we ervan uit dat A en B onafhankelijk zijn, hetgeen aannemelijk lijkt omdat A betrekking heeft op de eerste worp en B op de tweede, dan volgt: P(AB) = P(A)P(B) = 1/6 × 2/3 = 1/9.

Merk op dat we in het bovenstaande twee veronderstellingen maakten tav. ons kansmodel, namelijk dat de dobbelsteen zuiver is en dat gebeurtenissen die alleen betrekking hebben op de tweede worp, onafhankelijk zijn van gebeurtenissen die alleen betrekking hebben op de eerste worp. Deze veronderstellingen samen zijn equivalent met de veronderstelling dat we met een symmetrische kansruimte van doen hebben. Immers zij A_i de gebeurtenis dat we de eerste keer i ogen gooien en B_j de gebeurtenis dat we de tweede keer j ogen gooien, dan geldt op grond van de zuiverheid van de dobbelsteen dat P(A_i) = P(B_j) = 1/6 en op grond van de onafhankelijkheid dat P(A_iB_j) = P(A_i).P(B_j) = 1/36. We hadden dus de kans op de gebeurtenis AB ook kunnen bepalen door de kansdefinitie van Laplace te gebruiken. De beschreven methode van berekening, die direct gebruik maakt van de onderlinge onafhankelijkheid van de beide gebeurtenissen, is echter veelal eenvoudiger.

Ook in het geval van meer dan twee gebeurtenissen willen we over onafhankelijkheid spreken. Er zijn dan verscheidene mogelijkheden.

Definitie 3.2.2
De gebeurtenissen A₁,A₂,... heten paarsgewijs onafhankelijk als elk tweetal onderling onafhankelijk is.

Paarsgewijze onafhankelijkheid sluit echter de mogelijkheid van een zekere afhankelijkheid tussen gebeurtenissen niet uit, zoals uit het volgende voorbeeld blijkt.

Voorbeeld 4
We werpen tweemaal achtereen een zuivere munt. De uitkomstenruimte is S = {KK,KM,MK,MM} en elk van deze uitkomsten heeft kans 4. Zij A de gebeurtenis "de eerste keer kruis", B de gebeurtenis "de tweede keer kruis" en C de gebeurtenis "beide keren hetzelfde", dus A = {KK,KM}, B = {KK,MK} en C = {KK,MM}. A, B en C zijn paarsgewijs onafhankelijk, immers P(AB) = 1/4 = P(A)P(B), P(AC) = 1/4 = P(A)P(C) en P(BC) = 1/4 = P(B)P(C). Echter P(C|AB) = 1 ≠ P(C), dus de gebeurtenis AB = {KK} (dwz. A en B samen) geeft "informatie" over C.

Om elke vorm van afhankelijkheid tussen de gebeurtenissen A, B en C uit te sluiten, zullen we dus meer moeten eisen dan paarsgewijze onafhankelijkheid. Er zal bv. ook moeten gelden dat P(A|BC) = P(A), dus dat P(ABC) = P(A)P(B)P(C). Deze laatste eis echter blijkt op zich weer niet voldoende om paarsgewijze onafhankelijkheid af te dwingen.

Voorbeeld 5 (twee worpen met een dobbelsteen; vervolg)
We werpen tweemaal een zuivere dobbelsteen. Zij A de gebeurtenis dat de eerste worp 1, 2 of 3 ogen en B de gebeurtenis dat de eerste worp 3, 4 of 5 ogen oplevert. C is de gebeurtenis dat de som van het aantal ogen 9 is, dus C = {(3,6),(4,5),(5,4),(6,3)}. P(A) = P(B) = 1/2 en P(C) = 1/9. De doorsnede ABC = {(3,6)}, dus P(ABC) = 1/36 = 1/2×1/2×1/9 = P(A)P(B)P(C), terwijl P(AB) = 1/6 ≠ 1/2 × 1/2 = P(A)P(B) P(BC) = 1/36 ≠ 1/2 × 1/9 = P(B)P(C) en P(AC) = 1/36 ≠ 1/2 × 1/9 = P(A)P(C). A, B en C zijn dus niet paarsgewijs onafhankelijk.

We noemen A, B en C daarom pas onderling onafhankelijk als voor elk tweetal én voor het drietal de kans op de doorsnede te schrijven is als het product van de afzonderlijke kansen. Voor een eindige of aftelbaar oneindige rij gebeurtenissen A₁,A₂,A₃,... zullen we deze eis moeten opleggen aan elk tweetal, drietal, viertal, etc.

Definitie 3.2.3
De gebeurtenissen A₁,A₂,... heten (onderling) onafhankelijk (afgekort o.o.), als voor elke eindige deelrij $A_{i_{1}},A_{i_{2}},\dots ,A_{i_{k}}(k\geq 2)$ , geldt:

P(A_{i_{1}}A_{i_{2}}\dots A_{i_{k}})=P(A_{i_{1}})P(A_{i_{2}})\dots P(A_{i_{k}})

.

Als twee gebeurtenissen A en B o.o. zijn, dan zijn ook A^c en B o.o., A en B^c en ook A^c en B^c. Soortgelijke eigenschappen kan men ook voor meer dan twee gebeurtenissen bewijzen. Als A, B, C en D o.o. zijn, dan zijn "disjuncte combinaties" zoals bv. AB en C∪D ook o.o., immers P(AB(C∪D)) = P(ABC ∪ ABD) = P(ABC) + P(ABD) - P(ABCD) = P(A)P(B)P(C) + P(A)P(B)P(D) - P(A)P(B)P(C)P(D) = P(A)P(B){[P(C) + P(D) - P(CD)} = P(AB)P(C∪D). Ook andere disjuncte combinaties, zoals AB∪C en D zijn dan o.o.

Stelling 3.2.1
Als A₁,A₂,... onderling onafhankelijk zijn, dan zijn ook disjuncte combinaties van deze gebeurtenissen o.o.

3.3 Samengestelde experimenten

Vaak bestaat een kansexperiment uit een opeenvolging van een reeks deelexperimenten, zoals bv. bij het herhaald uitvoeren van een bepaald (deel)experiment. We zullen dan de kansstructuur (dwz. de kansruimte) van elk van de deelexperimenten kennen en daaruit de kansstructuur van het totale experiment afleiden.

Voorbeeld 1
We gooien drie keer een zuivere munt. Elke worp afzonderlijk kunnen we beschrijven door een copie van de symmetrische kansruimte (S₀,p₀), met S₀ = {K,M} en p₀(K) = p₀(M) = 1/2. Het totale experiment zal als uitkomstenruimte hebben: S = {KKK,KKM,KMK,MKK,KMM,MKM,MMK,MMM} en als de experimenten onafhankelijk zijn, zal het totale experiment ook symmetrisch zijn, dus p(s) = 1/8, voor alle s ∈ S. Het totale experiment is samengesteld uit drie onafhankelijke deelexperimenten (S₁,p₁), (S₂,p₂) en (S₃,p₃), met S_i= S₀ en p_i= p₀. Er geldt: S = S₁ × S₂ × S₃ en p(s₁,s₂,s₃) = p₁(s₁).p₂(s₂).p₃(s₃). In deze laatste relatie zien we de onafhankelijkheid van de experimenten weerspiegeld.

Wat we in het voorbeeld zien geeft ons aanleiding tot de volgende definitie.

Definitie 3.3.1
Laat voor i = 1,2,...,n de kansruimten (S_i,p_i) gegeven zijn. Zij S = S₁× S₂×....× S_n en p(s₁,s₂,...,sn) = p₁(s₁).p₂(s₂)...p_n(s_n), dan noemen we (S,p) de productruimte van de kansruimten {(S_i,p_i)}.

Gemakkelijk kunnen we zien dat de productruimte weer een kansruimte is.

Stelling 3.3.1
De productruimte (S,p) van de kansruimten {(S_i,p_i)|i=1,2,...,n} is een kansruimte.

We zullen een experiment dat bestaat uit de successievelijke uitvoering van onafhankelijke deelexperimenten (dwz. deelexperimenten die elkaar niet beïnvloeden), beschrijven door de productruimte van de kansruimten van de deelexperimenten.

Definitie 3.3.2
Laat voor i = 1,2,...,n het experiment E_i beschreven worden door de kansruimte (S_i,p_i). We zeggen dat het experiment E samengesteld is uit de onafhankelijke deelexperimenten E₁,E₂,...,E_n, als de kansruimte (S,p) van E de productruimte is van (S₁,p₁), (S₂,p₂), ..., (S_n,p_n).

We zullen nu aantonen dat in de produkruimte de deelexperimenten inderdaad "onafhankelijk" van elkaar zijn, in die zin dat gebeurtenissen die alleen op de afzonderlijke deelexperimenten betrekking hebben o.o. zijn. Daarbij doet zich nog een formele moeilijkheid voor die we aan de hand van een voorbeeld verduidelijken.

Voorbeeld 1 (vervolg)
De gebeurtenis "de eerste worp leverde kruis op" geven we in het eerste experiment weer als de deelverzameling A = {K} van S₁. In het samengestelde experiment wordt deze gebeurtenis voorgesteld door A^* = {KKK,KKM,KMK,KMM}, die we ook kunnen we schrijven als: A^* = {K} × {K,M} × {K,M} = A × S₂× S₃. De beide gebeurtenissen A en A^*; zijn dus weliswaar formeel verschillende verzamelingen, maar stellen praktisch gezien dezelfde gebeurtenis voor.

Definitie 3.3.3
Laat voor i = 1,2,...,n de kansruimten (S_i,p_i) gegeven zijn. Bij de gebeurtenis A in (S_i,p_i) definiqren we de gebeurtenis A^* in de productruimte door: A^* = S₁× ... × S_i-1 × A × S_i+1 × ... × S_n.

We zullen praktisch geen onderscheid maken tussen de gebeurtenis A in een deelexperiment en de gebeurtenis A^* in het experiment voorgesteld door de productruimte. Zo zal in het samengestelde experiment de kans op A^* gelijk zijn aan de kans op A in het deelexperiment.

Stelling 3.3.2
Laat voor i = 1,2,...,n de kansruimten (S_i,p_i) gegeven zijn. Zij A een gebeurtenis in (S_i,p_i), dan geldt in de productruimte (S,p) P(A^*) = P_i(A).

Bewijs:

P(A^{*})=\sum _{s\in A^{*}}p(s)=\sum _{s\in A^{*}}p(s_{1},...,s_{n})=\sum _{s\in A^{*}}p_{1}(s_{1})...p_{n}(s_{n})=

=\sum _{s_{1}\in S_{1}}p_{1}(s_{1})...\sum _{s_{i-1}\in S_{i-1}}p_{i-1}(s_{i-1})\sum _{s_{i}\in A}p_{i}(s_{i})\sum _{s_{i+1}\in S_{i+1}}p_{i+1}(s_{i+1})...\sum _{s_{n}\in S_{n}}p_{n}(s_{n})=P_{i}(A)

.

We kunnen nu laten zien dat in een experiment dat is samengesteld uit onafhankelijke deelexperimenten, gebeurtenissen die alleen betrekking hebben op de afzonderlijke deelexperimenten onderling onafhankelijk zijn.

Stelling 3.3.3
Laat voor i = 1,2,...,n de kansruimten (S_i,p_i) met daarin een gebeurtenis A_i gegeven zijn. Dan zijn in de productruimte de gebeurtenissen A₁^*,...,A_n^* onderling onafhankelijk.

Bewijs: Voor een greep van k indices, waarvoor we voor het gemak 1,...,k nemen, geldt:

P(A_{1}^{*}\cap ...\cap A_{k}^{*})=P(A_{1}\times \cdots \times A_{k}\times S_{k+1}\times \cdots \times S_{n})=

=\sum _{s\in \cdots }p(s_{1},...,s_{n})=\sum _{s\in \cdots }p_{1}(s_{1})...p_{n}(s_{n})=

=\sum _{s_{1}\in A_{1}\cdots s_{k}\in A_{k}}p_{1}(s_{1})...p_{k}(s_{k})=P_{1}(A_{1})\cdots P_{k}(A_{k})=P(A_{1}^{*})\cdots P(A_{k}^{*})

.

We zullen als belangrijke toepassing het herhaald uitvoeren van een experiment met slechts twee mogelijke uitkomsten bekijken. We kunnen daarbij denken aan het werpen van een munt, of het trekken met terug- leggen uit een dichotome populatie (dwz. een populatie die in tweeqn is gedeeld, bv. mannen en vrouwen, geslaagd en niet-geslaagd, etc.).

Definitie 3.3.4
Onder een Bernoulli-experiment (of alternatief) verstaan we een experiment met slechts twee mogelijke uitkomsten. Die uitkomsten zullen we algemeen aanduiden als succes en mislukking (Jacob Bernoulli, nagelaten werk, 1713).

Herhalen we enkele keren hetzelfde Bernoulli-experiment, zo, dat de experimenten onafhankelijk zijn, dan spreken we van Bernoulli-pogingen.

Definitie 3.3.5
Onder Bernoulli-pogingen verstaan we onderling onafhankelijke herhalingen van een Bernoulli-experiment.

We zullen steeds het onderliggende Bernoulli-experiment beschrijven door de uitkomstenruimte S₀= {0,1}, waarin 0 de uitkomst "mislukking" voorstelt en 1 de uitkomst "succes", en de kansfunctie p₀, gegeven door de kans op succes p = p₀(1) = 1 - p₀(0).

We kunnen nu op twee manieren Bernoulli-pogingen uitvoeren:

(a) een vast aantal, zeg n, keren; we moeten dan maar afwachten hoeveel keer we succes hebben.

(b) net zolang doorgaan tot we succes hebben; we moeten dan maar afwachten hoeveel experimenten we moeten doen.

In het eerste geval wordt de kansruimte gegeven door de productruimte S = {0,1}ⁿ, en p(s) = p^∑s(1-p)^{n-∑ s}. Een uitkomst beschrijven we dus door een rijtje 0'en en 1'en, en de kans op zo'n rijtje door het product van zoveel factoren p als het aantal 1'en en nog zoveel factoren (1-p) als het aantal 0'en. We noemen de gebeurtenis dat we in precies k van de deelexperimenten succes hebben, B_k; dus B_k= {s| ∑ s_i= k}. Alle uitkomsten die tot B_k behoren, hebben dezelfde kans p^k(1-p)^n-k en tot B_k behoren de uitkomsten die we krijgen door k van de n plaatsen aan te zijzen als succes. De kans op B_k wordt gegeven in de volgende stelling.

Stelling 3.3.4(binomiale formule)
De kans op precies k successen bij n Bernoulli-pogingen met succeskans p, wordt voor k = 0,1,...,n gegeven door

b_{k}={n \choose k}p^{k}(1-p)^{n-k}

.

In geval b herhalen we het Bernoulli-experiment net zolang tot we succes hebben. We kunnen dit experiment beschrijven door willekeurig veel Bernoulli-pogingen en de gebeurtenis C_n dat we n pogingen moeten doen om succes te vinden, beschrijven door alle rijtjes die beginnen met n-1 keer een 0 en gevolgd door een 1, dus C_n = {s|s_i= 0 voor i < n en s_n = 1} Aangezien de deelexperimenten o.o. zijn geldt voor de kans op C_n:

Stelling 3.3.5 (geometrische formule)
De kans g_n dat bij Bernoulli-pogingen met succeskans p het eerste succes bij de n-e poging is, wordt voor n = 1,2,3,... gegeven door:

\,g_{n}=(1-p)^{n-1}p

.

We kunnen ook experimenten tegenkomen die zijn samengesteld uit afhankelijke deelexperimenten. We zullen geen formele beschrijving geven van zo'n experiment in termen van de deelexperimenten. Hoe de kansruimte gekozen moet worden volgt van geval tot geval uit de beschrijving van het experiment.

We beschrijven ter vergelijking met Bernoulli-pogingen het trekken zonder terugleggen uit een dichotome populatie. We gebruiken het vaasmodel en nemen een vaas gevuld met M rode knikkers en N-M witte. We doen n trekkingen en duiden het trekken van een rode knikker aan als "succes". Een uitkomst kunnen we ook nu beschrijven door een rijtje 0'en en 1'en. Daarbij moeten we echter bedenken dat mogelijk niet elk rijtje kan voorkomen, aangezien er maximaal M 1'en en N-M 0'en ter beschikking zijn. We noemen de gebeurtenis dat we m keer succes hebben, dus dat we precies m rode knikkers trekken, H_m. We kunnen de kans op H_m berekenen: door te bedenken dat de m "successen" uit de M rode komen en de n-m "mislukkingen" uit de N-M witte. In totaal moeten we n trekkingen doen uit het totaal van N.

	rode	witte	totaal
populatie	$M$	$N-M$	$N$
steekproef	$m$	$n-m$	$n$

Stelling 3.3.6 (hypergeometrische formule)
De kans h_m op m successen bij n trekkingen zonder terugleggen uit een dichotome populatie van omvang N, waaronder M successen, wordt voor m = 0,1,...,n gegeven door:

h_{m}={\frac {{M \choose m}{N-M \choose n-m}}{N \choose n}}

.

Daarbij is de vanzelfsprekende veronderstelling gemaakt dat

{n \choose k}=0

, als k > n.

4.1 Inleiding

Wat kunnen we zeggen van de leeftijd van een "willekeurige" Nederlander? Om deze vraag te beantwoorden beschouwen we de symmetrische kansruimte met S = {alle Nederlanders}. Iedere Nederlander heeft een zekere leeftijd, gemeten in gehele aantallen jaren, en als we volgens dit model lukraak één Nederlander kiezen en daarvan de leeftijd bepalen, hangt het getal dat we krijgen duidelijk van het toeval af. Immers wie er gekozen wordt hangt van het toeval af, dus ook de leeftijd die gemeten wordt. De grootheid leeftijd voegt aan iedere uitkomst s een reëel getal, zeg X(s), toe; we hebben dus te maken met een functie X op S, waarvan het argument, en daarmee ook de functiewaarde, door een kansmechanisme wordt aangewezen.

Definitie 4.1.1
Als S een discrete uitkomstenruimte is, noemen we een functie X:S -> \R een (discrete) stochastische variabele (in dit boek vaak afgekort tot s.v.).

Een stochastische variabele X voegt dus aan elke uitkomst s ∈ S een reëel getal X(s) toe. In de praktijk komt dat erop neer dat we bij een experiment door het toeval een uitkomst s verkrijgen en aan die uitkomst nog een kenmerk X(s) meten. Als s een willekeurig gekozen Nederlander is, kunnen we z'n leeftijd X, z'n gewicht G, het aantal kinderen K dat hij heeft, als stochastische variabelen opvatten. We zullen s.v.-en in het algemeen aangeven met hoofdletters veelal met X, Y en Z; soms ook met hoofdletters die een aanwijzing geven over de betekenis van de s.v., G voor gewicht, K voor kindertal ed. Veel experimenten kunnen we gemakkelijk beschrijven in termen van een of meer stochastische variabelen.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)

We werpen twee keer een dobbelsteen; S = {(s₁,s₂)|s₁, s₂= 1,2,...,6}. Het totale aantal geworpen ogen Z is een stochastische variabele, gedefinieerd door Z(s₁,s₂) = s₁ + s₂. Ook het ogenaantal X bij de eerste worp is een s.v.: X(s₁,s₂) = s₁.

4.2 Kansverdeling

In het algemeen zijn we niet zozeer in de s.v. zelf (dwz. als functie) geïnteresseerd, als wel in de kansen op gebeurtenissen betreffende die s.v. Als X weer de leeftijd van een willekeurige Nederlander voorstelt, zijn we mogelijk geïnteresseerd in de kans dat de gekozen persoon 18 jaar of ouder is, dus in de kans op de gebeurtenis {s|X(s) ≥ 18}. We zullen deze gebeurtenis kort noteren als {X ≥ 18} en de kans erop als P(X ≥ 18). Op soortgelijke wijze voor andere gebeurtenissen: bv. P({s|45 < X(s) < 65}) noteren we kort als P(45 < X < 65).

Definitie 4.2.1
Als X een s.v. is en B een verzameling reële getallen, schrijven we kort {X∈B} voor de gebeurtenis {s|X(s)∈B} en P(X∈B) voor de kans op die gebeurtenis.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
Zie voorbeeld 1 in de vorige paragraaf. De gebeurtenis "het totale aantal geworpen ogen is 7" schrijven we als {Z=7} en de kans op die gebeurtenis als P(Z=7).

Net zoals we bij de uitkomsten van een experiment niet geïnteresseerd zijn in de specifieke uitkomst bij de uitvoering van het experiment, maar wel in de mogelijke uitkomsten en de kansen erop, zo zijn we, zoals we boven reeds zeiden, ook niet geïnteresseerd in de waarde die een s.v. in een specifiek geval aanneemt, maar wel in de mogelijke waarden en de bijbehorende kansen.

Voorbeeld 2.
X stelt weer de leeftijd van een willekeurig gekozen Nederlander voor. Het interesseert ons niet dat we bij uitvoering van het experiment meneer Janssen hebben uitgekozen en dat Janssen 53 jaar is. Wij willen weten welke waarden de s.v. X kan aannemen, dus 0 tot en met bv. 140 en wat de kans is dat X zo'n waarde aanneemt, dus hoe groot bv. P(X=53) is. We noemen die waarden met de bijbehorende kansen de (kans)verdeling van de leeftijd X.

Definitie 4.2.2
Onder het waardenbereik S_X van een stochastische variabele X verstaan we de verzameling van alle mogelijke waarden die X kan aannemen. Dus S_X = {X(s)|s∈S}.

De (kans)verdeling van een s.v. X wordt nu bepaald door de kansen op de verschillende waarden van X, dus door de kansen P(X=x) voor x ∈ S_X.

Definitie 4.2.3
Onder de kansfunctie van een stochastische variabele X verstaan we de functie p_X: S_X → R gedefinieerd door: p_X(x) = P(X=x).

De kansfunctie van een s.v. X induceert een kans(maat) P_X op het waardenbereik S_X van X. Deze kansmaat duiden we aan als (kans)verdeling van X. Waar het echter niet tot verwarring aanleiding geeft, zullen we ook de kansfunctie van X wel met kansverdeling aanduiden.

Definitie 4.2.4
Onder de (kans)verdeling van een stochastische variabele X verstaan we de functie P_X gedefinieerd voor B ⊂ S_X door:

P_{X}(B)=P(X\in B)=\sum _{x\in B}p_{X}(x)

.

De kansverdeling P_X van een s.v. X is een kans op het waardenbereik S_X; dwz. de kansverdeling voldoet aan de axioma's van Kolmogorov. De structuur van een s.v. X met waardenbereik S_X, kansverdeling P_X en bijbehorende kansfunctie p_X, is geheel analoog aan de structuur van een experiment met uitkomstenruimte S, kans P en bijbehorende kansfunctie p. Door de s.v. X wordt de kansstructuur van het experiment overgebracht van de kansruimte (S,P) met daarop de s.v. X naar de kansruimte (S_X,P_X). Voor zover het X betreft zijn beide beschrijvingen voor het berekenen van kansen gelijkwaardig. We zullen ons daarom voornamelijk bezighouden met s.v.-en en hun kansverdeling, meestal gegeven door de kansfunctie.

Stelling 4.2.1
De kansverdeling P_X van een s.v. X is een kans op het waardenbereik S_X van X.

Voorbeeld 3 (twee worpen met een dobbelsteen; vervolg)
De kansverdeling van Z wordt gegeven door de kansfunctie p_Z. We berekenen eens p_Z(3): p_Z(3) = P(Z=3) = P({(1,2),(2,1)}) = 2/36.

Op overeenkomstige wijze kunnen we p_Z(z) = P(Z=z) voor elke z bepalen; we krijgen dan de volgende tabel:

$z$	2	3	4	5	6	7	8	9	10	11	12	totaal
$P(Z=z)$	1/36	2/36	3/36	4/36	5/36	6/36	5/36	4/36	3/36	2/36	1/36	36/36

We kunnen p_Z ook in formule geven:

p_{Z}(z)={\frac {(6-|7-z|)}{36}}

, voor z = 2,3,...,12.

In figuur 4.1 is de verdeling van Z in beeld gebracht.

						o
					o		o
				o				o
			o						o
		o								o
	o										o

	2	3	4	5	6	7	8	9	10	11	12	$\rightarrow \ \ z$
Figuur 4.1. De kansverdeling van Z.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

4.3 Enkele bekende discrete verdelingen

In deze paragraaf bespreken we enkele veel voorkomende discrete kansverdelingen. In verband met hetgeen we in de vorige paragraaf opmerkten laten we iedere verwijzing naar een onderliggende kansruimte achterwege.

Als randgeval beschouwen we de situatie dat er eigenlijk niet van toeval sprake is; de s.v. X neemt slechts één waarde aan, de verdeling van X is ontaard.

Definitie 4.3.1 (ontaarde verdeling)
De s.v. X heeft een ontaarde verdeling in het punt a, als de kansfunctie van X wordt gegeven door p_X(a) = 1.

Als de s.v. X twee verschillende waarden kan aannemen, dan spreken we van een alternatieve verdeling. We zullen voor de eenvoud slechts 0 en 1 als mogelijke waarden van X beschouwen. De s.v. X geeft aan of we wel (X=1) of niet (X=0) succes hebben in een Bernoulli-experiment. We kunnen ook zeggen dat X het aantal successen is bij het experiment.

Definitie 4.3.2 (alternatieve verdeling)
De s.v. X heeft een alternatieve verdeling (ook Bernoulli-verdeling geheten) met parameter p (0 ≤ p ≤ 1), als de kansfunctie van X wordt gegeven door: p_X(1) = 1 - p_X(0) = p.

Als de s.v. X verschillende waarden x₁,x₂,...,x_N kan aannemen, alle met gelijke kans, dan noemen we X uniform verdeeld. Het is het analogon van een symmetrische kansruimte.

Definitie 4.3.3 (uniforme of homogene verdeling)
De s.v. X heeft een uniforme (of homogene) verdeling op de getallen x₁,x₂,...,x_N, als de kansfunctie van X wordt gegeven door p_X(x_i) = 1/N, voor i = 1,2,..,N.

Voorbeeld 1 (één aselecte trekking)
We komen nog al eens de term aselecte (lukrake, willekeurige) trekking tegen. Een aselecte trekking uit de mogelijke getallen x₁,x₂,...,x_N kunnen we beschrijven als een uniform op die getallen verdeelde s.v.

Trekken we aselect zonder terugleggen n keer uit een dichotome populatie, dan is de kans op m successen gegeven door de hypergeometrische formule (stelling 3.3.6). Een s.v. met deze formule als kansverdeling noemen we hypergeometrisch verdeeld.

Definitie 4.3.4 (hypergeometrische verdeling)
De s.v. X heeft een hypergeometrische verdeling met parameters N, M en n (N,M,n ∈ N, 0 ≤ M ≤ N), als de kansfunctie van X wordt gegeven door:

p_{X}(m)={\frac {{M \choose m}{N-M \choose n-m}}{N \choose n}}

, voor m = 0,1,..,n.

Op grond van het bovenstaande kunnen we dus zeggen:

Stelling 4.3.1
Zij X het aantal successen bij n aselecte trekkingen zonder terugleggen uit een populatie van omvang N, waarvan M successen; dan is X hypergeometrisch verdeeld met parameters N, M en n.

In de onderstaande figuur zien we de hypergeometrische verdeling met parameters 50, 20 en 12 afgebeeld.

Figuur 4.2
Hypergeometrische verdeling met parameters 50, 20, 12

Voorbeeld 2
Uit een groep studenten bestaande uit 20 meisjes en 30 jongens worden lukraak 5 studenten aangewezen. Wat is de kans dat er maar 1 jongen bij die 5 is? Het aantal meisjes bij die 5 is een s.v. X die hypergeometrisch verdeeld is, dus de gevraagde kans is:

P(X=4)={\frac {{20 \choose 4}{30 \choose 1}}{50 \choose 5}}=0,0686\approx 7\%

.

Trekken we aselect met terugleggen n keer uit een dichotome populatie met succeskans p, dan bestaat het experiment dus uit n Bernoulli-pogingen en is de kans op m successen gegeven door de binomiale formule (stelling 3.3.4). Een s.v. met deze formule als kansverdeling noemen we binomiaal verdeeld.

Definitie 4.3.5 (binomiale verdeling)
De stochastische variabele X heeft een binomiale verdeling met parameters n en p (n ∈ N, n > 0, 0 ≤ p ≤ 1), als de kansfunctie van X wordt gegeven door:

p_{X}(k)={\tbinom {n}{k}}p^{k}(1-p)^{n-k}

, voor k = 0,1,..,n.

We spreken wel van de B(n,p)-verdeling en zeggen dat X B(n,p)-verdeeld is.

Op grond van het bovenstaande kunnen we dus zeggen:

Stelling 4.3.2
Zij X het aantal successen bij n Bernoulli-pogingen met succeskans p, dan is X binomiaal verdeeld met parameters n en p.

In de volgende figuren zien we enkele binomiale verdelingen in beeld gebracht.

Figuur 4.3. De binomiale verdeling met parameters 12 en 0,4

Figuur 4.4. De binomiale verdeling met parameters 30 en 0,4

Voorbeeld 3
Het aantal jongens X in een willekeurig gezin met 4 kinderen is B(4,1/2)-verdeeld, als we aannemen dat jongens en meisjes gemiddeld evenveel voorkomen (wat niet helemaal juist is) en dat de geboorte van een jongen en van een meisje in één gezin onderling onafhankelijk zijn (wat ook niet helemaal juist is). De kans dat in een gezin van vier kinderen alleen jongens zijn, is dan:

P(X=4)={\tbinom {4}{4}}({\tfrac {1}{2}})^{4}={\tfrac {1}{16}}

.

Als we n aselecte trekkingen zonder terugleggen doen uit een populatie van grote omvang N en een fractie p van de populatie heeft een bepaald kenmerk "succes", dan weten we dat het aantal successen X_N in de steekproef hypergeometrisch verdeeld is. Als we de trekkingen doen met terugleggen dan is het aantal successen Y binomiaal verdeeld. Echter voor een grote populatie en een relatief kleine steekproef zal het niet veel verschil maken of we de steekproef met of zonder terugleggen nemen. De verdelingen van X_N en Y zullen dus in zo'n geval veel op elkaar lijken.

Stelling 4.3.3
Zij Y binomiaal verdeeld met parameters n en p en voor N = 1,2,3,... X_N hypergeometrisch verdeeld met parameters N, M = Np en n, dan geldt:

\lim _{N\to \infty }P(X_{N}=m)=P(Y=m)

.

Voorbeeld 4
In de onderstaande tabel zien we de hypergeometrische verdeling met N = 1000, M = 200 en n = 5, en tevens de benaderende B(5,5)-verdeling.

k	0	1	2	3	4	5

hypergeom.	0,3269	0,4106	0,2051	0,0509	0,0063	0,0003
binomiaal	0,3277	0.4096	0,2048	0,0512	0,0064	0,0003

Doen we net zolang Bernoulli-pogingen tot we succes hebben, dan is volgens stelling 3.3.5 de kans dat we n pogingen moeten doen gegeven door de geometrische formule. Een s.v. met deze formule als kansverdeling noemen we geometrisch verdeeld. We kunnen zo'n s.v. opvatten als de "wachttijd" op succes.

Definitie 4.3.6 (geometrische verdeling)
De stochastische variabele X heeft een geometrische verdeling met parameter p (0 < p < 1), als de kansfunctie van X wordt gegeven door:

\,p_{X}(n)=(1-p)^{n-1}p

, voor n = 1,2,3,...

Op grond van het bovenstaande kunnen we dus zeggen:

Stelling 4.3.4
Zij X het aantal Bernoulli-pogingen met succeskans p tot en met het eerste succes, dan is X geometrisch verdeeld met parameter p.

In de volgende figuur staat de geometrische verdeling met parameter p = 0,4 afgebeeld.

Figuur 4.5. De geometrische verdeling met parameter 0,4

De geometrische verdeling kan handig beschreven worden door de overschrijdingskansen P(X > n), zoals uit de volgende stelling blijkt.

Stelling 4.3.5
Zij X geometrisch verdeeld met parameter p, dan is voor n = 0,1,2,...:

\,P(X>n)=\sum _{k>n}(1-p)^{k-1}p=(1-p)^{n}

.

Voorbeeld 5
Een handelsreiziger heeft gemiddeld bij 1 op de 10 klanten succes. Hoe groot is de kans dat hij op een bepaalde dag bij de 5e klant die hij bezoekt, z'n eerste order van die dag plaatst? Het aantal klanten X die hij moet bezoeken om voor het eerst succes te hebben, is geometrisch verdeeld met parameter p = 0,1 dus P(X = 5) = (1-p)⁴p = 0,9⁴ × 0,1 = 0,06561 ~ 0,066. De kans dat hij 5 of meer klanten moet bezoeken om een order te plaatsen is P(X ≥ 5) = P(X > 4) = (1-p)⁴ = 0,9⁴ = 0,6561.

Voorbeeld 6
Hoe groot is de kans om in minder dan 6 worpen met een zuivere dobbelsteen zes te gooien? Het aantal worpen X benodigd om zes te gooien, is geometrisch verdeeld met parameter 1/6, dus de gevraagde kans is P(X < 6) = 1 - P(X > 5) = 1 - (1 - 1/6)⁵ = 0,5981 ~ 60%.

Een verdeling die niet direct uit eenvoudige experimenten voortkomt, is de Poisson-verdeling (Poisson, 1837). Deze verdeling wordt wel de verdeling van de zeldzame gebeurtenissen genoemd. Stochastische variabelen met deze kansverdeling staan vaak model voor aantallen voorvallen die in een bepaald tijdsbestek plaatsvinden, zoals het aantal binnenkomende personen in een postkantoor tussen 10 en 11 uur 's ochtends, het aantal desintegraties van atomen in een hoeveelheid radio-actieve stof binnen een zekere periode, etc. Ook de aantallen objecten die zich in een bepaald deel van de ruimte bevinden, kunnen nogal eens gemodelleerd worden met een Poisson-verdeling, zoals het aantal rode bloedlichaampjes in een bepaalde hoeveelheid bloed, het aantal bacteriën van een bepaald type in een liter slootwater, het aantal bosorchideeën op een hectare bosgrond, het aantal draadbreuken in 1000 m draad in een spinnerij etc.

Voorbeeld 7
Op een bepaald kruispunt vinden jaarlijks enkele ernstige ongevallen plaats. Gemiddeld m per jaar. Het aantal dat in een jaar plaatsvindt noemen we X. We proberen inzicht te krijgen in de kansverdeling van X. Daartoe kijken we naar de verdeling van de ongevallen (×) over de 12 maanden van het jaar:

─xx─

─x──

──x─

─x──

────

───x

──xx

─x──

─xx─

────

──x─

jan

feb

mrt

apr

mei

jun

jul

aug

sep

okt

nov

dec

Ruwweg kunnen we zeggen dat er maanden zijn waarin geen ongeval plaats- vindt en maanden waarin wel een ongeval plaatsvindt. Beschouwen we maanden met één ongeval als "succes" en het optreden van de ongevallen als onafhankelijk, dan hebben we te maken met 12 Bernoulli-pogingen met succeskans p = m/12. Helaas zijn er maanden met twee ongevallen! We laten ons daardoor niet uit het veld slaan en kijken daarom naar de weken. Een week met één ongeval noemen we een succes en een week zonder ongeval een mislukking; we hebben te maken met 52 Bernoulli-pogingen met p = m/52. De s.v. X stelt nu ook het aantal weken voor waarin precies één ongeval plaatsvindt; X is dus met goede benadering binomiaal verdeeld met parameters n = 52 en p = m/52. Mochten er nog weken zijn met meer dan één ongeval, dan kunnen we naar de dagen kijken etc. Die benadering zal des te beter zijn naarmate n groter is. In de volgende stelling bepalen we de limiet.

Stelling 4.3.6
Zij voor n=1,2,3,... X_n B(n,μ/n)-verdeeld dan is:

\lim _{n\to \infty }P(X_{n}=k)={\frac {\mu ^{k}}{k!}}e^{-\mu }

.

Deze limiet is weer een keurige kansfunctie, zoals uit de volgende stelling blijkt.

Stelling 4.3.7
Er geldt:

\sum _{k=0}^{\infty }{\frac {\mu ^{k}}{k!}}e^{-\mu }=1

.

De verdeling met deze kansfunctie noemen we de Poissonverdeling.

Definitie 4.3.7 (Poissonverdeling)
De stochastische variabele X heeft een Poisson-verdeling met parameter μ (μ > 0), als de kansfunctie van X wordt gegeven door:

p_{X}(k)={\frac {\mu ^{k}}{k!}}e^{-\mu }

, voor k = 0,1,2,...

In de volgende figuren zien we enkele Poissonverdelingen afgebeeld.

Figuur 4.6. De Poissonverdeling met parameter 1

Figuur 4.7. De Poissonverdeling met parameter 5

De parameter m van de Poissonverdeling geeft de intensiteit waarmee de voorvallen plaatsvinden, weer. Voor een gevaarlijk, druk kruispunt kiezen we in het kansmodel een grote waarde van m, voor een minder druk kruispunt een kleine waarde van m als we het aantal ongevallen met een Poisson-verdeling beschrijven.

Voorbeeld 8
Het aantal verzoeken X om inlichtingen bij een afdeling van een verzekeringskantoor in een uur is Poissonverdeeld met parameter μ = 2, dwz. dat over een lange periode gemiddeld 2 verzoeken per uur voorkomen. Na een advertentiecampagne is het echter veel drukker en blijkt dat μ = 10. In het geval μ = 2 is P(X ≤ 6) = 0,996; echter voor μ = 10 is P(X ≤ 6) = 0,130, waarmee het verschil tussen beide situaties duidelijk geïllustreerd wordt.

In voorbeeld 7 bleek dat een binomiale verdeling voor grote waarden van de parameter n en kleine waarden van de parameter p veel lijkt op een Poissonverdeling met parameter np. In stelling 4.3.7 is daarmee de Poissonverdeling afgeleid. De volgende stelling spreekt dit nog eens uit.

Stelling 4.3.8
Zij voor n=1,2,3,... X_n B(n,μ/n)-verdeeld en Y Poissonverdeeld met parameter μ, dan is:

\lim _{n\to \infty }P(X_{n}=k)=P(Y=k)

.

Voorbeeld 9
Een levensverzekeringsmaatschappij verzekert het leven van 5000 mannen van 42 jaar. De kans dat een 42-jarige man komt te overlijden is 0,001. Hoe groot is de kans dat de maatschappij meer dan 4 claims moet betalen gedurende een jaar? Het aantal claims X in dat jaar is binomiaal verdeeld met parameters n = 5000 en p = 0,001. Een goede benadering van deze verdeling is de Poissonverdeling met μ = np = 5, zodat de gevraagde kans is:

P(X>4)\approx P(Y>4)=1-P(Y\leq 4)=1-0,4405\approx 56\%

daarbij heeft Y een Poissonverdeling met parameter μ = 5.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

5.1 Inleiding

Vaak doen we meer dan één "waarneming" aan een uitkomst van een experiment, zoals het meten van leeftijd, lengte en gewicht van een willekeurig gekozen persoon. Op de kansruimte zijn dan verscheidene s.v.-en X₁,X₂,...,X_n (gelijktijdig) gegeven. We zullen dan iets te weten willen komen van de onderlinge relaties tussen de X'en. Als we de verdelingen van elk der s.v-en afzonderlijk kennen, is het in het algemeen niet mogelijk een kansuitspraak te doen die twee of meer van de s.v.-en betreft. Toch zijn het juist die gezamenlijke kansen die ons interesseren, want het zijn die zgn. simultane kansen die ons iets zeggen over de samenhang tussen de s.v.-en.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
Met Z geven we het totale aantal geworpen ogen aan en met M het maximum van de beide ogenaantallen. Duidelijk is dat er een samenhang is tussen Z en M; als bv. M = 2, dan is Z ten hoogste gelijk aan 4. De simultane kans P(Z=3 en M=2) kunnen we niet afleiden uit de kansen P(Z=3) en P(M=2).

Definitie 5.1.1
Als op de kansruimte (S,P) de s.v.-en X₁,X₂,...,X_n gegeven zijn, noemen we de rij X = (X₁,X₂,...,X_n) een stochastische vector (ook afgekort tot s.v.) met dimensie n; de s.v.-en X₁,X₂,...,X_n zelf noemen we de componenten van X.

De begrippen waardenbereik, kansfunctie en kansverdeling zijn geheel analoog aan het geval van één dimensie gedefinieerd.

Definitie 5.1.2
Onder het waardenbereik S_X van de stochastische vector X verstaan we de verzameling van alle mogelijke waarden van X, dus S_X = {X(s)|s∈S}.

In het volgende zullen we, om niet met allerlei indices te moeten werken, slechts het geval van drie s.v.-en X, Y en Z behandelen. De generalisatie naar een willekeurig aantal X₁, X₂, ..., X_n is meestal vanzelfsprekend.

Definitie 5.1.3
Laat X, Y en Z de componenten zijn van de stochastische vector V. Onder de simultane kansfunctie van X, Y en Z verstaan we de functie p_X,Y,Z: S_V -> \R gedefinieerd door: p_X,Y,Z(x,y,z) = P(X=x en Y=y en Z=z).

De simultane kansfunctie induceert weer een kans(maat) P_V op het waardenbereik S_V van V = (X,Y,Z); deze kansmaat duiden we aan als de simultane (kans)verdeling van X, Y en Z. Waar het echter niet tot verwarring aanleiding geeft, zullen we ook de simultane kansfunctie wel met kansverdeling aanduiden.

Definitie 5.1.4
Laat X, Y en Z de componenten zijn van de stochastische vector V. Onder de simultane (kans)verdeling van X, Y en Z verstaan we de functie P_{X, Y en Z}, gedefinieerd voor B ⊂ S_V door:

P_{V}(B)=P_{X,Y,Z}(B)=\sum _{v\in B}p_{X,Y,Z}(x,y,z)

,

waarin x, y en z de componenten van v zijn.

Ook geldt een analoge stelling als in één dimensie:

Stelling 5.1.2
De simultane kansverdeling P_V van de s.v. V is een kans op het waardenbereik S_V van V.

Voorbeeld 2 (twee worpen met een dobbelsteen; vervolg)
De simultane kansfunctie p_Z,M van Z en M wordt gegeven door:

p_{Z,M}(z,m)=P(Z=z,M=m)={\begin{cases}{\tfrac {1}{36}}&{\mbox{als }}\ z=2m,\ m=1,...,6\\\,\\{\tfrac {2}{36}}&{\mbox{als }}\ m<z<2m,\ m=1,...,6\end{cases}}

In de volgende tabel staat deze simultane kansfunctie.

z

2

3

4

5

6

7

8

9

10

11

12

m

P(M=m)

1

1/36

2

2/36

1/36

3/36

3

2/36

1/36

5/36

4

2/36

1/36

7/36

5

2/36

1/36

9/36

6

2/36

1/36

11/36

P(Z=z)

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

36/36

In de rechter- en ondermarge van de tabel staan de rij- resp. kolomtotalen vermeld. Deze totalen stellen juist de verdelingen (kansfuncties) p_M van M en p_Z van Z voor. Immers om bv. p_M(3) te bepalen, bedenken we dat: p_M(3) = P(M=3) = P(Z=4 en M=3 of Z=5 en M=3 of Z=6 en M=3) = P(Z=4 en M=3) + P(Z=5 en M=3) + P(Z=6 en M=3) = p_Z,M(4,3) + p_Z,M(5,3) + p_Z,M(6,3).

Daarom noemen we in dit verband de verdelingen van M en van Z wel marginale verdelingen.

Als de simultane verdeling (kansfunctie) van een stel s.v.-en bekend is, kunnen we, zoals uit het bovenstaande blijkt, van elke gebeurtenis omtrent die s.v.-en de kans berekenen. In het bijzonder kunnen we de kansen bepalen op gebeurtenissen die alleen een deel van de s.v.-en betreffen; de daarbij behorende kansverdeling noemen we marginale verdeling.

Definitie 5.1.5a
Laat X, Y en Z de componenten zijn van de stochastische vector V. De kansfuncties p_X, p_Y en p_Z van de componenten van V noemen we in dit verband wel marginale kansfuncties.

Ook voor een deel van de componenten van een stochastische vector V spreken we van marginale verdelingen. We formuleren de definitie alleen voor de twee componenten X en Z.

Definitie 5.1.5b
Laat X, Y en Z de componenten zijn van de stochastische vector V. De simultane kansfunctie van de twee componenten X en Z noemen we in dit verband wel de marginale kansfunctie van X en Z.

In voorbeeld 2 hebben we al gezien hoe we de marginale kansfunctie van een s.v. konden berekenen uit de simultane verdeling van die s.v. en een andere. De volgende stelling formuleert dit.

Stelling 5.1.1
De marginale kansfunctie van de s.v. X kan uit de simultane kansfunctie van X, Y en Z berekend worden volgens:

p_{X}(x)=\sum _{y\in S_{Y},z\in S_{Z}}p_{X,Y,Z}(x,y,z)

,

dus door de bij x horende simultane kansen te sommeren over alle mogelijke waarden y van Y en z van Z.

We kunnen de stelling generaliseren naar de algemene situatie van het berekenen van de marginale verdeling van de m componenten van een s.v. uit de simultane verdeling van alle n (n>m) componenten. We zullen deze vanzelfsprekende generalisatie echter niet opschrijven, maar de formulering aan de lezer overlaten.

Alvorens we een voorbeeld bespreken, introduceren we eerst een generalisatie van de binomiale verdeling, nl. de multinomiale verdeling. De binomiale verdeling ontstaat onder meer wanneer we uit een vaas met twee soorten knikkers, zeg witte en zwarte, met terugleggen, lukraak n keer een knikker trekken. Het aantal getrokken witte knikkers is dan binomiaal verdeeld. Met het aantal witte ligt ook het aantal zwarte vast. Als generalisatie nemen we een vaas met bv. vijf soorten knikkers: witte, rode, gele, groene en blauwe. We trekken ook nu met terugleggen, lukraak n knikkers uit de vaas. De steekproef bevat nu van elke kleur een aantal knikkers. Die aantallen, X₁,...,X₅ zijn dan multinomiaal verdeeld. De parameters van deze verdeling zijn: het aantal getrokken knikkers n, het aantal mogelijke kleuren, hier 5, en de fracties knikkers p₁,...,p₅ van elk der kleuren in de vaas.

Definitie 5.1.6 (multinomiale verdeling)
We zeggen dat de s.v.-en X₁,X₂,...,X_m een multinomiale verdeling hebben met parameters n, m en p₁,p₂,...,p_m, als het waardenbereik van de s.v. X = (X₁,X₂,...,X_m) gegeven wordt door: S_X = {(n₁,n₂,...,n_m)|n_i geheel, n_i ≥ 0 en n₁+ n₂+...+ n_m= n} en de simultane kansverdeling van X₁,X₂,...,X_m bepaald wordt door:

p_{X_{1},X_{2},...,X_{m}}(n_{1},n_{2},...,n_{m})={\tfrac {n!}{n_{1}!n_{2}!...n_{m}!}}\ p_{1}^{n_{1}}\ p_{2}^{n_{2}}...p_{m}^{n_{m}}

.

Daarbij zijn n en m natuurlijke getallen en is p_i ≥ 0 voor elke i = 1,2,...,m en er geldt p₁+ p₂+...+ p_m= 1.

Voorbeeld 3 (multinomiale verdeling)
Als generalisatie van een Bernoulli-experiment beschouwen we een experiment met m verschillende uitkomsten. Als vaasmodel kunnen we denken aan een vaas met knikkers in m verschillende kleuren; de kansen op de verschillende uitkomsten noemen we p₁,p₂,...,p_m. Er geldt natuurlijk dat p₁+ p₂+...+ p_m = 1. We trekken n keer lukraak een knikker uit de vaas en leggen deze na de kleur vastgesteld te hebben weer terug. Met X_i geven we het aantal keren aan dat de ie uitkomst bij de n herhalingen voorkwam. De s.v.-en X₁,X₂,...,X_m zijn dan multinomiaal verdeeld met parameters n, m en p₁,p₂,...,p_m.

We bepalen eens voor het geval m=3 (trinomiale verdeling) de marginale verdeling van X₁. Voor n₁= 0,1,...,n berekenen we:

p_{X_{1}}(n_{1})=\sum _{n_{2}}\sum _{n_{3}}{\tfrac {n!}{n_{1}!n_{2}!n_{3}!\,}}p_{1}^{n_{1}}p_{2}^{n_{2}}p_{3}^{n_{3}}=\sum _{n_{2}}{\tfrac {n!}{n_{1}!n_{2}!(n-n_{1}-n_{2})!}}\ p_{1}^{n_{1}}p_{2}^{n_{2}}(1-p_{1}-p_{2})^{n-n_{1}-n_{2}}=

={\tfrac {n!}{n_{1}!(n-n_{1})!}}\ p_{1}^{n_{1}}(1-p_{1})^{n-n_{1}}

.

We zien dat X₁ een binomiale verdeling heeft met parameters n en p₁.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

5.2 Voorwaardelijke kansverdelingen

Bij de simultane verdeling van twee s.v.-en X en Y kunnen we ook voorwaardelijke kansen op waarden van de ene gegeven de waarde van de andere beschouwen, dus bv. P(X=3|Y=0). Deze voorwaardelijke kans is gewoon gedefinieerd als de voorwaardelijke kans op de gebeurtenis {X=3} gegeven de gebeurtenis {Y=0}, dus indien P(Y=0) > 0, door:

P(X=3|Y=0)={\frac {P(X=3{\mbox{ en }}Y=0)}{P(Y=0)}}

.

De kansen op de verschillende waarden van X onder de voorwaarde {Y=0} duiden we dan aan als de voorwaardelijke verdeling van X gegeven Y=0. We zullen eerst eens een voorbeeld bespreken.

Voorbeeld 1
De simultane verdeling van X en Y wordt gegeven door:

P(X=x{\mbox{ en }}Y=y)={\tfrac {1}{y}}(1-{\tfrac {1}{y}})^{x-1}({\tfrac {1}{2}})^{y}

, voor x = 1,2,... en y = 2,3,...

We kunnen nu voor y = 2,3,... de voorwaardelijke verdeling van X, gegeven Y=y, bepalen:

P(X=x|Y=y)={\frac {P(X=x{\mbox{ en }}Y=y)}{P(Y=y)}}={\frac {{\tfrac {1}{y}}(1-{\tfrac {1}{y}})^{x-1}({\tfrac {1}{2}})^{y}}{P(Y=y)}}

, voor x = 1,2,...

Nu is:

P(Y=y)=\sum _{x=1}^{\infty }{\tfrac {1}{y}}(1-{\tfrac {1}{y}})^{x-1}({\tfrac {1}{2}})^{y}={\tfrac {1}{y}}({\tfrac {1}{2}})^{y}\sum _{x=1}^{\infty }(1-{\tfrac {1}{y}})^{x-1}=({\tfrac {1}{2}})^{y}

,

dus

P(X=x|Y=y)={\tfrac {1}{y}}(1-{\tfrac {1}{y}})^{x-1}

, voor x = 1,2,...

Hieruit blijkt dat X onder de voorwaarde Y=y geometrisch verdeeld is met parameter 1/y.

We geven nu een algemene definitie:

Definitie 5.2.1
Laat X, Y en Z de componenten zijn van de stochastische vector V. Onder de voorwaardelijke kansfunctie van X gegeven (dat) Y=y en Z=z, verstaan we de functie: p_X(.|Y=y en Z=z), gedefinieerd (mits de noemer ≠ 0) door:

p_X(x|Y=y en Z=z) = P(X=x|Y=y en Z=z) = p_X,Y,Z(x,y,z)/p_Y,Z(y,z).

Voorbeeld 2 (twee worpen met dobbelsteen; vervolg)
De voorwaardelijke verdeling van het totale ogenaantal Z gegeven dat het maximale ogenaantal M=3, kunnen we dus bepalen uit de rij m=3 in de tabel van de simultane verdeling van Z en M; deze rij staat hieronder nog eens opgeschreven.

	$z$	2	3	4	5	6	7	8	9	10	11	12
$m$													$P(M=m)$

3				2/36	2/36	1/36							5/36

We berekenen bv:

p_Z(5|M=3) = P(Z=5|M=3) = P(Z=5 en M=3)/P(M=3)= (2/36)/(5/36) = 2/5.

We moeten dus het element in de rij (de simultane kans) delen door het getal in de marge (de marginale kans); zo krijgen we:

$z$	2	3	4	5	6	7	8	9	10	11	12	totaal

$P(Z=z\|M=3)$	0	0	2/5	2/5	1/5	0	0	0	0	0	0	1

Voorbeeld 3 (multinomiale verdeling; vervolg)
We nemen het geval m=3 en noemen de s.v.-en weer X,Y en Z. We stellen n₀ = n₁+ n₂ = n - n₃ en p₀ = p₁ + p₂. Voor de voorwaardelijke verdeling van X en Y, gegeven Z, dus gegeven dat Z = n₃, vinden we voor n₁,n₂ ≥ 0:

p_{X,Y}(n_{1},n_{2}|Z=n_{3})={\frac {p_{X,Y,Z}(n_{1},n_{2},n_{3})}{p_{Z}(n_{3})}}={\frac {{\frac {n!}{n_{1}!n_{2}!n_{3}!}}p_{1}^{n_{1}}p_{2}^{n_{2}}p_{3}^{n_{3}}}{{\frac {n!}{n_{0}!n_{3}!}}p_{0}^{n_{0}}p_{3}^{n_{3}}}}={\frac {n_{0}!}{n_{1}!n_{2}}}\left({\frac {p_{1}}{p_{0}}}\right)^{n_{1}}\left({\frac {p_{2}}{p_{0}}}\right)^{n_{2}}

dus ook een multinomiale verdeling (binomiale), maar met parameters n₀, 2 en p₁/p₀ en p₂/p₀.

In de praktijk zullen we veelal niet de voorwaardelijke kansverdelingen uit de simultane verdeling afleiden, maar zal het experiment zijn opgebouwd uit successievelijk uitgevoerde deelexperimenten. De voorwaardelijke verdelingen leiden we dan af uit de deelexperimenten en vervolgens berekenen we uit deze voorwaardelijke verdelingen de simultane verdeling.

Voorbeeld 4
We werpen een dobbelsteen zolang tot we 6 gooien. Het aantal benodigde worpen noemen we Y. Daarna werpen we de dobbelsteen nog eens even veel keren en noteren het aantal malen X dat we 6 gooien. Het gehele experiment bestaat dus uit twee deelexperimenten. Het eerste kunnen we beschrijven door de s.v. Y die een geometrische verdeling met parameter p = 1/6 heeft. Het tweede deelexperiment is afhankelijk van het eerste; als we bij het eerste de uitkomst Y = y hebben gevonden, beschrijft de s.v. X, met voorwaardelijk gegeven Y = y een binomiale verdeling met parameters y en 1/6, het tweede. Dus:

P(Y=y)=({\tfrac {5}{6}})^{y-1}{\tfrac {1}{6}}

, voor y = 1,2,...

en

P(X=x|Y=y)={y \choose x}({\tfrac {1}{6}})^{x}({\tfrac {5}{6}})^{y-x}

, voor x = 0,1,...,y.

We kunnen nu de simultane verdeling van X en Y als volgt bepalen:

P(X=x{\mbox{ en }}Y=y)=P(X=x|Y=y)P(Y=y)={y \choose x}({\tfrac {1}{6}})^{x+1}({\tfrac {5}{6}})^{2y-x-1}

,

voor y = 1,2,... en x = 0,1,...,y.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

5.3 Onderling onafhankelijke stochastische variabelen

In het voorgaande hebben we gezien hoe we uit de simultane verdeling van een stel s.v.-en marginale verdelingen kunnen bepalen. Omgekeerd is het in het algemeen niet mogelijk de simultane verdeling van bv. een tweetal s.v.-en X en Y af te leiden uit de marginale verdeling van elk. In een speciaal geval is dit wel mogelijk en is de simultane kansfunctie van een n tal s.v.-en eenvoudig het product van de marginale kansfuncties van elk. Dit is het geval als de s.v.-en onderling onafhankelijk zijn. Dit begrip is geheel analoog aan de definitie van onafhankelijke gebeurtenissen en onderling onafhankelijke experimenten. Voor twee s.v.-en X en Y kunnen we van willekeurige gebeurtenissen {X∈B₁} betreffende X en {Y∈B₂} betreffende Y nagaan of ze al dan niet afhankelijk zijn. Als voor elke keuze van B₁ en B₂ de genoemde gebeurtenissen onafhankelijk zijn, ligt het voor de hand om X en Y onderling onafhankelijk te noemen.

Definitie 5.3.1
De s.v.-en X₁,X₂,...,X_n heten (onderling) onafhankelijk (afgekort tot o.o.) als de gebeurtenissen {X₁∈ B₁},{X₂∈ B₂},...,{X_n∈ B_n} onderling onafhankelijk zijn voor iedere B₁⊂ S_X , B₂⊂ S_X , ..., B_n⊂ S_X . Als het n-tal niet onderling onafhankelijk is, heten ze afhankelijk.

Als de s.v.-en X en Y onderling onafhankelijk zijn kunnen we de simultane verdeling afleiden uit de marginale verdelingen van X en van Y, want de gebeurtenissen {X=x} en {Y=y} zijn voor elke x en y onafhankelijk, dus: P(X=x en Y=y) = P(X=x).P(Y=y). Algemeen geldt voor een n-tal:

Stelling 5.3.1
Als de s.v.-en X₁,X₂,...,X_n onderling onafhankelijk zijn, geldt:

p_{X_{1},X_{2},...,X_{n}}(x_{1},x_{2},...,x_{n})=p_{X_{1}}(x_{1})p_{X_{2}}(x_{2})...p_{X_{n}}(x_{n})

, voor alle

x_{1}\in S_{X_{1}},x_{2}\in S_{X_{2}},...,x_{n}\in S_{X_{n}}

.

Voorbeeld 1
De s.v.-en X₁,X₂,...,X_n zijn o.o. en hetzelfde verdeeld als X met P(X=1) = 1 - P(X=0) = p. De simultane verdeling wordt dan gegeven door:

p_{X_{1},X_{2},...,X_{n}}(x_{1},x_{2},...,x_{n})=p_{X_{1}}(x_{1})p_{X_{2}}(x_{2})...p_{X_{n}}(x_{n})=p^{\sum x_{i}}(1-p)^{n-\sum x_{i}}

,

voor x_i = 0 of 1 voor alle i.

Stelling 5.3.1 is ook karakteristiek voor onderling onafhankelijke s.v.-en. Omgekeerd geldt nl. ook dat een n-tal s.v.-en onderling onafhankelijk is als de simultane verdeling het product is van de marginale verdelingen van elk.

Stelling 5.3.2
De s.v.-en X₁,X₂,...,X_n zijn onderling onafhankelijk indien voor alle $x_{1}\in S_{X_{1}},x_{2}\in S_{X_{2}},...,x_{n}\in S_{X_{n}}$ geldt:

p_{X_{1},X_{2},...,X_{n}}(x_{1},x_{2},...,x_{n})=p_{X_{1}}(x_{1})p_{X_{2}}(x_{2})...p_{X_{n}}(x_{n})

.

Voorbeeld 2 (twee worpen met dobbelsteen; vervolg)
We noemen de uitkomst van de eerste worp X en van de tweede Y. Voor elke x = 1,2,...,6 en y = 1,2,...,6 geldt: P(X=x en Y=y) = 1/36 = P(X=x).P(Y=y); dus X en Y zijn onderling onafhankelijk.

Het totale ogenaantal Z (= X + Y) en het maximale ogenaantal M (= max(X,Y)) zijn afhankelijk, want bv. P(Z=5 en M=3) = 2/36 ≠ P(Z=5).P(M=3) = 4/36 × 5/36.

Zoals we al eerder opmerkten is de analogie tussen onafhankelijke s.v.-en en onafhankelijke experimenten opvallend; praktisch gesproken is er dan ook geen verschil en kunnen we een bepaalde situatie op beide manieren beschrijven.

Voorbeeld 3 (twee worpen met dobbelsteen; vervolg)
Beschrijven we het experiment als opgebouwd uit twee onafhankelijke deelexperimenten, dan zijn de gebeurtenissen die alleen betrekking hebben op de eerste worp onafhankelijk van gebeurtenissen betreffende de tweede worp en bijgevolg zijn X en Y onderling onafhankelijke s.v.-en.

We kunnen het experiment ook beschrijven door X en Y als o.o. s.v.-en te geven, dus door voor x,y = 1,2,...,6 te stellen dat P(X=x en Y=y) = 1/36. Het gevolg is dat de beide worpen als deelexperimenten gezien onafhankelijk zijn.

5.4 Functies van stochastische variabelen

Als X een (discrete) stochastische variabele is, is ook de compositie Y = g $\circ$ X van X en een functie g (meestal geschreven als g(X)) weer een s.v. We kunnen dat schematisch als volgt weergeven:

S{\xrightarrow {\quad X\quad }}\mathbb {R} {\xrightarrow {\quad g\quad }}\mathbb {R}

S{\xrightarrow {\quad \quad Y=g\circ X\quad \quad }}\mathbb {R}

Zo is bv. Y = (X-3)² een (discrete) stochastische variabele; immers Y(s) = (X(s)-3)² bepaalt weer een functie op de uitkomstenruimte S. Ook functies van de componenten X₁,X₂,...,X_n van een stochastische vector, bv. X₁ + X₂ - X₃ , 2(X₁ - X_n) zijn weer s.v.-en. In het voorgaande zijn we eigenlijk al zulke functies van s.v.-en tegengekomen. Bij het twee keer werpen van een dobbelsteen is het maximale ogenaantal Z van beide worpen te schrijven als Z = max(X,Y), waarin X en Y de ogenaantallen van respectievelijk de eerste en tweede worp waren. Algemeen geldt de volgende stelling.

Stelling 5.4.1
Laat X₁,X₂,...,X_n s.v.-en zijn op een kansruimte (S,P) en zij

g:\mathbb {R} ^{k}\to \mathbb {R}

voor zekere k ≤ n, dan is ook g(X₁,...,X_k) een s.v. op (S,P).

Hoe kunnen we uit de gegeven simultane kansverdeling van een n-tal s.v.-en X₁,X₂,...,X_n de verdeling van een functie g(X₁,X₂,...,Xk) van een k- tal van deze s.v.-en bepalen? Eigenlijk hebben we dit al gedaan, zoals uit het volgende voorbeeld blijkt.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
De simultane verdeling van het ogenaantal X van de eerste worp en van het ogenaantal Y van de tweede worp wordt voor elke x = 1,2,...,6 en y = 1,2,...,6 gegeven door: P(X=x en Y=y) = 1/36. De verdeling P(Z=z) van het totale ogenaantal Z = X + Y kunnen we als volgt bepalen; bv. voor z=5:

P(Z=5) = P(X=1 en Y=4 of X=2 en Y=3 of X=3 en Y=2 of X=4 en Y=1) =

= P(X=1 en Y=4) + P(X=2 en Y=3) + P(X=3 en Y=2) + P(X=4 en Y=1) =3/36.

Algemeen geldt:

Stelling 5.4.2
Laat X₁,...,X_k s.v.-en zijn op een kansruimte (S,P) en zij

g:\mathbb {R} ^{k}\to \mathbb {R}

,

dan wordt de kansverdeling van Y = g(X₁,...,X_k) bepaald door:

S_{Y}=\{g(x_{1},...,x_{k})|(x_{1},...,x_{k})\in S_{X}\}=\{g(x_{1}(s),...,x_{k}(s))|s\in S\}

,

en

\,p_{Y}(y)=\sum _{\{y=g(x_{1},...,x_{k})\}}p_{X_{1},...,X_{k}}(x_{1},...,x_{k})

,

voor y ∈ S_Y.

Bewijs: We bewijzen alleen de tweede uitspraak; we stellen X = (X₁,...,X_k) en x = (x₁,...,x_k):

\,p_{Y}(y)=P(g(X)=y)=\sum _{\{s:g(X(s))=y\}}p(s)=\sum _{\{x:g(x)=y\}}p_{X}(x).

Opmerking 1
We kunnen ook g zelf opvatten als s.v. op de kansruimte (S_X,P_X) en de theorie van hoofdstuk 2 toepassen.

In het bijzonder zullen we kijken naar de som van twee s.v.-en X en Y (gedefinieerd op dezelfde kansruimte). De resultaten laten zich gemakkelijk generaliseren naar een n-tal, maar dat zullen we niet expliciet doen.

Stelling 5.4.3
Laat X en Y een simultane verdeling hebben, dan wordt de verdeling van X + Y voor

z\in S_{X+Y}=\{x+y|x\in S_{X},y\ \in S_{Y}\}

gegeven door de kansfunctie

p_{X+Y}(z)=P(X+Y=z)=\sum _{x+y=z}p_{X,Y}(x,y)=\sum _{x\in S_{X}}p_{X,Y}(x,z-x)

.

Als X en Y o.o. zijn kunnen we nog schrijven:

p_{X+Y}(z)=\sum _{x\in S_{X}}p_{X,Y}(x,z-x)=\sum _{x\in S_{X}}p_{X}(x)p_{Y}(z-x)

,

voor $z\in S_{X}+Y$

Anders geschreven:

P(X+Y=z)=\sum _{x\in S_{X}}P(X=x)P(Y=z-x)

.

De beide laatste sommaties noemen we wel convolutiesommen en we duiden de verdeling p_X+Y van X+Y aan als de convolutie van p_X en p_Y.

Definitie 5.4.1
Onder de convolutie van twee kansfuncties p₁ en p₂, verstaan we de functie p₁* p₂, gedefinieerd door:

\,(p_{1}*p_{2})(x)=\sum _{u}p_{1}(u)p_{2}(x-u).

.

Stelling 5.4.4
De convolutie p₁ * p₂ van twee kansfuncties p₁ en p₂ is zelf ook een kansfunctie.

We kunnen de verdeling van de som van twee onafhankelijke s.v.-en als volgt karakteriseren:

Stelling 5.4.5
Als X en Y onafhankelijke s.v.-en zijn, is de kansverdeling p_X+Y van hun som de convolutie van hun kansfuncties p_X en p_Y; dus p_X+Y = p_X * p_Y.

In de praktijk is de convolutiesom alleen van belang als er ook daadwerkelijk "convolutie" optreedt, dwz. als (p_X*p_Y)(z) niet slechts bepaald wordt door een of enkele toevallig van 0 verschillende summanden in de convolutiesom ∑ p_X(x)p₂(z-x). Daadwerkelijke convolutie doet zich bv. voor als X en Y geheelwaardige s.v.-en zijn. Overigens blijkt dan dat slechts in enkele bijzondere gevallen de convolutiesom te berekenen is.

We geven nu enkele voorbeelden van de berekening van de verdeling van functies van s.v.-en.

Voorbeeld 2
Zij X het ogenaantal bij een worp met een dobbelsteen en Y = (X-3)². In de volgende tabel staan de relevante grootheden die benodigd zijn om de verdeling van Y te bepalen.

$\quad x$	1	2	3	4	5	6	totaal

$P(X=x)$	1/6	1/6	1/6	1/6	1/6	1/6	1
$y=(x-3)^{2}$	4	1	0	1	4	9

Daaruit lezen we af: S_Y = {0,1,4,9} en voor de kansfunctie van Y:

$y$	0	1	4	9	totaal

$P(Y=y)$	1/6	2/6	2/6	1/6	1

want bv. P(Y=4) = P(X=1 of X=5) = P(X=1) + P(X=5) = 2/6.

Voorbeeld 3 (multinomiale verdeling; vervolg)
We bekijken een multinomiale verdeling met parameters n, 4 en p₁,p₂,p₃ und p₄, en noemen de s.v.-en X, Y, Z en U. Wat is de verdeling van V = (X,Y,Z+U)?

S_{V}=\{(x,y,z+u)|(x,y,z,u)\in S_{X,Y,Z,U}\}=\{(k,l,m)|k+l+m=n\}

en

p_{Y}(k,l,m)=\sum _{z+u=m}p_{X,Y,Z,U}(k,l,z,u)=\sum _{z+u=m}{\frac {n!}{k!l!z!u!}}p_{1}^{k}p_{2}^{l}p_{3}^{z}p_{4}^{u}=

={\frac {n!}{k!l!m!}}p_{1}^{k}p_{2}^{l}\sum _{z}{\frac {m!}{z!(m-z)!}}p_{3}^{z}p_{4}^{m-z}={\frac {n!}{k!l!m!}}p_{1}^{k}p_{2}^{l}(p_{3}+p_{4})^{m}

,

dus een multinomiale verdeling met parameters n, 3 en p₁,p₂,p₃+ p₄.

Voorbeeld 4
Laat X en Y o.o. zijn en beide binomiaal verdeeld met parameters resp. m en p en n en p. Dan vinden we voor de verdeling van X+Y:

S_X+Y = {x+y|x = 0,1,...,m en y = 0,1,...,n} = {0,1,...,m+n}

en

p_{X+Y}(z)=(p_{X}*p_{Y})(z)=\sum _{x=0}^{m}p_{X}(x)p_{Y}(z-x)=

=\sum _{x=0}^{m}{\tbinom {m}{x}}p^{x}(1-p)^{m-x}{\tbinom {n}{z-x}}p^{z-x}(1-p)^{n-z+x}=

=p^{z}(1-p)^{m+n-z}\sum _{x=0}^{m}{\tbinom {m}{x}}{\tbinom {n}{z-x}}=

={\tbinom {n+m}{z}}p^{z}(1-p)^{m+n-z}.

dus een binomiale verdeling met parameters m+n en p.

Als de s.v.-en X, Y en Z o.o. zijn, volgt automatisch dat ook bv. X+Y en Z² o.o. zijn. We formuleren deze eigenschap algemeen.

Stelling 5.4.6
Laat de s.v.-en X₁,X₂,...,X_n onderling onafhankelijk zijn en zij g: R^k → R voor zekere k ≤ n, dan zijn ook g(X₁,...,X_k), X_k+1,...,X_n o.o.

Voorbeeld 5 (drie worpen met een dobbelsteen)
We beschrijven het experiment door de o.o. s.v.-en X,Y en U, die de ogenaantallen van resp. de eerste, tweede en derde worp voorstellen. De simultane verdeling wordt dus gegeven door P(X=x en Y=y en U=u) = 1/216 voor x,y,u = 1,2,...,6.

We mogen nu concluderen dat bv. de som X + Y van de ogenaantallen van de eerste twee worpen onafhankelijk is het aantal ogen U bij de derde worp. Ook zijn bv. X en max(Y,U) o.o.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

5.5 Gelijkverdeelde stochastische variabelen

Twee s.v.-en X en Y kunnen, hoewel ze verschillend zijn en mogelijk op geheel verschillende kansruimten gedefinieerd zijn, toch dezelfde kansverdeling hebben.

Voorbeeld 1
We werpen een zuivere dobbelsteen en noemen het ogenaantal X. Als we Y = 7 - X stellen, is Y verschillend van X, maar heeft dezelfde kansverdeling als X.

Voorbeeld 2
Zij X binomiaal verdeeld met parameters n en 1/2, en stel Y = n - X; dan zijn X en Y verschillend, maar hebben dezelfde verdeling.

Definitie 5.5.1
We noemen twee stochastische variabelen of vectoren X en Y gelijkverdeeld (of isomoor) en schrijven X ~ Y, als X en Y dezelfde kansverdeling hebben, dus als S_X = S_Y en p_X = p_Y.

We kunnen soms handig gebruik maken van gelijkverdeelde s.v.-en. Als nl. X en Y gelijkverdeeld zijn, zijn ook X² en Y² of X-3 en Y-3 gelijkverdeeld. Algemeen geldt:

Stelling 5.5.1
Als X en Y gelijkverdeeld zijn, dan zijn ook g(X) en g(Y) gelijkverdeeld.

We geven een toepassing.

Voorbeeld 3
Laat X en Y o.o. zijn en beide binomiaal verdeeld met parameters resp. m en p en n en p. In de vorige paragraaf hebben we berekend dat X+Y ook binomiaal verdeeld is, maar met parameters m+n en p. We kunnen dit resultaat ook op eenvoudiger wijze verkrijgen. Laat Z₁,...,Z_m,Z_m+1,...,Z_m+n o.o. gelijkverdeelde alternatieven zijn met succeskans p, dus P(Z=1) = 1 - P(Z=0) = p. We weten al dat X ~ Z₁+...+Z_m en Y ~ Z_m+1+...+Z_m+n en dus, vanwege de onafhankelijkheid, dat (X,Y) ~ (Z₁+...+Z_m, Z_m+1+...+Z_m+n). We mogen nu concluderen dat X + Y ~ Z₁+...+Z_m+n, dus dat X + Y binomiaal verdeeld is met parameters m+n en p.

6.1 Inleiding

Werpen we een keer een zuivere dobbelsteen, dan kunnen we ons afvragen wat we als uitkomst zullen verwachten. De bedoeling is niet om de mogelijke uitkomsten met de bijbehorende kansen te noemen, maar één getal. We kunnen ook vragen welk bedrag iemand bereid is (maximaal) per worp te betalen, als hij het geworpen ogenaantal $X$ krijgt uitbetaald. Dat bedrag noemen we het verwachte ogenaantal, of de verwachting(swaarde) van het ogenaantal $X$ . Om dat verwachte ogenaantal te bepalen, herhalen we het spel. Als we $n$ onafhankelijke worpen met een zuivere dobbelsteen uitvoeren, dan zal het gemiddelde ogenaantal ${\bar {x}}$ bij die $n$ worpen voor grote $n$ een goede indicatie geven van de verwachting. Er geldt:

{\bar {x}}=fq(1)\times 1+fq(2)\times 2+fq(3)\times 3+fq(4)\times 4+fq(5)\times 5+fq(6)\times 6

,

waarin $fq(k)$ het frequentiequotiënt is van de uitkomst $k$ bij de $n$ worpen. Omdat het frequentiequotiënt als voorbeeld diende voor de kans, zullen we het verwachte ogenaantal $\operatorname {E} X$ definiëren als:

\operatorname {E} X=p_{X}(1)\times 1+p_{X}(2)\times 2+p_{X}(3)\times 3+p_{X}(4)\times 4+p_{X}(5)\times 5+p_{X}(6)\times 6

.

In ons geval van een zuivere dobbelsteen wordt dat:

\operatorname {E} X={\begin{matrix}{\frac {1}{6}}\end{matrix}}\times 1+{\begin{matrix}{\frac {1}{6}}\end{matrix}}\times 2+{\begin{matrix}{\frac {1}{6}}\end{matrix}}\times 3+{\begin{matrix}{\frac {1}{6}}\end{matrix}}\times 4+{\begin{matrix}{\frac {1}{6}}\end{matrix}}\times 5+{\begin{matrix}{\frac {1}{6}}\end{matrix}}\times 6=3{\begin{matrix}{\frac {1}{2}}\end{matrix}}

De algemene definitie voor verwachtingswaarde luidt:

Definitie 6.1.1

Onder de verwachting (of verwachtingswaarde) van een s.v. $X$ verstaan we het getal

\operatorname {E} X=\sum _{x\in S_{X}}x\cdot P(X=x)=\sum _{x\in S_{X}}x\cdot p_{X}(x)

,

mits de som absoluut convergeert, dus mits

\sum _{x\in S_{X}}|x|\cdot P(X=x)<\infty

Als dit niet het geval is, dan zeggen we dat de verwachting niet bestaat.

Zoals we uit de definitie zien, is de verwachtingswaarde van een s.v. $X$ het gewogen gemiddelde van de mogelijke waarden van $X$ , met als gewichten de kansen op die waarden.

Voorbeeld 1

In een land is de volgende verdeling van het aantal kinderen over de echtparen bekend:

   ───────────────────────────────────────────────────────
      k    0      1      2      3      4        totaal
   ───────────────────────────────────────────────────────
     p(k)  0,15   0,30   0,30   0,20   0,05     1,00
    kp(k)  0      0,30   0,60   0,60   0,20     1,70 = EX
   ───────────────────────────────────────────────────────

Zij $X$ het aantal kinderen van een willekeurig echtpaar in dat land. Dan is $S_{X}=\{0,1,2,3,4\}$ en de kansverdeling van $X$ wordt dan juist gegeven door de bovenstaande verdeling van het aantal kinderen over de echtparen. Het gemiddeld aantal kinderen per echtpaar in dat land is dan de verwachtingswaarde $\operatorname {E} X$ van $X$ ; dus $\operatorname {E} X=0\times 0{,}15+1\times 0{,}30+2\times 0{,}30+3\times ;0{,}20+4\times 0{,}05=1{,}70$ . De berekening van $\operatorname {E} X$ kan gemakkelijk in de tabel uitgevoerd worden, zoals in de onderste rij van de tabel getoond wordt.

Voorbeeld 2

We berekenen eens de verwachtingswaarde in de B(9,3)-verdeling.

        k     P(X=k)     k.P(X=k)
    ───────────────────────────────
        0     0,0260      0,0000
        1     0,1171      0,1171
        2     0,2341      0,4682
        3     0,2731      0,8193
        4     0,2049      0,8196
        5     0,1024      0,5120
        6     0,0341      0,2046
        7     0,0073      0,0511
        8     0,0009      0,0072
        9     0,0001      0,0009
    ───────────────────────────────
    totaal                3,0000

Dus $\operatorname {E} X=3$ , wat we ook wel heuristisch kunnen inzien.

De verwachtingswaarde $\operatorname {E} X$ van $X$ wordt ook wel aangeduid met m_X of zelfs alleen met m als er geen noodzaak voor verwijzing naar $X$ bestaat. De verwachtingswaarde $\operatorname {E} X$ is een maat voor het "midden" van de verdeling van $X$ . We zeggen ook wel dat $\operatorname {E} X$ een maat is voor de "ligging" (dwz. de orde van grootte) van de waarden van $X$ .

In de volgende voorbeelden bestaat de verwachting niet.

Voorbeeld 3

We werpen een zuivere munt zolang tot we "munt" gooien. Als we $n$ keer moesten gooien, krijgen we $2^{n}$ uitbetaald. Zij $X$ de uitbetaling, dan is:

P(X=2^{n})=2^{-n}

,

voor $n=1,2,3,\ldots$ De verwachting van $X$ bestaat niet, want:

\sum _{n=1}^{\infty }|2^{n}|2^{-n}=\infty

In zo'n geval zeggen we wel dat $\operatorname {E} X=\infty$ .

Voorbeeld 4

A en B werpen om de beurt een zuivere munt. Wie het eerst kruis gooit is winnaar. A begint en beiden zetten één euro in. Steeds als er "munt" wordt gegooid, wordt de inzet verdubbeld. Voor A lijkt dit aantrekkelijk: al bij de eerste worp is de kans 50% dat hij wint, dus $P({\text{A wint}})>1/2$ (ga na). Als we $X$ definiëren als de winst van A, wordt de verdeling van $X$ gegeven door $P(X={-2}^{n})=1/2^{n+1}$ , voor $n=0,1,2,\ldots$

Dus de "gemiddelde winst van A" berekenen we als volgt:

\sum _{n=0}^{\infty }(-2)^{n}({\begin{matrix}{\frac {1}{2}}\end{matrix}})^{n+1}={\begin{matrix}{\frac {1}{2}}\end{matrix}}-{\begin{matrix}{\frac {1}{2}}\end{matrix}}+{\begin{matrix}{\frac {1}{2}}\end{matrix}}-{\begin{matrix}{\frac {1}{2}}\end{matrix}}+\ldots

Deze reeks convergeert niet en is dus zeker niet absoluut convergent. Dus $\operatorname {E} X$ bestaat niet. Nu divergeert " $\operatorname {E} X$ " ook niet naar $\infty$ .

Opmerking 1

We zullen in het vervolg steeds als we over een verwachtingswaarde spreken, er stilzwijgend van uitgaan dat deze verwachtingswaarde bestaat.

We kunnen de verwachtingswaarde van een s.v. ook als volgt berekenen.

Stelling 6.1.1

Voor de verwachting van een s.v. $X$ geldt:

\operatorname {E} X=\sum _{s\in S}X(s)p(s)

;

daarbij wordt dus gesommeerd over alle mogelijke uitkomsten $s$ .

Bewijs:

\operatorname {E} X=\sum _{x\in S_{X}}x\cdot P(X=x)=\sum _{x\in S_{X}}x\sum _{\{s\in S|X(s)=x\}}p(s)=\sum _{s\in S}X(s)p(s)

.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

6.2 Verwachting van bekende discrete verdelingen

In deze paragraaf sommen we de verwachtingswaarde van enkele bekende discrete verdelingen op. Aangezien de verwachting van een s.v. X alleen afhankelijk is van de kansverdeling van X, spreken we ook wel van de verwachtingswaarde van de (bijbehorende) verdeling. We vermelden hieronder steeds de verdeling en denken ons daarbij een s.v. X met die verdeling.

Stelling 6.2.1
1.Ontaarde verdeling (in het punt a).

EX=a\cdot 1=a

.

2. Alternatieve verdeling (met parameter p = p_X(1)).

EX=0\cdot (1-p)+1\cdot p=p

.

3. Uniforme verdeling (op de getallen $x_{1},x_{2},\ldots ,x_{N}\,$ ).

EX=x_{1}{\tfrac {1}{N}}+x_{2}{\tfrac {1}{N}}+\ldots +x_{N}{\tfrac {1}{N}}={\tfrac {1}{N}}\sum x_{i}={\bar {x}}

.

4. Binomiale verdeling (met parameters n en p).

EX=\sum _{k=0}^{n}k{\tbinom {n}{k}}p^{k}(1-p)^{n-k}=\sum _{k=1}^{n}{\frac {n!}{(k-1)!(n-k)!}}p^{k}(1-p)^{n-k}=

=np\sum _{m=0}^{n-1}{\tbinom {n-1}{m}}p^{m}(1-p)^{n-1-m}=np

5. Hypergeometrische verdeling (met parameters N, M en n). $EX=\sum _{m=0}^{n}m{\frac {{M \choose m}{N-M \choose n-m}}{N \choose n}}=n{\frac {M}{N}}$

6. Geometrische verdeling (met parameter p).

EX=\sum _{n=1}^{\infty }n(1-p)^{n-1}p=p{\frac {d}{dz}}\left.\sum _{n=1}^{\infty }z^{n}\right|_{z=1-p}=p{\frac {d}{dz}}\left.\left({\frac {1}{1-z}}\right)\right|_{z=1-p}={\frac {1}{p}}

7. Poisson-verdeling (met parameter m).

EX=\sum _{n=0}^{\infty }n{\frac {\mu ^{n}}{n!}}e^{-\mu }=\mu \sum _{n=1}^{\infty }{\frac {\mu ^{n-1}}{(n-1)!}}e^{-\mu }=\mu

We passen de bovenstaande kennis toe in een tweetal gevallen.

Voorbeeld 1
Het verwachte aantal zessen bij 25 keer werpen met een zuivere dobbelsteen is dus 25 × 1/6, want het aantal zessen X is B(25,1/6)-verdeeld.

Voorbeeld 2
Het verwachte benodigde aantal worpen om met een zuivere dobbelsteen zes te gooien is dus 6, want het benodigde aantal worpen X is geometrisch verdeeld met parameter 1/6.

6.3 Verwachting van functies van stochastische variabelen

Vaak moeten we de verwachting bepalen van een functie van een of meer s.v.-en. We kijken eerst eens naar een voorbeeld.

Voorbeeld 1
We werpen zolang een zuivere munt tot we "munt" gooien. De s.v. N stelt het benodigde aantal worpen voor. N is geometrisch verdeeld met parameter 1/2. Als we n worpen nodig hadden, krijgen we een bedrag 2^-n uitbetaald. Noem de uitbetaling X; de uitbetaling is een functie van N, nl. X = 2^-N. Voor de verwachte uitbetaling vinden we:

EX=\sum _{x\in S_{X}}x\;P(X=x)={\tfrac {1}{2}}P(X={\tfrac {1}{2}})+{\tfrac {1}{4}}P(X={\tfrac {1}{4}})+{\tfrac {1}{8}}P(X={\tfrac {1}{8}})+...

.

Nu is

P(X=2^{-n})=P(N=n)=({\tfrac {1}{2}})^{n}

,

dus

EX=\sum _{n=1}^{\infty }({\tfrac {1}{2}})^{n}({\tfrac {1}{2}})^{n}=\sum _{n=1}^{\infty }({\tfrac {1}{4}})^{n}={\frac {\tfrac {1}{4}}{1-{\tfrac {1}{4}}}}={\tfrac {1}{3}}

.

We zien dat we op vanzelfsprekende wijze kunnen schrijven:

EX=E2^{-N}=\sum _{n=1}^{\infty }({\tfrac {1}{2}})^{n}P(N=n)

,

waarin EX is uitgedrukt in de verdeling van N. We hoeven dan niet eerst na te gaan wat de verdeling van X is.

Wat we in het voorbeeld hebben gezien, geldt heel algemeen, en wordt verwoord in de volgende stelling.

Stelling 6.3.1
Laat X₁,...,X_n s.v.-en zijn en $g:\mathbb {R} ^{n}\to \mathbb {R}$ , dan is

Eg(X_{1},...,X_{n})=\sum _{x_{1},...,x_{n}}g(x_{1},...,x_{n})P(X_{1}=x_{1},...,X_{n}=x_{n})

,

waarbij dus gesommeerd wordt over alle mogelijke waarden (x₁,...,x_n) van (X₁,...,X_n).

Bewijs: Noem X = (X₁,...,X_n) en x = (x₁,...,x_n). Dan geldt voor de s.v. g(X):

Eg(X)=\sum _{s\in S}g(X(s))p(s)=\sum _{x}g(x)P(X=x)

We hoeven dus als we de verwachting van een functie Y = g(X) van X willen bepalen, niet eerst de verdeling van Y te berekenen, maar kunnen met bovenstaande stelling Eg(X) direct via de verdeling van X bepalen.

Voorbeeld 2 (twee worpen met een dobbelsteen; vervolg)
We kunnen Z en M opvatten als functies van de ogenaantallen X en Y van resp. de eerste en tweede worp: Z = X + Y en M = \max(X,Y). We berekenen:

EZ=E(X+Y)=\sum _{x=1}^{6}\sum _{y=1}^{6}(x+y)P(X=x\ en\ Y=y)={\tfrac {1}{36}}\sum _{x=1}^{6}\sum _{y=1}^{6}(x+y)=7

en

EM=E\max(X,Y)=\sum _{x=1}^{6}\sum _{y=1}^{6}\max(x,y)P(X=x\ en\ Y=y)={\tfrac {1}{36}}\sum _{x=1}^{6}\sum _{y=1}^{6}\max(x,y)=

={\tfrac {1}{36}}\sum _{m=1}^{6}m(2m-1)={\tfrac {161}{36}}

,

waarbij we bij de laatste sommatie bedenken dat er (2m-1) punten (x,y) zijn waarvoor \max(x,y) = m.

Merk op dat E(X + Y) = EX + EY; in een volgende paragraaf zullen we zien dat deze relatie algemeen geldt.

We vergelijken het resultaat met een berekening van EZ en EM via de verdelingen van Z en M:

EZ=\sum _{z=2}^{12}z.P(Z=z)=2\times {\tfrac {1}{36}}+2\times {\tfrac {3}{36}}+4\times {\tfrac {3}{36}}+\ldots +12\times {\tfrac {1}{36}}=7

en

EM=\sum _{m=1}^{6}m.P(M=m)=1\times {\tfrac {1}{36}}+2\times {\tfrac {3}{36}}+...+6\times {\tfrac {11}{36}}={\tfrac {161}{36}}

.

6.4 Eigenschappen van verwachtingswaarde

In de vorige paragraaf hebben we in voorbeeld 2 gezien dat de verwachtingswaarde van de som van twee s.v.-en gelijk is aan de som van de verwachtingswaarden van elk. De volgende stelling laat zien dat deze relatie algemeen geldt en geeft tevens een aantal andere eigenschappen van verwachtingswaarden.

Stelling 6.4.1 (eigenschappen van verwachtingswaarde)
Laat X en Y s.v.-en zijn met een simultane verdeling, dan geldt:

(a) E(X + Y) = EX + EY,

(b) E(aX + b) = aEX + b, voor alle a,b ∈ R,

(c) als X en Y o.o. zijn, dan is EXY = EX.EY.

Bewijs:

(a)

E(X+Y)=\sum _{x\in S_{X}}\sum _{y\in S_{Y}}(x+y).P(X=x\ en\ Y=y)=

=\sum \sum x.P(X=x\ en\ Y=y)+\sum \sum y.P(X=x\ en\ Y=y)=EX+EY

.

(Merk op dat we hier zowel x + y als x en y opvatten als functie van (x,y) en drie keer stelling 6.3.1 toepassen.)

(b)

E(aX+b)=\sum _{x\in S_{X}}(ax+b)P(X=x)=\sum axP(X=x)+\sum bP(X=x)=

=a\sum xP(X=x)+b\sum P(X=x)=aEX+b

.

(c)

EXY=\sum _{x\in S_{X}}\sum _{y\in S_{Y}}xyP(X=x\ en\ Y=y)=\sum \sum xyP(X=x)P(Y=y)=

=\sum _{x\in S_{X}}xP(X=x).\sum _{y\in S_{Y}}yP(Y=y)=EX.EY

.

Met behulp van de voorgaande stelling kunnen we op eenvoudige wijze de verwachting van de binomiale verdeling en van de hypergeometrische verdeling bepalen.

Voorbeeld 1
Zij X B(n,p)-verdeeld. Bekijk n onafhankelijke alternatieven X_i met succeskans p, dus P(X_i= 1) = 1 - P(X_i= 0) = p. We stellen

Y=\sum _{i=1}^{n}X_{i}

,

dan hebben X en Y dezelfde verdeling en dus ook dezelfde verwachting. We vinden dan:

EX=EY=\sum _{i=1}^{n}EX_{i}=\sum _{i=1}^{n}p=np

.

Voorbeeld 2
Zij X hypergeometrisch verdeeld met parameters M, N en n. We beschouwen een aselecte steekproef van omvang n zonder teruglegging uit een vaas met M rode en N-M witte knikkers. We definiëren X_i = 1 of 0 al naar gelang de i^e trekking een rode dan wel een witte knikker oplevert. Dan vormen de (X_i) weer n alternatieven met parameter p = M/N. We stellen

Y=\sum _{i=1}^{n}X_{i}

,

dan hebben X en Y dezelfde verdeling en dus dezelfde verwachting. We vinden dan:

EX=EY=\sum _{i=1}^{n}EX_{i}=\sum _{i=1}^{n}p=np

.

Merk op dat de s.v.-en X₁,...,X_n in dit geval niet o.o. zijn.

6.5 Voorwaardelijke verwachtingswaarde

Als X en Y een simultane verdeling hebben, kunnen we, zoals we eerder zagen, spreken over de voorwaardelijke verdeling van X gegeven Y=y. Deze voorwaardelijke verdeling wordt gegeven door de kansfunctie p_X( · |Y=y). Voor iedere y is dit een gewone kansfunctie, zodat we op voor de hand liggende wijze de bijbehorende verwachting kunnen uitrekenen, en wel als:

\sum _{x\in S_{X}}x\cdot p_{X}(x|Y=y).

We noemen die verwachting de voorwaardelijke verwachting van X gegeven Y=y, en noteren dit als:

{\rm {E}}(X|Y=y).

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
De voorwaardelijke verdeling van het totale ogenaantal Z gegeven dat het maximale ogenaantal M=3 staat in de volgende tabel.

$z$	2	3	4	5	6	7	8	9	10	11	12	totaal
$P(Z=z\|M=3)$	0	0	2/5	2/5	1/5	0	0	0	0	0	0	1
$zP(Z=z\|M=3)$	0	0	8/5	10/5	6/5	0	0	0	0	0	0	24/5

De verwachting van deze verdeling is berekend in de onderste rij:

{\rm {E}}(Z|M=3)=\sum _{z=2}^{12}z\cdot p_{Z}(z|M=3)={\tfrac {24}{5}}.

De voorwaardelijke verwachting van het totale ogenaantal Z als we weten dat het maximale ogenaantal M gelijk is aan 3, is dus 24/5. Als over het maximale ogenaantal niets bekend is, verwachten we als totale ogenaantal EZ = 7. Als het maximum van de ogenaantallen echter 3 is, dan kunnen we geen hoge ogen gegooid hebben en blijkt de verwachting van het totaal ook kleiner dan 7 te zijn.

Definitie 6.5.1
Laat de s.v.-en X en Y een simultane verdeling hebben en zij P(Y=y) > 0. Onder de voorwaardelijke verwachting(swaarde) van X gegeven Y=y verstaan we het getal

{\rm {E}}(X|Y=y)=\sum _{x\in S_{X}}x\cdot p_{X}(x|Y=y)

,

mits de som absoluut convergeert, dus mits

\sum _{x\in S_{X}}|x|\cdot p_{X}(x|Y=y)<\infty .

Voorbeeld 2
Stel voor zekere 0 < y < 1 is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y binomiaal verdeeld met parameters n en y. Dan is E(X|Y=y) = ny.

Voorbeeld 3
Stel voor zekere 0 < y < 1 is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y geometrisch verdeeld met parameter y. Dan is E(X|Y=y) = 1/y.

Voorbeeld 4
Stel voor zekere y ∈ $\mathbb {N}$ is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y binomiaal verdeeld met parameters y en p. Dan is E(X|Y=y) = yp.

Voorbeeld 5
Stel voor zekere y > 0 is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y Poisson-verdeeld met parameter y. Dan is E(X|Y=y) = y.

Het zal duidelijk zijn dat de voorwaardelijke verwachting van X gegeven Y=y afhankelijk is van y. In de voorbeelden 2 - 5 is dat ook duidelijk te zien. We berekenen deze afhankelijkheid ook eens in de situatie van voorbeeld 1.

Voorbeeld 6 (twee worpen met een dobbelsteen; vervolg)
In voorbeeld 1 berekenden we dat E(Z|M=3) = 24/5. Ook voor andere waarden van M kunnen we de voorwaardelijke verwachting van Z bepalen. In de volgende tabel staan de voorwaardelijke verdelingen van Z gegeven de waarden m van M en tevens de berekening van de voorwaardelijke verwachtingswaarden.

	$z$	2	3	4	5	6	7	8	9	10	11	12	totaal
$m$

1	$P(Z=z\|M=1)$	1	0	0	0	0	0	0	0	0	0	0	1
	$zP(Z=z\|M=1)$	2	0	0	0	0	0	0	0	0	0	0	2

2	$P(Z=z\|M=2)$	0	2/3	1/3	0	0	0	0	0	0	0	0	1
	$zP(Z=z\|M=2)$	0	2	4/3	0	0	0	0	0	0	0	0	10/3

3	$P(Z=z\|M=3)$	0	0	2/5	2/5	1/5	0	0	0	0	0	0	1
	$zP(Z=z\|M=3)$	0	0	8/5	10/5	6/5	0	0	0	0	0	0	24/5

4	$P(Z=z\|M=4)$	0	0	0	2/7	2/7	2/7	1/7	0	0	0	0	1
	$zP(Z=z\|M=4)$	0	0	0	10/7	12/7	14/7	8/7	0	0	0	0	44/7

5	$P(Z=z\|M=5)$	0	0	0	0	2/9	2/9	2/9	2/9	1/9	0	0	1
	$zP(Z=z\|M=5)$	0	0	0	0	12/9	14/9	16/9	18/9	10/9	0	0	70/9

6	$P(Z=z\|M=6)$	0	0	0	0	0	2/11	2/11	2/11	2/11	2/11	1/11	1
	$zP(Z=z\|M=6)$	0	0	0	0	0	14/11	16/11	18/11	20/11	22/11	12/11	102/11

Hieronder staat het resultaat van de berekening samengevat:

$m$	1	2	3	4	5	6
${\rm {E}}(Z\|M=m)$	2	10/3	24/5	44/7	70/9	102/11

De tabel laat zien hoe E(Z|M=m) afhangt van m. In formule zouden we kunnen schrijven:

{\rm {E}}(Z|M=m)={\frac {m(3m-1)}{2m-1}}

We zien dus dat E(X|Y=y) afhankelijk is van y. Omdat Y een s.v. is en de (waargenomen) waarde y van Y dus door het toeval bepaald is, zal ook de waarde E(X|Y=y) door het toeval bepaald zijn. Zo zullen we in voorbeeld 6 als bij de twee worpen het maximale ogenaantal 2 is, voor de voorwaardelijke verwachting van het totale ogenaantal de waarde 10/3 vinden; is daarentegen het maximale ogenaantal 25, dan vinden we voor het voorwaardelijk verwachte ogenaantal de waarde 70/9. De voorwaardelijke verwachting E(X|Y=y) is dus op te vatten als de waarde van een s.v. die van Y afhangt. We noemen die s.v. de voorwaardelijke verwachting van X gegeven Y. In het volgende schema zien we dit in beeld gebracht; daarin duiden we de functie die aan y de waarde E(X|Y=y) toevoegt, voor het gemak even aan door g, dus g(y) = E(X|Y=y).

S{\xrightarrow {\quad \quad \quad \quad g\circ Y\quad \quad \quad \quad }}\mathbb {R}

S{\xrightarrow {\quad Y\quad }}\mathbb {R} {\xrightarrow {\ \ g={\rm {E}}(X|Y=\,\cdot \,)\ }}\mathbb {R}

s\ \ \mapsto \ Y(s)\ \mapsto \ g(Y(s))={\rm {E}}(X|Y=Y(s))

y\quad \mapsto \ g(y)={\rm {E}}(X|Y=y)

De s.v. goY (meestal geschreven als g(Y)) is dus de bedoelde voorwaardelijke verwachting van X gegeven Y. Het is de s.v. die bij de uitkomst s, dus als Y de waarde Y(s) aanneemt, zelf de waarde E(X|Y=Y(s)) aanneemt.

Definitie 6.5.2
Laat de s.v.-en X en Y een simultane verdeling hebben en zij P(Y=y) > 0. Onder de voorwaardelijke verwachting van X gegeven Y verstaan we de stochastische variabele E(X|Y) gedefinieerd door E(X|Y)(s) = E(X|Y=Y(s)).

We kunnen nu in de voorbeelden 2 - 5 deze s.v. E(X|Y) bepalen.

Voorbeeld 7 (vervolg van voorbeeld 2)
Omdat E(X|Y=y) = ny, volgt E(X|Y) = nY.

Voorbeeld 8 (vervolg van voorbeeld 3)
Omdat E(X|Y=y) = 1/y, volgt E(X|Y) = 1/Y.

Voorbeeld 9 (vervolg van voorbeeld 4)
Omdat E(X|Y=y) = yp, volgt E(X|Y) = Yp.

Voorbeeld 10 (vervolg van voorbeeld 5)
Omdat E(X|Y=y) = y, volgt E(X|Y) = Y.

Voorbeeld 11 (vervolg van voorbeeld 6)
Ga na dat E(Z|M) = M(3M-1)/(2M-1).

We zien in de voorbeelden duidelijk hoe E(X|Y) een functie is van Y. De verdeling van E(X|Y) volgt dan ook uit de verdeling van Y op de gebruikelijke manier. Dwz.

\,P({\rm {E}}(X|Y)=z)=\sum _{\{y|{\rm {E}}(X|Y=y)=z\}}P(Y=y)

,

waarbij we dus sommeren over alle y die tot dezelfde waarde z = E(X|Y=y) leiden.

Voorbeeld 12 (vervolg van voorbeeld 7)
De kansverdeling van E(X|Y) wordt gegeven door: P(E(X|Y) = ny) = P(Y=y), voor y ∈ S_Y. Als we de kansverdeling van Y kennen, dan volgt ook die van E(X|Y).

Wat zal de verwachting E(E(X|Y)) van de voorwaardelijke verwachting E(X|Y) zijn? Die moet natuurlijk gelijk zijn aan EX. E(X|Y) is een functie van Y, dus we berekenen:

{\rm {E}}({\rm {E}}(X|Y))=\sum _{y}{\rm {E}}(X|Y=y)P(Y=y)=\sum _{x,y}x\cdot p_{X}(x|Y=y)P(Y=y)=

=\sum _{x,y}x\cdot p_{X}(x|Y=y)P(Y=y)=\sum _{x,y}x\cdot p_{X,Y}(x,y)={\rm {E}}X

,

Uit het bovenstaande blijkt tevens dat als EX bestaat, ook E(X|Y=y) bestaat (mits P(Y=y) > 0); immers voor elke y met P(Y=y) > 0 is:

\sum _{x}|x|\cdot p_{X}(x)=\sum _{x,y'}|x|\cdot p_{X}(x|Y=y')P(Y=y')\geq \sum _{x}|x|\cdot p_{X}(x|Y=y)P(Y=y).

De volgende stelling vat deze resultaten samen.

Stelling 6.5.1
Laat X en Y een simultane verdeling hebben en EX bestaan, dan geldt:

(a) E(X|Y=y) bestaat voor elke y met P(Y=y) > 0

(b) E(E(X|Y)) = EX.

Voorbeeld 13 (twee worpen met een dobbelsteen; vervolg)
In voorbeeld 6 berekenden we E(Z|M=m) als functie van M. Het resultaat staat, met de bijbehorende kansverdeling, in de volgende tabel; daarin is ook de verwachting van E(Z|M) uitgerekend.

$m$	1	2	3	4	5	6	totaal
$P(M=m)$	1/36	3/36	5/36	7/36	9/36	11/36	36/36
${\rm {E}}(Z\|M=m)$	2	10/3	24/5	44/7	70/9	102/11
${\rm {E}}(Z\|M=m)P(M=m)$	2/36	10/36	24/36	44/36	70/36	102/36	252/36 = 7

We zien dat inderdaad E(E(Z|M)) = 7 = EZ.

Voorbeeld 14 (vervolg van voorbeeld 9)
Stel Y is geometrisch verdeeld met parameter q, dan is: EX = E(E(X|Y)) = pEY = p/q.

Omdat de voorwaardelijke verwachting E(X|Y=y) eigenlijk een "gewone" verwachtingswaarde is, heeft hij onder andere de eigenschappen die in stelling 6.4.1 voor de verwachtingswaarde genoemd worden, dus:

Stelling 6.5.2
Laat X, Y en Z een simultane verdeling hebben. Indien P(Y=y) > 0 geldt:

(a) E(X + Z|Y=y) = E(X|Y=y) + E(Z|Y=y)

(b) E(aX + b|Y=y) = a E(X|Y=y) + b, voor alle a,b ∈ R

(c) als X en Y o.o. zijn, dan is E(X|Y=y) = EX.

Voor de voorwaardelijke verwachting geldt een analoge eigenschap als in stelling 6.4.1.c, waar bleek dat voor X₁ en X₂ o.o., EX₁X₂ = EX₁.EX₂. Als X en Y voorwaardelijk gegeven een gebeurtenis A onafhankelijk zijn, dan kunnen we ook de voorwaardelijke verwachting van het product van X en Y schrijven als het product van de voorwaardelijke verwachtingen, steeds gegeven A. Voor de gewone verwachting hoeft dit dan niet te gelden. De volgende voorbeelden verduidelijken we dit.

Voorbeeld 15
Laat X₁ en X₂ twee onafhankelijke alternatieven zijn, beide met succeskans p, dan is:

P(X_{1}X_{2}=0|X_{1}+X_{2}=1)=1

,

dus

{\rm {E}}(X_{1}X_{2}|X_{1}+X_{2}=1)=0

;

echter

P(X_{1}=0|X_{1}+X_{2}=1)={\tfrac {1}{2}}

,

zodat

{\rm {E}}(X_{1}|X_{1}+X_{2}=1)={\tfrac {1}{2}}.

Evenzo voor X₂, dus

{\rm {E}}(X_{1}X_{2}|X_{1}+X_{2}=1)=0\neq {\tfrac {1}{4}}={\rm {E}}(X_{1}|X_{1}+X_{2}=1){\rm {E}}(X_{2}|X_{1}+X_{2}=1).

Hoewel X₁ en X₂ o.o. zijn, zijn ze gegeven X₁+ X₂= 1 afhankelijk.

Voorbeeld 16
In een doos bevinden zich twee (oneerlijke) munten, genummerd 1 en 2, met kansen op "munt" resp. 1/3 en 2/3. We nemen lukraak een munt M uit de doos en werpen er twee keer mee. De worpen zijn van elkaar onafhankelijk. Met X₁ en X₂ geven we de uitkomst van resp. de eerste en tweede worp aan en wel zo dat X_i= 0 of 1 al naar gelang de uitkomst "kruis" dan wel "munt" is. Dan zijn, gegeven de munt, X₁ en X₂ onafhankelijk en is voor m = 1,2:

{\rm {E}}(X_{1}X_{2}|M=m)={\rm {E}}(X_{1}|M=m){\rm {E}}(X_{2}|M=m)={\tfrac {m^{2}}{9}}.

Echter

{\rm {E}}(X_{1}|M)={\rm {E}}(X_{2}|M)={\frac {M}{3}}

,

dus is

{\rm {E}}X_{1}={\rm {E}}X_{2}={\tfrac {1}{3}}{\rm {E}}M={\tfrac {1}{3}}({\tfrac {1}{2}}\times 1+{\tfrac {1}{2}}\times 2)={\tfrac {1}{2}}

en

{\rm {E}}X_{1}X_{2}={\tfrac {1}{2}}{\rm {E}}(X_{1}X_{2}|M=1)+{\tfrac {1}{2}}{\rm {E}}(X_{1}X_{2}|M=2)={\tfrac {1}{2}}({\tfrac {1}{9}}+{\tfrac {4}{9}})={\tfrac {5}{18}}

,

zodat blijkt dat

{\rm {E}}X_{1}X_{2}\neq {\rm {E}}X_{1}{\rm {E}}X_{2}

.

Dus X₁ en X₂ zijn afhankelijk, maar gegeven de munt M onafhankelijk.

We bespreken nu nog enkele voorbeelden waarin met voorwaardelijke verwachtingen gerekend wordt.

Voorbeeld 17
De doelman van FC DE TRAPPERS speelt na de training vaak nog wat met z'n zoontje buiten. Afhankelijk van de beschikbare tijd vuurt het knaapje enkele ballen, zeg N, af op z'n vader, die in het doel staat. We nemen aan dat N Poisson-verdeeld is met parameter μ. De doelman kan door de bank genomen een fractie p van de afgevuurde ballen tegenhouden. Het aantal gestopte ballen noemen we X. Dan is de voorwaardelijke verdeling van X gegeven N=n binomiaal met parameters n en p. Dan is dus:

\,P(X=x|N=n)={\tbinom {n}{x}}p^{x}(1-p)^{n-x}

,

voor x = 0,1,...,n, zodat E(X|N=n) = np en E(X|N) = Np, met verdeling

\,P({\rm {E}}(X|N)=np)=P(N=n)={\frac {\mu ^{n}}{n!}}e^{-\mu }

,

voor n = 0,1,...

We kunnen ook de (onvoorwaardelijke) verdeling van X bepalen:

\,P(X=x)=\sum _{n\geq 0}P(X=x|N=n)P(N=n)=\sum _{n=x}^{\infty }{\tbinom {n}{x}}p^{x}(1-p)^{n-x}{\frac {\mu ^{n}}{n!}}e^{-\mu }=

\,={\frac {\mu ^{x}}{x!}}p^{x}e^{-\mu }\sum _{n=x}^{\infty }(1-p)^{n-x}{\frac {\mu {n-x}}{(n-x)!}}={\frac {(\mu p)^{x}}{x!}}e^{-\mu p}

,

voor x = 0,1,2,...; dus X heeft een Poisson-verdeling met parameter μp. Daaruit volgt direct: EX = μp en inderdaad is ook E(E(X|N)) = ENp = μp.

Als de doelman thuiskomt en tegen z'n vrouw zegt dat hij 10 ballen die het zoontje afvuurde, gestopt heeft, dan zal z'n vrouw natuurlijk vragen hoeveel het zoontje er afgevuurd heeft. We berekenen daarom de voorwaardelijke verdeling van N gegeven X=x; volgens de regel van Bayes is dat:

\,P(N=n|X=x)={\frac {P(X=x|N=n)P(N=n)}{P(X=x)}}={\frac {{n \choose x}p^{x}(1-p)^{n-x}{\frac {\mu ^{n}}{n!}}e^{-\mu }}{{\frac {(\mu p)^{x}}{x!}}e^{-\mu p}}}=

,

\,{\frac {(\mu (1-p))^{n-x}}{(n-x)!}}(1-p)^{n-x}e^{-\mu (1-p)}

,

voor n = x,x+1,... We zien dat, gegeven het aantal gestopte ballen X=x, het aantal niet-gestopte ballen N-X (dat onder de voorwaarde X=x gelijk is aan N-x) een Poisson-verdeling heeft met parameter μ(1-p). Daaruit kunnen we weer afleiden: E(N|X=x) = E(N-x|X=x) + x = μ(1-p) + x zodat E(N|X) = X + μ(1-p) en EN = E(E(N|X)) = EX + μ(1-p) = μp + μ(1-p) = μ, hetgeen we overigens al wisten.

Voorbeeld 18
We maken een eenvoudig model om werkloosheidscijfers te behandelen. Daartoe beschouwen we de populatie S = {Nederlanders van 25 tot 65 jaar} (= uitkomstenruimte) en voeren we twee s.v.-en in, nl. N de provincie waar de betrokkene (= uitkomst) woont en X, die aangeeft of de betrokkene een volledige baan heeft (X=0), een deeltijdbaan (X = 1/2) of zonder werk is (X=1). Als kansmechanisme denken we ons een symmetrische kansruimte. Dan is:

P(N=n)={\frac {{\text{aantal uit de populatie dat in de provincie }}n{\text{ woont}}}{\text{totale aantal uit de populatie}}}

en

P(X=1|N=n)={\frac {{\text{aantal uit de populatie dat in }}n{\text{ woont en zonder werk is}}}{{\text{totale aantal uit de populatie dat in }}n{\text{ woont}}}}

$P(X=1/2|N=n)$ en $P(X=0|N=n)$ zijn op analoge wijze gedefinieerd.

Voor de provincie n kunnen we als werkloosheidscijfer $E(X|N=n)$ hanteren en voor Nederland als geheel $EX$ . Tussen de deelcijfers per provincie en het cijfer voor geheel Nederland bestaat de relatie

{\rm {E}}X={\rm {E}}({\rm {E}}(X|N))=\sum _{n}{\rm {E}}(X|N=n)P(N=n).

Het cijfer voor geheel Nederland krijgen we dus door de cijfers van de provincies gewogen te middelen, met als gewichten de relatieve aandelen van de provincies in de totale populatie.

Voorbeeld 19 (levensduur)
De s.v. L stelt de levensduur (d.i. de leeftijd bij sterven, gemeten in gehele jaren) van een mens (apparaat, onderdeel) voor. De levensduurverdeling is p_L, veelal gegeven door de overlevingskansen P(L ≥ k), voor k = 0,1,2,... De verwachte levensduur (voor een mens wel levensverwachting genoemd) is EL, die we kunnen berekenen als de som van de overlevingskansen (ga na):

{\rm {E}}L=\sum _{k}P(L\geq k).

(De levensverwachting is eigenlijk gelijk aan EL + 0,5, aangezien leeftijden gemeten worden als volbrachte gehele jaren; we zullen daar niet verder op ingaan.)

Hoe lang zal iemand die juist 65 jaar is geworden, nog leven? We moeten dan kijken naar de voorwaardelijke verdeling van L gegeven L ≥ 65. (Let op het verschil tussen leeftijd en levensduur.) Deze verdeling wordt gegeven door de voorwaardelijke overlevingskansen,

P(L\geq 65+k|L\geq 65)={\frac {P(L\geq 65+k)}{P(L\geq 65)}}

,

voor k = 1,2,... aangeduid als leeftijdsspecifieke overlevingskansen voor een 65-jarige. De voorwaardelijke levensverwachting gegeven dat men de leeftijd van 65 jaar heeft bereikt, aangeduid als de leeftijdsspecifieke levensverwachting voor een 65-jarige, is:

{\rm {E}}(L|L\geq 65)=\sum _{l=1}^{\infty }P(L\geq l|L\geq 65)=65+\sum _{k=1}^{\infty }P(L\geq 65+k|L\geq 65).

Ga zelf na hoe we de overlevingskansen in een bevolking kunnen schatten.

Aangezien E(X|Y) een functie is van Y, zal het voor een andere functie van Y, zeg h(Y), niet uitmaken of we E(h(Y)X|Y) bepalen, dan wel h(Y)·E(X|Y), immers gegeven een waarde van Y is h(Y) toch constant. We kunnen dit eenvoudig als volgt laten zien:

{\rm {E}}(h(Y)X|Y=y)=\sum _{y\in S_{Y}}h(y)\cdot x\cdot p_{X}(x|Y=y)=h(y)\sum _{y\in S_{Y}}x\cdot p_{X}(x|Y=y)=h(y)\cdot {\rm {E}}(X|Y=y).

Stelling 6.5.3
Laat X en Y s.v.-en zijn, gedefinieerd op dezelfde kansruimte en P(Y=y) > 0, dan geldt voor iedere s.v. h(Y) die een functie is van Y: E(h(Y)X|Y) = h(Y)·E(X|Y).

Voorbeeld 20
De s.v. Y is uniform verdeeld op de getallen 1/10, 2/10, ..., 10/10. Gegeven een waarde y van Y is de s.v. X geometrisch verdeeld met parameter y. Dan is

{\rm {E}}XY=\sum _{x,y}xy\cdot p_{X,Y}(x,y)=\sum _{k=1}^{10}\sum _{x=1}^{\infty }x{\tfrac {k}{10}}{\tfrac {1}{10}}(1-{\tfrac {k}{10}})^{x-1}{\tfrac {k}{10}}=\ldots =1.

Dit resultaat krijgen we eenvoudiger en sneller door toepassing van bovenstaande stelling:

{\rm {E}}XY={\rm {E}}{\rm {E}}(XY|Y)={\rm {E}}(Y\cdot {\rm {E}}(X|Y))={\rm {E}}(Y{\frac {1}{Y}})=1.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

7.1 Inleiding

In het voorgaande hebben we ons beziggehouden met de verwachtingswaarde van een s.v. en opgemerkt dat EX een maat is om het "midden" van de verdeling van X te karakteriseren. Behalve het "midden" van de verdeling willen we ook andere aspecten van de verdeling van X karakteriseren door een of ander getal. Daartoe blijken de verwachtingswaarden van gehele machten van X, de zgn. momenten, geschikte grootheden te zijn. Deze momenten spelen ook in de voortgezette theorie een belangrijke rol.

Definitie 7.1.1
Onder het n^e moment van een s.v. X verstaan we het getal EXⁿ. Onder het n^e centrale moment van X verstaan we het getal E(X-EX)ⁿ. (mits deze verwachtingswaarden bestaan).

We kunnen zeggen dat over het algemeen naast het eerste moment EX als aanduiding van de "ligging" van de verdeling van X, van de hogere momenten de centrale momenten een belangrijke rol spelen om de "vorm" van de verdeling van X te karakteriseren. Dat is ook begrijpelijk, want de "vorm" van de verdeling verandert niet als we de verdeling verschuiven, dwz. als we in plaats van X de s.v. X + b beschouwen. Het ligt dan voor de hand om naar de verdeling van X - EX te kijken, waarvan de "ligging" om 0 is.

Niet alle momenten van een s.v. hoeven te bestaan. De volgende stelling zegt daar iets over.

Stelling 7.1.1
Als van een s.v. X het n^e moment bestaat, dan bestaan ook het n^e centrale moment en alle lagere momenten en centrale momenten.

Bewijs: Voor k ≤ n geldt:

|x|^{k}\leq 1+|x|^{n}

,

dus

\sum _{x\in S_{X}}|x|^{k}p_{X}(x)\leq 1+\sum _{x\in S_{X}}|x|^{n}p_{X}(x).

.

Verder is

|X-EX|^{n}=|\sum _{k=0}^{n}{n \choose k}X^{k}(-EX)^{n-k}|\leq \sum _{k}{n \choose k}|X|^{k}|EX|^{n-k}

.

7.2 Variantie en standaardafwijking

Wij zullen ons, naast de "ligging" van de verdeling van X, slechts bezighouden met de "spreiding" in die verdeling. Met spreiding bedoelen we de mate waarin de waarden van X onderling nog kunnen verschillen. We spreken ook wel van de "breedte" van de verdeling, aangezien meer spreiding in de waarden van X de verdeling breder maakt, of ook wel van de "schaal" van de verdeling. Om de spreiding te meten, moeten we nagaan hoe de waarden van X nog uiteen kunnen lopen; we doen dat door te kijken naar de mate waarin de waarden van X nog kunnen afwijken van het "midden", dus van EX. Die afwijkingen worden gegeven door de s.v. |X-EX|, dus door de afstanden die X nog tot EX kan hebben. Hoewel ook de verwachtingswaarde van die afstanden, dus E|X-EX|, als maat voor spreiding in aanmerking komt, is het gebruikelijk de verwachte kwadratische afstand, dus het tweede centrale moment E(X-EX)², als maat te nemen. Deze grootheid wordt variantie genoemd.

Definitie 7.2.1
Het tweede centrale moment van X noemen we de variantie van X en we duiden het aan door var X, dus

\mathrm {var} \,X=E(X-EX)^{2}.

Omdat de variantie een kwadratische grootheid is, wordt, als X in cm is gemeten, de variantie in cm² uitgedrukt. Dit is in de praktijk een bezwaar; dit wordt nog duidelijker als we de variantie van bv. 10X bepalen, dan blijkt dat var 10X = 100·var X; dus een schaalverandering met een factor 10 levert voor de maat van die schaal een factor 100. vandaar dat we ook vaak de wortel uit de variantie, die we standaardafwijking noemen, als maat voor spreiding zullen gebruiken.

Definitie 7.2.2
Onder de standaardafwijking (of standaarddeviatie) van een s.v. X, aangeduid doorσ σ_X (of: σ(X)), verstaan we de grootheid:

\sigma _{X}={\sqrt {\mathrm {var} \,X}}.

Voor de berekening van var X kunnen we soms handig gebruik maken van de volgende formule, die eenvoudig uit de definitie van var X volgt.

Stelling 7.2.1 (rekenformule voor variantie)
Voor de variantie van een s.v. X geldt:

\mathrm {var} \,X=E(X^{2})-(EX)^{2}.

Overigens is enige voorzichtigheid bij berekeningen met deze formule geboden. Behalve door rekenfouten, ontstaat ook door vroegtijdige of te grove afronding van tussenresultaten gemakkelijk een onnauwkeurige waarde voor de variantie, soms zelfs een negatieve waarde.

We laten in een voorbeeld enige berekeningen zien.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
In de onderstaande tabel staat de verdeling van M en zijn tevens de nodige berekeningen uitgevoerd om var M te bepalen.

$m$	$P(M=m)$	$mP(M=m)$	$m-EM$	$(m-EM)^{2}$	$(m-EM)^{2}P(M=m)$	$m^{2}P(M=m)$
1	1/36	1/36	–125/36	15625/1296	15625/46656	1/36
2	3/36	6/36	– 89/36	7921/1296	23763/46656	12/36
3	5/36	15/36	– 53/36	2809/1296	14045/46656	45/36
4	7/36	28/36	– 17/36	289/1296	2023/46656	112/36
5	9/36	45/36	19/36	361/1296	3249/46656	225/36
6	11/36	66/36	55/36	3025/1296	33275/46656	396/36
totaal	36/36	161/36			91980/46656	791/36

We zien dat: EM = 161/36 en

\mathrm {var} \,M=E(M-EM)^{2}=\sum _{m=1}^{6}(m-{\frac {161}{36}})^{2}\cdot P(M=m)={\frac {91980}{46656}}\approx 1{,}97.

Met de rekenformule krijgen we eveneens:

\mathrm {var} \,M=EM^{2}-(EM)^{2}=\sum _{m=1}^{6}m^{2}P(M=m)-(EM)^{2}={\frac {791}{36}}-({\frac {161}{36}})^{2}={\frac {91980}{46656}}.

Voor de standaardafwijking volgt dan:

\sigma _{M}={\sqrt {\mathrm {var} \,M}}={\sqrt {\frac {91980}{46656}}}=1{,}40.

We berekenen ook var Z:

$z$	2	3	4	5	6	7	8	9	10	11	12	totaal
$P(Z=z)$	1/36	2/36	3/36	4/36	5/36	6/36	5/36	4/36	3/36	2/36	1/36	36/36
$zP(Z=z)$	2/36	6/36	12/36	20/36	30/36	42/36	40/36	36/36	30/36	22/36	12/36	252/36
$z^{2}P(Z=z)$	4/36	18/36	48/36	100/36	180/36	294/36	320/36	324/36	300/36	242/36	144/36	1974/36

Dus

\mathrm {var} \,Z=EZ^{2}-(EZ)^{2}={\frac {1974}{36}}-49={\frac {210}{36}}=5{\tfrac {5}{6}}

en

\sigma _{Z}={\sqrt {\mathrm {var} \,Z}}={\sqrt {\frac {210}{36}}}=2{,}42.

Merk op dat de spreiding in Z groter is dan in M.

De volgende eigenschappen van variantie zijn van belang.

Stelling 7.2.2 (eigenschappen van variantie en standaardafwijking)
Voor de variantie van een s.v. X geldt:

(a) var X ≥ 0 en σ_X ≥ 0

(b) als var X = 0, dan is X ontaard (dwz. P(X=EX) = 1)

(c) var(aX + b) = a²var X en σ(aX+b) = |a| σ_X, voor alle a en b.

Bewijs: (c) var(aX+b) = E(aX+b - E(aX+b))² = E(aX + b - aEX - b)² = a²E(X-EX)² = a²var X.

Voorbeeld 2 (twee worpen met een dobbelsteen; vervolg)
We berekenden

\mathrm {var} \,Z=EZ^{2}-(EZ)^{2}=5{\tfrac {5}{6}}

en

\sigma _{Z}={\sqrt {\frac {210}{36}}}=2{,}42.

Nu is Z = X + Y, waarin X en Y, de uitkomsten van de afzonderlijke worpen, gelijk verdeeld zijn. We weten al dat de verdeling van X + Y een andere is dan van X + X = 2X; dit blijkt ook nog als we de variantie van 2X berekenen:

\mathrm {var} (2X)=2^{2}\mathrm {var} \,X=4\sum _{x=1}^{6}(x-{\tfrac {7}{2}})^{2}{\tfrac {1}{6}}=4\times {\tfrac {105}{36}}=11{\tfrac {2}{3}}.

Vergelijk deze waarde met var Z.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

7.3 Variantie van bekende discrete verdelingen

Als vervolg op paragraaf 6.2 sommen we in deze paragraaf de varianties van enkele bekende discrete verdelingen op.

Stelling 7.3.1

1. Ontaarde verdeling.

\mathrm {var} \,X=0

.

2. Alternatieve verdeling (in 0 en 1; p_X(1) = p).

\mathrm {var} \,X=p(1-p)

.

3. Uniforme verdeling (op de getallen x₁,x₂,...,x_N).

\mathrm {var} \,X={\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\bar {x}})^{2}

.

4. Binomiale verdeling (met parameters n en p).

\mathrm {var} \,X=np(1-p)

.

5. Hypergeometrische verdeling (met parameters N, M en n).

\mathrm {var} \,X=n{\frac {M}{N}}{\frac {N-M}{N}}{\frac {N-n}{N-1}}=np(1-p){\frac {N-n}{N-1}}

.

waarin we p = M/N gesteld hebben.

6. Geometrische verdeling (met parameter p).

\mathrm {var} \,X={\frac {1-p}{p^{2}}}

.

7. Poisson-verdeling (met parameter μ).

\mathrm {var} \,X=\mu

.

We zien dat de variantie van de hypergeometrische verdeling op een factor (N-n)/(N-1) na gelijk is aan de variantie van de binomiale verdeling; deze factor heet correctiefactor voor eindige populatie. Deze factor heet zo omdat bij trekkingen zonder terugleggen uit een dichotome populatie (dwz. een populatie met twee kenmerken, bv succes of mislukking) het aantal successen X bij een eindige populatie hypergeometrisch verdeeld is en bij een niet-eindige populatie (of als we trekken met terugleggen) binomiaal.

7.4 Covariantie en correlatie

Voor simultane verdelingen is het van belang dat we een maat hebben om de "samenhang" tussen de s.v.- en te meten. Waar we aan denken bij het begrip samenhang zullen we in een voorbeeld verduidelijken.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
De simultane kansfunctie p_Z,M van Z en M wordt gegeven in de volgende tabel.

p_{Z,M}(z,m)=P(Z=z,M=m)

z

2

3

4

5

6

7

8

9

10

11

12

m

P(M=m)

1

1/36

2

2/36

1/36

3/36

3

2/36

1/36

5/36

4

2/36

1/36

7/36

5

2/36

1/36

9/36

6

2/36

1/36

11/36

P(Z=z)

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

36/36

Daarin kunnen we zien dat kleine waarden voor M samengaan met kleine waarden voor Z, immers als M=1, kan alleen Z=2 voorkomen, en als M=2, zijn voor Z slechts de waarden 3 en 4 mogelijk. Grote waarden van M gaan samen met grote waarden van Z: als M=6, kan Z de waarden 7 tot en met 12 aannemen. Er is weliswaar geen eenduidig verband tussen M en Z, maar we zien dat hoe groter M is, hoe groter waarden voor Z in aanmerking komen.

Om tot een maat voor "samenhang" in de simultane verdeling van twee s.v.-en te komen, bekijken we de afwijkingen X—EX en Y—EY ten opzichte van de verwachtingen: we zien af van de "ligging" van de verdeling. Als kleine waarden van X—EX voornamelijk samengaan met kleine waarden van Y—EY en evenzo de grote waarden, spreken we van een positieve samenhang; het product van de afwijkingen (X—EX)(Y—EY) zal dan overwegend positief zijn. Gaan kleine waarden van de ene s.v. voornamelijk samen met grote waarden van de andere, dan spreken we van een negatieve samenhang en zal (X—EX)(Y—EY) overwegend negatief zijn. De verwachting E(X—EX)(Y—EY) van dit product, covariantie genaamd, zal dus bij positieve samenhang positief zijn en bij negatieve samenhang negatief en karakteriseert dus de samenhang.

Definitie 7.4.1
Onder de covariantie van twee s.v.-en X en Y verstaan we

cov(X,Y) = E((X—EX)(Y—EY)).

Voorbeeld 2 (twee worpen met een dobbelsteen; vervolg)
We berekenen de covariantie van M en Z:

\mathrm {cov} (M,Z)=E((M-EM)(Z-EZ))=E((M-{\frac {161}{36}})(Z-7))=

=(1-{\frac {161}{36}})(2-7){\frac {1}{36}}+(2-{\frac {161}{36}})(3-7){\frac {2}{36}}+...+(6-{\frac {161}{36}})(12-7){\frac {1}{36}}={\frac {105}{36}}=2{\tfrac {11}{12}}

.

We vinden inderdaad een positieve samenhang.

Voor de berekening van cov(X,Y) kunnen we soms handig gebruik maken van de volgende formule, die eenvoudig uit de definitie volgt.

Stelling 7.4.1 (rekenformule voor covariantie)
Voor de covariantie van twee s.v.-en X en Y geldt:

cov(X,Y) = E(XY) — EX·EY.

Voorbeeld 3 (twee worpen met een dobbelsteen; vervolg)
We berekenen de covariantie van M en Z met de rekenformule. Daartoe bepalen we eerst:

EMZ=1\times 2\times {\frac {1}{36}}+2\times 3\times {\frac {2}{36}}+...+6\times 12\times {\frac {1}{36}}={\frac {1232}{36}}

,

zodat volgt:

\mathrm {cov} (M,Z)=EMZ-EM\cdot EZ={\frac {1232}{36}}-{\frac {161}{36}}\times 7={\frac {105}{36}}

.

Overigens kunnen we EMZ ook handig als volgt bepalen:

EMZ=E(E(MZ|M))=E(M\cdot E(Z|M))={\frac {1232}{36}}

,

waarin we gebruik hebben gemaakt van al eerder gemaakte berekeningen en de volgende tabel:


$m$	1	2	3	4	5	6	totaal

$P(M=m)$	1/36	3/36	5/36	7/36	9/36	11/36	36/36
$\operatorname {E} (Z\|M=m)$	2	10/3	24/5	44/7	70/9	102/11
$m\operatorname {E} (Z\|M=m)P(M=m)$	2/36	20/36	72/36	176/36	350/36	612/36	1232/36	$=\operatorname {E} MZ$

Enkele voor de hand liggende eigenschappen van de covariantie vermelden we in de volgende stelling.

Stelling 7.4.2 (eigenschappen van covariantie)
Laat X en Y een simultane verdeling hebben en X₁, X₂ en Y eveneens, dan geldt:

(a) cov(X,Y) = cov(Y,X)

(b) cov(X,X) = var X

(c) cov(X₁ + X₂,Y) = cov(X₁,Y) + cov(X₂,Y)

(d) cov(aX+b,Y) = a cov(X,Y), voor alle a,b ∈ R

(e) als X en Y o.o. zijn, is cov(X,Y) = 0.

Bewijs: We bewijzen alleen e. Als X en Y o.o. zijn, is EXY = EX·EY, dus volgt het gestelde direct uit de rekenformule.

Voorbeeld 4 (twee worpen met een dobbelsteen; vervolg)
We berekenen de covariantie van M en X + Y (= Z).

\mathrm {cov} (M,X+Y)=\mathrm {cov} (M,X)+\mathrm {cov} (M,Y)

.

Nu is

EMX=E(E(MX|M))=E(M\cdot E(X|M))={\frac {616}{36}}

,

zodat

\mathrm {cov} (M,X)=\mathrm {cov} (M,Y)=EMX-EM\cdot EX={\frac {616}{36}}-{\frac {161}{36}}\times {\frac {7}{2}}={\frac {35}{24}}

.

We vinden dus ook op deze manier dat:

\mathrm {cov} (M,Z)=\mathrm {cov} (M,X+Y)=2\,\mathrm {cov} (M,X)={\frac {35}{12}}

.

Vergelijk met voorbeeld 2.

De laatste uitspraak van stelling 2 verdient nog enige aandacht. Het lijkt vanzelfsprekend dat cov(X,Y) = 0 als X en Y o.o. zijn en er dus geen samenhang is. Het omgekeerde is echter niet waar, dwz. uit het feit dat cov(X,Y) = 0 mogen we niet de conclusie trekken dat X en Y onafhankelijk zijn. De covariantie is nl. een maat voor "lineaire samenhang" tussen twee s.v.-en en als cov(X,Y) = 0, dan kunnen we slechts zeggen dat er geen lineaire samenhang is tussen X en Y; ze kunnen dan wel in andere zin samenhangen en dus afhankelijk zijn, zoals uit het volgende voorbeeld blijkt.

Voorbeeld 5
Kies X en Y zo dat P(X=0 en Y=±1) = P(X=±1 en Y=0) = 1/4; dan is EXY = EX = EY = 0, zodat cov(X,Y) = 0. Echter X en Y zijn afhankelijk, want P(X=1 en Y=1) = 0 ≠ P(X=1)P(Y=1) = 1/16.

Met behulp van de covariantie kunnen we een uitdrukking vinden voor de variantie van de som van een n-tal s.v.-en:

Stelling 7.4.3
Laat X₁,X₂,...,X_n een simultane verdeling hebben met σ(X_i) <∞, dan is:

\mathrm {var} (X_{1}+X_{2}+...+X_{n})=\mathrm {cov} (\sum X_{i},\sum X_{j})=\sum _{i}\sum _{j}\mathrm {cov} (X_{i},X_{j})=

=\sum _{i}\mathrm {var} X_{i}+2\sum _{i\neq j}\mathrm {cov} (X_{i},X_{j})

.

In het bijzonder vinden we dus voor een tweetal s.v.-en X en Y:

var(X + Y) = var X + var Y + 2\ cov(X,Y).

Als X en Y o.o. zijn, is cov(X,Y) = 0, zodat:

var(X + Y) = var X + var Y;

de variantie van de som of van het verschil is dan de som van de varianties.

Stelling 7.4.4
Als de s.v.-en X₁,X₂,...,X_n paarsgewijs of onderling onafhankelijk zijn en σ(X_i) < ∞, is

\mathrm {var} (X_{1}+X_{2}+\ldots +X_{n})=\mathrm {var} \,X_{1}+\mathrm {var} \,X_{2}+\ldots +\mathrm {var} \,X_{n}

We kunnen de bovenstaande relaties handig gebruiken om de variantie van de binomiale en hypergeometrische verdeling te bepalen.

Voorbeeld 6 (twee worpen met een dobbelsteen; vervolg)
We berekenen de variantie van Z = X + Y. Omdat X en Y o.o. zijn en gelijkverdeeld vinden we:

\mathrm {var} Z=\mathrm {var} (X+Y)=\mathrm {var} \,X+\mathrm {var} \,Y=2\,\mathrm {var} \,X={\frac {210}{36}}=5{\tfrac {5}{6}}

,

zoals we al eerder berekenden.

Voorbeeld 7 (variantie van de binomiale verdeling)
Zij X B(n,p)-verdeeld. Bekijk n onafhankelijke alternatieven X_i met succeskans p, dus P(X_i= 1) = 1 — P(X_i= 0) = p. We stellen Y = ∑ X_i, dan hebben X en Y dezelfde verdeling en dus ook dezelfde variantie. We vinden dan: var X = var Y = var ∑ X_i = ∑ var X_i = ∑ p(1—p) = np(1—p).

Voorbeeld 8 (variantie van de hypergeometrische verdeling)
Zij X hypergeometrisch verdeeld met parameters M, N en n. We beschouwen een aselecte steekproef van omvang n zonder teruglegging uit een vaas met M rode en N-M witte knikkers. We definiëren X_i = 1 of 0 al naar gelang de i-de trekking een rode dan wel een witte knikker oplevert. De (X_i) vormen weer n alternatieven met parameter p = M/N. We stellen Y = ∑ X_i, dan hebben X en Y dezelfde verdeling en dus dezelfde variantie. We vinden dan:

\mathrm {var} X=\mathrm {var} Y=\mathrm {var} \sum X_{i}=\sum \mathrm {var} X_{i}+2\sum \mathrm {cov} (X_{i},X_{j})=np(1-p)+n(n-1)c

;

daarin is

\,c=\mathrm {cov} (X_{i},X_{j})

voor alle i en j, aangezien de simultane verdeling van X_i en X_j voor alle i en j dezelfde is. We kunnen c direct bepalen door:

\,c=\mathrm {cov} (X_{i},X_{j})=EX_{1}X_{2}-EX_{1}.EX_{2}=P(X_{1}=1\ en\ X_{2}=1)-p^{2}=

{\frac {M(M-1)}{N(N-1)}}-{\frac {M^{2}}{N^{2}}}=-{\frac {M(N-M}{(N-1)N^{2}}}=-{\frac {1}{N-1}}p(1-p).

.

Dus

\mathrm {var} X=np(1-p)-{\frac {1}{N-1}}p(1-p)=np(1-p){\frac {N-M}{N-1}}.

We kunnen c ook bepalen door te bedenken dat c niet afhankelijk is van de steekproefomvang n; dan is voor n = N, dus als we alle knikkers trekken: var X = Np(1-p) + N(N-1)c = 0.

Als cov(X,Y) = 0, noemen we X en Y ongecorreleerd; de term hangt samen met het hierna te bespreken begrip correlatie. Ook voor meer dan twee s.v.-en hanteren we de term ongecorreleerd.

Definitie 7.4.2
We noemen de s.v.-en X₁,X₂,...,X_n ongecorreleerd, als voor elk tweetal X_i en X_j geldt dat cov(X_i, X_j) = 0.

Het teken van de covariantie is, zoals we gezien hebben, een maat voor de "aard" van de lineaire samenhang. De grootte van de covariantie is een maat voor de "sterkte" van die lineaire samenhang, in die zin dat hoe meer de samenhang op een lineair verband lijkt hoe groter, absoluut gezien, de waarde van de covariantie is. Daarbij moeten we wel opmerken dat we de absolute grootte van de covariantie moeten zien in relatie met de spreiding; immers de covariantie E(X-EX)(Y-EY) wordt niet alleen bepaald door de samenhang, maar ook door de grootte van de afwijkingen, dus door de spreiding in de verdelingen van X en Y. Als een of beide s.v.-en in een andere schaal gaan meten, veranderd de spreiding gemeten door de standaardafwijking evenredig met de schaalverandering en eveneens de covariantie, zoals uit stelling 2 bleek. We kunnen de covariantie dus standaardiseren door te delen door de standaardafwijkingen; deze gestandaardiseerde vorm noemen we correlatiecoëfficiënt.

Definitie 7.4.3
Onder de correlatiecoëfficiënt ρ(X,Y) van twee s.v.-en X en Y verstaan we

\rho (X,Y)={\frac {\mathrm {cov} (X,Y)}{\sigma (X)\sigma (Y)}}

,

mits σ_X en σ_Y beide bestaan.

Voorbeeld 9 (twee worpen met een dobbelsteen; vervolg)
We berekenen de correlatiecoëfficiënt van M en Z:

\rho (M,Z)={\frac {\mathrm {cov} (M,Z)}{\sigma (M)\sigma (Z)}}\approx {\frac {2{,}92}{1{,}40\times 2{,}42}}=0{,}86.

M en Z zijn dus tamelijk sterk positief gecorreleerd; dat is ook wel te begrijpen, want kleine waarden voor M gaan samen met kleine waarden voor Z en grote waarden voor M met grote voor Z.

De correlatiecoëfficiënt ρ(X,Y) kan slechts waarden aannemen gelegen tussen -1 en 1 (de grenzen meegerekend); de grootte is een directe maat voor de lineaire samenhang tussen X en Y.

We vermelden enkele eigenschappen in de volgende stelling.

Stelling 7.4.5 (eigenschappen van de correlatiecoëfficiënt
Laat X en Y een simultane verdeling hebben, dan geldt:

(a) ρ(X,Y) = ρ(Y,X)

(b) ρ(aX+b,Y) = sgn(a)·ρ(X,Y), voor alle a,b ∈ R, a≠0. (hierin is sgn(a) = 1 als a > 0 en sgn(a) = —1 als a < 0);

(c) |ρ(X,Y)| ≤ 1

(d) |ρ(X,Y)| = 1, dan en slechts dan als X en Y lineair samenhangen, dwz. als P(Y=aX+b) = 1, voor zekere a≠0 en b. Het teken van r is gelijk aan het teken van a.

(e) als X en Y o.o. zijn, is ρ(X,Y) = 0.

Bewijs: We bewijzen alleen c en d. Zij volgen uit de relatie

0\leq \mathrm {var} ({\tfrac {X}{\sigma _{X}}}\pm {\tfrac {Y}{\sigma _{Y}}})=2\pm 2\rho (X,Y)

.

Als het gelijkteken geldt, is ${\tfrac {X}{\sigma _{X}}}\pm {\tfrac {Y}{\sigma _{Y}}}$ ontaard; dus als ρ(X,Y) = ±1, is voor zekere b

P({\tfrac {X}{\sigma _{X}}}\pm {\tfrac {Y}{\sigma _{Y}}}=b)=1

,

dus voor bijna alle uitkomsten s (op een gebeurtenis met kans 0 na) hangen X en Y lineair samen.

Voorbeeld 10 (de hypergeometrische verdeling; vervolg)
We berekenen de correlatiecoëfficiënt van een tweetal X'en:

\rho (X_{1},X_{2})={\frac {\mathrm {cov} (X_{1},X_{2})}{\sigma (X_{1})\sigma (X_{2})}}={\frac {c}{\mathrm {var} X_{1}}}=-{\frac {1}{N-1}}

.

Hieruit blijkt dat X₁ en X₂ negatief samenhangen. Dat is ook begrijpelijk, want als de eerste knikker rood is (X₁= 1), is de voorwaardelijke kans op een tweede rode knikker (X₂= 1) kleiner dan wanneer de eerste knikker wit is (X₂= 0). Verder neemt de afhankelijkheid in betekenis af als N toeneemt, overeenkomstig het feit dat bij toenemende N het verschil tussen steekproeftrekking met en zonder teruglegging aan betekenis verliest.

Voorbeeld 11 (multinomiale verdeling; vervolg)
We bekijken weer drie s.v.-en X, Y en Z, en berekenen de covariantie van het tweetal X en Y. Omdat X en Y beide binomiaal verdeeld zijn met parameters respectievelijk n en p₁ en n en p₂, weten we al dat EX = np₁ en EY = np₂. We leiden af:

EXY=\sum _{n_{1}+n_{2}+n_{3}=n}n_{1}n_{2}{\frac {n!}{n_{1}!n_{2}!n_{3}!}}p_{1}^{n_{1}}p_{2}^{n_{2}}p_{3}^{n_{3}}=n(n-1)p_{1}p_{2}

.

Dus:

\!\,\mathrm {cov} (X,Y)=n(n-1)p_{1}p_{2}-np_{1}np_{2}=-np_{1}p_{2}

.

en

\rho (X,Y)={\frac {-np_{1}p_{2}}{{\sqrt {np_{1}(1-p_{1})}}{\sqrt {np_{2}(1-p_{2})}}}}=-{\sqrt {\frac {p_{1}p_{2}}{(1-p_{1})(1-p_{2})}}}

.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

7.5 De ongelijkheid van Chebyshev

Dat de variantie inderdaad een maat is voor de afwijkingen van de verwachting wordt gedemonstreerd door de ongelijkheid van Chebyshev (ook ongelijkheid van Bienaymé-Chebyshev genoemd). Deze ongelijkheid is vooral van theoretisch belang en laat zien dat de kans op afwijkingen van de verwachtingswaarde begrensd wordt in evenredigheid met de variantie.

Stelling 7.5.1 (ongelijkheid van Chebyshev)
Laat X een s.v. zijn met var X < ∞, dan geldt voor iedere ε > 0:

P(|X-EX|>\epsilon )\leq {\frac {\mathrm {var} (X)}{\epsilon ^{2}}}

.

Bewijs:

\mathrm {var} (X)=E(X-EX)^{2}=\sum _{x\in S_{X}}(x-EX)^{2}P(X=x)\geq \sum _{|x-EX|>\epsilon }(x-EX)^{2}P(X=x)>

>\sum _{|x-EX|>\epsilon }\epsilon ^{2}P(X=x)\geq \epsilon ^{2}.P(|X-EX|>\epsilon )

.

We kunnen deze ongelijkheid ook schrijven als:

P(\left|{\frac {X-EX}{\sigma (X)}}\right|>\epsilon )\leq {\frac {1}{\epsilon ^{2}}}

,

waarin de s.v. X gestandaardiseerd is tot Z = (X-EX)/σ(X), dus met EZ = 0 en var Z = 1. Toepassing is dan blijkbaar alleen zinvol voor waarden van ε > 1, dus voor het afschatten van kansen op waarden van X die meer dan een keer de standaardafwijking van de verwachtingswaarde liggen.

Voorbeeld 1
Zij X B(100,1/5)-verdeeld, dan is EX = 20 en var X = 16. Volgens Chebyshev geldt dan: P(10 < X < 30) = P(|X-20| < 10) > 1 - 16/100 = 0,84. In werkelijkheid is deze kans (hetgeen we hier niet kunnen aantonen) ongeveer gelijk aan 0,994.

Voor praktische berekeningen heeft de ongelijkheid van Chebyshev, zoals het voorbeeld illustreert, weinig betekenis. Het belang ligt vooral in de theoretische toepassing bij het afschatten van kansen in een asymptotische situatie, zoals in de hierna volgende zwakke wet van de grote aantallen.

7.6 De zwakke wet van de grote aantallen

We zullen de ongelijkheid van Chebyshev gebruiken om een belangrijk resultaat uit de kansrekening, de zgn. zwakke wet van de grote aantallen, af te leiden. Deze wet laat zien dat de verdeling van het gemiddelde van een n-tal o.o. en gelijkverdeelde s.v.-en voor toenemede n meer en meer geconcentreerd wordt om de verwachtingswaarde. De wet berust op de ongelijkheid van Chebyshev en het feit dat als X₁,X₂,.... o.o. en gelijkverdeeld zijn:

E{\frac {1}{n}}\sum _{i=1}^{n}X_{i}=EX_{1}

en

\mathrm {var} {\frac {1}{n}}\sum _{i=1}^{n}X_{i}={\frac {1}{n}}\mathrm {var} X_{1}

.

Stelling 7.5.2 (zwakke wet van de grote aantallen)
Zij X₁,X₂... een rij o.o. en gelijkverdeelde s.v.- en met verwachting EX en eindige variantie σ². Zij

{\overline {X_{n}}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}

,

dan geldt voor iedere ε > 0:

\lim _{n\to \infty }P(|{\overline {X_{n}}}-EX|>\epsilon )=0

,

Bewijs: Zij ε > 0, dan volgt:

P(|{\overline {X_{n}}}-EX|>\epsilon )\leq {\frac {\sigma ^{2}}{n\epsilon ^{2}}}\to 0

, als n naar ∞.

We passen de zwakke wet eens toe op de situatie uit S 1.2, waar we onafhankelijke herhalingen van een experiment beschouwden en elke keer keken of een gebeurtenis A wel of niet was opgetreden. Zij p = P(A) en X_i = 1 als A bij de i herhaling optreedt en anders 0. De s.v.-en X₁, X₂,... zijn dan o.o. en gelijkverdeeld met EX_i= p en var X_i = p(1-p) < ∞. De som van de eerste n X'en is juist het aantal keren N(A) dat de gebeurtenis A bij de n herhalingen optreedt. Verder is:

{\overline {X_{n}}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}=fq(A)

,

juist het frequentiequotiënt fq(A) van het optreden van A bij n uitvoeringen van het experiment, zoals we dat in par.1.2 ingevoerd hebben. De wet van de grote aantallen zegt nu dat voor alle ε > 0:

\lim _{n\to \infty }P(|fq(A)-P(A)|>\epsilon )=0

,

dwz. het frequentiequotiënt van A convergeert met toenemende n in de zin van de zwakke wet naar de kans op A. Hiermee krijgt het intuïtieve uitgangspunt van het begrip kans, geformuleerd in de experimentele wet van de grote aantallen een solide basis. De theorie sluit dus, wat de wet van de grote aantallen betreft, goed aan bij de werkelijkheid (het experiment). Aangezien we de experimentele wet van de grote aantallen als uitgangspunt hebben genomen voor de opbouw van de theorie, verwachten we dat de theorie ook overigens tot praktisch bruikbare resultaten voert. De zwakke wet is uiteraard geen bewijs voor de experimentele wet; experimenteel gevonden resultaten zijn niet door de theorie te bewijzen.

T.1. Binomiale verdeling

In de tabel staat bij bepaalde n, p en c de kans

P(X\leq c)

als X een B(n,p)-verdeling heeft.

Voor de overzichtelijkheid staan in de tabel alleen de eerste vier decimalen en zijn kansen > 0,99995 weggelaten.

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
                                 p
 n   c   0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50   1/6  1/3
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
 2   0   9025 8100 7225 6400 5625 4900 4225 3600 3025 2500   6944 4444
         9975 9900 9775 9600 9375 9100 8775 8400 7975 7500   9722 8889

 3   0   8574 7290 6141 5120 4219 3430 2746 2160 1664 1250   5787 2963
     1   9928 9720 9392 8960 8438 7840 7183 6480 5748 5000   9259 7407
     2   9999 9990 9966 9920 9844 9730 9571 9360 9089 8750   9954 9630

 4   0   8145 6561 5220 4096 3164 2401 1785 1296 0915 0625   4823 1975
     1   9860 9477 8905 8192 7383 6517 5630 4752 3910 3125   8681 5926
     2   9995 9963 9880 9728 9492 9163 8735 8208 7585 6875   9838 8889
     3        9999 9995 9984 9961 9919 9850 9744 9590 9375   9992 9877

 5   0   7738 5905 4437 3277 2373 1681 1160 0778 0503 0313   4019 1317
     1   9774 9185 8352 7373 6328 5282 4284 3370 2562 1875   8038 4609
     2   9988 9914 9734 9421 8965 8369 7648 6826 5931 5000   9645 7901
     3        9995 9978 9933 9844 9692 9460 9130 8688 8125   9967 9547
     4             9999 9997 9990 9976 9947 9898 9815 9688   9999 9959

 6   0   7351 5314 3771 2621 1780 1176 0754 0467 0277 0156   3349 0878              
     1   9672 8857 7765 6554 5339 4202 3191 2333 1636 1094   7368 3512  
     2   9978 9842 9527 9011 8306 7443 6471 5443 4415 3438   9377 6804
     3   9999 9987 9941 9830 9624 9295 8826 8208 7447 6563   9913 8999
     4        9999 9996 9984 9954 9891 9777 9590 9308 8906   9993 9822
     5                  9999 9998 9993 9982 9959 9917 9844        9986

 7   0   6983 4783 3206 2097 1335 0824 0490 0280 0152 0078   2791 0585
     1   9556 8503 7166 5767 4449 3294 2338 1586 1024 0625   6698 2634
     2   9962 9743 9262 8520 7564 6471 5323 4199 3164 2266   9042 5706
     3   9998 9973 9879 9667 9294 8740 8002 7102 6083 5000   9824 8267
     4        9998 9988 9953 9871 9712 9444 9037 8471 7734   9980 9547
     5             9999 9996 9987 9962 9910 9812 9643 9375   9999 9931
     6                       9999 9998 9994 9984 9963 9922        9995

  8  0   6634 4305 2725 1678 1001 0576 0319 0168 0084 0039   2326 0390
     1   9428 8131 6572 5033 3671 2553 1691 1064 0632 0352   6047 1951
     2   9942 9619 8948 7969 6785 5518 4278 3154 2201 1445   8652 4682
     3   9996 9950 9786 9437 8862 8059 7064 5941 4770 3633   9693 7414
     4        9996 9971 9896 9727 9420 8939 8263 7396 6367   9954 9121
     5             9998 9988 9958 9887 9747 9502 9115 8555   9996 9803
     6                  9999 9996 9987 9964 9915 9819 9648        9974
     7                            9999 9998 9993 9983 9961        9998

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
                                 p
 n   c   0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50   1/6  1/3
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
 9   0   6302 3874 2316 1342 0751 0404 0207 0101 0046 0020   1938 0260
     1   9288 7748 5995 4362 3003 1960 1211 0705 0385 0195   5427 1431
     2   9916 9470 8591 7382 6007 4628 3373 2318 1495 0898   8217 3772
     3   9994 9917 9661 9144 8343 7297 6089 4826 3614 2539   9520 6503
     4        9991 9944 9804 9511 9012 8283 7334 6214 5000   9910 8552
     5        9999 9994 9969 9900 9747 9464 9006 8342 7461   9989 9576
     6                  9997 9987 9957 9888 9750 9502 9102   9999 9917
     7                       9999 9996 9986 9962 9909 9805        9990
     8                                 9999 9997 9992 9980        9999

10   0   5987 3487 1969 1074 0563 0282 0135 0060 0025 0010   1615 0173
     1   9139 7361 5443 3758 2440 1493 0860 0464 0233 0107   4845 1040
     2   9885 9298 8202 6778 5256 3828 2616 1673 0996 0547   7752 2991
     3   9990 9872 9500 8791 7759 6496 5138 3823 2660 1719   9303 5593
     4   9999 9984 9901 9672 9219 8497 7515 6331 5044 3770   9845 7869
     5        9999 9986 9936 9803 9527 9051 8338 7384 6230   9976 9234
     6             9999 9991 9965 9894 9740 9452 8980 8281   9997 9803
     7                  9999 9996 9984 9952 9877 9726 9453        9966
     8                            9999 9995 9983 9955 9893        9996
     9                                      9999 9997 9990

11   0   5688 3138 1673 0859 0422 0198 0088 0036 0014 0005   1346 0116
     1   8981 6974 4922 3221 1971 1130 0606 0302 0139 0059   4307 0751
     2   9848 9104 7788 6174 4552 3127 2001 1189 0652 0327   7268 2341
     3   9984 9815 9306 8389 7133 5696 4256 2963 1911 1133   9044 4726
     4   9999 9972 9841 9496 8854 7897 6683 5328 3971 2744   9755 7110
     5        9997 9973 9883 9657 9218 8513 7535 6331 5000   9954 8779
     6             9997 9980 9924 9784 9499 9006 8262 7256   9994 9614
     7                  9998 9988 9957 9878 9707 9390 8867   9999 9912
     8                       9999 9994 9980 9941 9852 9673        9986
     9                                 9998 9993 9978 9941        9999
    10                                           9998 9995  

12   0   5404 2824 1422 0687 0317 0138 0057 0022 0008 0002   1122 0077
     1   8816 6590 4435 2749 1584 0850 0424 0196 0083 0032   3813 0540
     2   9804 8891 7358 5583 3907 2528 1513 0834 0421 0193   6774 1811
     3   9978 9744 9078 7946 6488 4925 3467 2253 1345 0730   8748 3931
     4   9998 9957 9761 9274 8424 7237 5833 4382 3044 1938   9636 6315
     5        9995 9954 9806 9456 8822 7873 6652 5269 3872   9921 8223
     6        9999 9993 9961 9857 9614 9154 8418 7393 6128   9987 9336
     7             9999 9994 9972 9905 9745 9427 8883 8062   9998 9812
     8                  9999 9996 9983 9944 9847 9644 9270        9961
     9                            9998 9992 9972 9921 9807        9995
    10                                 9999 9997 9989 9968
    11                                           9999 9998 


–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
                                 p
 n   c   0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50   1/6  1/3
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
13   0   5133 2542 1209 0550 0238 0097 0037 0013 0004 0001   0935 0051
     1   8646 6213 3983 2336 1267 0637 0296 0126 0049 0017   3365 0385
     2   9755 8661 6920 5017 3326 2025 1132 0579 0269 0112   6281 1387
     3   9969 9658 8820 7473 5843 4206 2783 1686 0929 0461   8419 3224
     4   9997 9935 9658 9009 7940 6543 5005 3530 2279 1334   9488 5520
     5        9991 9925 9700 9198 8346 7159 5744 4268 2905   9873 7587
     6        9999 9987 9930 9757 9376 8705 7712 6437 5000   9976 8965
     7             9998 9988 9944 9818 9538 9023 8212 7095   9997 9653
     8                  9998 9990 9960 9874 9679 9302 8666        9912
     9                       9999 9993 9975 9922 9797 9539        9984
    10                            9999 9997 9987 9959 9888        9998
    11                                      9999 9995 9983  
    12                                                9999  

14   0   4877 2288 1028 0440 0178 0068 0024 0008 0002 0001   0779 0034
     1   8470 5846 3567 1979 1010 0475 0205 0081 0029 0009   2960 0274
     2   9699 8416 6479 4481 2811 1608 0839 0398 0170 0065   5795 1053
     3   9958 9559 8535 6982 5213 3552 2205 1243 0632 0287   8063 2612
     4   9996 9908 9533 8702 7415 5842 4227 2793 1672 0898   9310 4755
     5        9985 9885 9561 8883 7805 6405 4859 3373 2120   9809 6898
     6        9998 9978 9884 9617 9067 8164 6925 5461 3953   9959 8505
     7             9997 9976 9897 9685 9247 8499 7414 6047   9993 9424
     8                  9996 9978 9917 9757 9417 8811 7880   9999 9826
     9                       9997 9983 9940 9825 9574 9102        9960
    10                            9998 9989 9961 9886 9713        9993
    11                                 9999 9994 9978 9935        9999
    12                                      9999 9997 9991
    13                                                9999

15   0   4633 2059 0874 0352 0134 0047 0016 0005 0001 0000   0649 0023
     1   8290 5490 3186 1671 0802 0353 0142 0052 0017 0005   2596 0194
     2   9638 8159 6042 3980 2361 1268 0617 0271 0107 0037   5322 0794
     3   9945 9444 8227 6482 4613 2969 1727 0905 0424 0176   7685 2092
     4   9994 9873 9383 8358 6865 5155 3519 2173 1204 0592   9102 4041
     5   9999 9978 9832 9389 8516 7216 5643 4032 2608 1509   9726 6184
     6        9997 9964 9819 9434 8689 7548 6098 4522 3036   9934 7970
     7             9994 9958 9827 9500 8868 7869 6535 5000   9987 9118
     8             9999 9992 9958 9848 9578 9050 8182 6964   9998 9692
     9                  9999 9992 9963 9876 9662 9231 8491        9915
    10                       9999 9993 9972 9907 9745 9408        9982
    11                            9999 9995 9981 9937 9824        9997
    12                                 9999 9997 9989 9963  
    13                                           9999 9995  

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
                                 p
 n   c   0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50   1/6  1/3
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
20   0   3585 1216 0388 0115 0032 0008 0002 0000 0000 0000   0261 0003 
     1   7358 3917 1756 0692 0243 0076 0021 0005 0001 0000   1304 0033
     2   9245 6769 4049 2061 0913 0355 0121 0036 0009 0002   3287 0176
     3   9841 8670 6477 4114 2252 1071 0444 0160 0049 0013   5665 0604
     4   9974 9568 8298 6296 4148 2375 1182 0510 0189 0059   7687 1515
     5   9997 9887 9327 8042 6172 4164 2454 1256 0553 0207   8982 2972
     6        9976 9781 9133 7858 6080 4166 2500 1299 0577   9629 4793
     7        9996 9941 9679 8982 7723 6010 4159 2520 1316   9887 6615
     8        9999 9987 9900 9591 8867 7624 5956 4143 2517   9972 8095
     9             9998 9974 9861 9520 8782 7553 5914 4119   9994 9081
    10                  9994 9961 9829 9468 8725 7507 5881   9999 9624
    11                  9999 9991 9949 9804 9435 8692 7483        9870
    12                       9998 9987 9940 9790 9420 8684        9963
    13                            9997 9985 9935 9786 9423        9991
    14                                 9997 9984 9936 9793        9998
    15                                      9997 9985 9941
    16                                           9997 9987
    17                                                9998

25   0   2774 0718 0172 0038 0008 0001 0000 0000 0000 0000   0105 0000
     1   6424 2712 0931 0274 0070 0016 0003 0001 0000 0000   0629 0005
     2   8729 5371 2537 0982 0321 0090 0021 0004 0001 0000   1887 0035
     3   9659 7636 4711 2340 0962 0332 0097 0024 0005 0001   3816 0149
     4   9928 9020 6821 4207 2137 0905 0320 0095 0023 0005   5937 0462
     5   9988 9666 8385 6167 3783 1935 0826 0294 0086 0020   7720 1120
     6   9998 9905 9305 7800 5611 3407 1734 0736 0258 0073   8908 2215
     7        9977 9745 8909 7265 5118 3061 1536 0639 0216   9553 3703
     8        9995 9920 9532 8506 6769 4668 2735 1340 0539   9843 5376
     9        9999 9979 9827 9287 8106 6303 4246 2424 1148   9953 6956
    10             9995 9944 9703 9022 7712 5858 3843 2122   9988 8220
    11             9999 9985 9893 9558 8746 7323 5426 3450   9997 9082
    12                  9996 9966 9825 9396 8462 6937 5000   9999 9585
    13                  9999 9991 9940 9745 9222 8173 6550        9836
    14                       9998 9982 9907 9656 9040 7878        9944
    15                            9995 9971 9868 9560 8852        9984
    16                            9999 9992 9957 9826 9461        9996
    17                                 9998 9988 9942 9784        9999
    18                                      9997 9984 9927
    19                                      9999 9996 9980
    20                                           9999 9995 
    21                                                9999

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

T.2. Poisson-verdeling

In de tabel staat bij bepaalde m en c de kans:

P(X\leq c)

,

als X een Poisson-verdeling heeft met parameter m. (Kansen > 0,99995 zijn weggelaten.)

                                   m
   c   0,05  0,10  0,15  0,20  0,25  0,30  0,35  0,40  0,45  0,50
 ----|-------------------------------------------------------------
   0   9512  9048  8607  8187  7788  7408  7047  6703  6376  6065
   1   9988  9953  9898  9825  9735  9631  9513  9384  9246  9098
   2         9998  9995  9989  9978  9964  9945  9921  9891  9856
   3                     9999  9999  9997  9995  9992  9988  9982
   4                                             9999  9999  9998

                                   m
   c   0,55  0,60  0,65  0,70  0,75  0,80  0,85  0,90  0,95  1,00
 ----|-------------------------------------------------------------
   0   5769  5488  5220  4966  4724  4493  4274  4066  3867  3679
   1   8943  8781  8614  8442  8266  8088  7907  7725  7541  7358
   2   9815  9769  9717  9659  9595  9526  9451  9371  9287  9197
   3   9975  9966  9956  9942  9927  9909  9889  9865  9839  9810
   4   9997  9996  9994  9992  9989  9986  9982  9977  9971  9963
   5               9999  9999  9999  9998  9997  9997  9995  9994
   6                                                   9999  9999

                                   m
   c   1,10  1,20  1,30  1,40  1,50  1,60  1,70  1,80  1,90  2,00
 ----|-------------------------------------------------------------
   0   3329  3012  2725  2466  2231  2019  1827  1653  1496  1353
   1   6990  6626  6268  5918  5578  5249  4932  4628  4337  4060
   2   9004  8795  8571  8335  8088  7834  7572  7306  7037  6767
   3   9743  9662  9569  9463  9344  9212  9068  8913  8747  8571
   4   9946  9923  9893  9857  9814  9763  9704  9636  9559  9473
   5   9990  9985  9978  9968  9955  9940  9920  9896  9868  9834
   6   9999  9997  9996  9994  9991  9987  9981  9974  9966  9955
   7               9999  9999  9998  9997  9996  9994  9992  9989
   8                                       9999  9999  9998  9998

                                   m
   c   2,10  2,20  2,30  2,40  2,50  2,60  2,70  2,80  2,90  3,00
 ----|-------------------------------------------------------------
   0   1225  1108  1003  0907  0821  0743  0672  0608  0550  0498
   1   3796  3546  3309  3084  2873  2674  2487  2311  2146  1991
   2   6496  6227  5960  5697  5438  5184  4936  4695  4460  4232
   3   8386  8194  7993  7787  7576  7360  7141  6919  6696  6472
   4   9379  9275  9162  9041  8912  8774  8629  8477  8318  8153
   5   9796  9751  9700  9643  9580  9510  9433  9349  9258  9161
   6   9941  9925  9906  9884  9858  9828  9794  9756  9713  9665
   7   9985  9980  9974  9967  9958  9947  9934  9919  9901  9881
   8   9997  9995  9994  9991  9989  9985  9981  9976  9969  9962
   9   9999  9999  9999  9998  9997  9996  9995  9993  9991  9989
  10                           9999  9999  9999  9998  9998  9997
  12                                                   9999  9999

                                   m
   c   3,20  3,40  3,60  3,80  4,00  4,20  4,40  4,60  4,80  5,00
 ----|-------------------------------------------------------------
   0   0408  0334  0273  0224  0183  0150  0123  0101  0082  0067
   1   1712  1468  1257  1074  0916  0780  0663  0563  0477  0404
   2   3799  3397  3027  2689  2381  2102  1851  1626  1425  1247
   3   6025  5584  5152  4735  4335  3954  3594  3257  2942  2650
   4   7806  7442  7064  6678  6288  5898  5512  5132  4763  4405
   5   8946  8705  8441  8156  7851  7531  7199  6858  6510  6160
   6   9554  9421  9267  9091  8893  8675  8436  8180  7908  7622
   7   9832  9769  9692  9599  9489  9361  9214  9049  8867  8666
   8   9943  9917  9883  9840  9786  9721  9642  9549  9442  9319
   9   9982  9973  9960  9942  9919  9889  9851  9805  9749  9682
  10   9995  9992  9987  9981  9972  9959  9943  9922  9896  9863
  11   9999  9998  9996  9994  9991  9986  9980  9971  9960  9945
  12         9999  9999  9998  9997  9996  9993  9990  9986  9980
  13                           9999  9999  9998  9997  9995  9993
  14                                       9999  9999  9999  9998
  15                                                         9999

                           m
   c   5,50  6,00  6,50  7,00  7,50  8,00  8,50  9,00  9,50  10,0
 ---- -------------------------------------------------------------
   0   0041  0025  0015  0009  0006  0003  0002  0001  0001
   1   0266  0174  0113  0073  0047  0030  0019  0012  0008  0005
   2   0884  0620  0430  0296  0203  0138  0093  0062  0042  0028
   3   2017  1512  1118  0818  0591  0424  0301  0212  0149  0103
   4   3575  2851  2237  1730  1321  0996  0744  0550  0403  0293
   5   5289  4457  3690  3007  2414  1912  1496  1157  0885  0671
   6   6860  6063  5265  4497  3782  3134  2562  2068  1649  1301
   7   8095  7440  6728  5987  5246  4530  3856  3239  2687  2202
   8   8944  8472  7916  7291  6620  5925  5231  4557  3918  3328
   9   9462  9161  8774  8305  7764  7166  6530  5874  5218  4579
  10   9747  9574  9332  9015  8622  8159  7634  7060  6453  5830
  11   9890  9799  9661  9467  9208  8881  8487  8030  7520  6968
  12   9955  9912  9840  9730  9573  9362  9091  8758  8364  7916
  13   9983  9964  9929  9872  9784  9658  9486  9261  8981  8645
  14   9994  9986  9970  9943  9897  9827  9726  9585  9400  9165
  15   9998  9995  9988  9976  9954  9918  9862  9780  9665  9513
  16   9999  9998  9996  9990  9980  9963  9934  9889  9823  9730
  17         9999  9998  9996  9992  9984  9970  9947  9911  9857
  18               9999  9999  9997  9993  9987  9976  9957  9928
  19                           9999  9997  9995  9989  9980  9965
  20                                 9999  9998  9996  9991  9984
  21                                       9999  9998  9996  9993
  22                                             9999  9999  9997
  23                                                   9999  9999

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.

Trefwoordenregister

A · B · C · D · E · F · G · H · I · J · K · L · M · N · O · P · Q · R · S · T · U · V · W · X · Y · Z

A

aantal 2.1

afhankelijk 5.1, 7.2

afronding 7.2

aftelbaar 1.1, 3.2

afwijkingen 7.2

alternatief 1.1, 3.3

alternatieve verdeling 3.2, 4.2, 6.1, 6.2, 7.2

aselect 2.2, 4.3

B

Bayes 3.1, 6.5

Bernoulli 0.1, 3.3, 4.3

Bernoulli-experiment 3.3, 5.1

Bernoulli-pogingen 3.3, 4.3

Bernoulli-verdeling 4.3

Bernstein 0.1

Bienaymé-Chebyshev 7.5

binomiale formule 3.3

binomiale verdeling 4.3, 5.1, 5.4, 6.2, 6.3 7.3, 7.4

binomium 4.3

blindelings 2.2

Boole 1.2

Borel 0.1

breedte 7.2

C

Cartesisch product 2.2

categorisch systeem 1.1

centrale moment 7.1

Chebyshev 0.1, 7.4, 7.5, 7.6

chuck-a-luck 6.6

combinatie 2.2

combinatoriek 2.4

complement 1.1, 1.2

componenten 5.1, 5.2

compositie 5.3

convolutie 5.4

correctiefactor 7.3

correlatiecoëfficiënt 7.4

covariantie 7.3

D

D'Alembert 2.1

deelexperimenten 2.2, 3.2, 5.2

deelverzameling 1.1, 1.2

DeMoivre 0.1

DeMorgan 1.1

DeMéré 0.1, 2.2

dichotome 3.3, 4.2, 4.3, 7.3

dimensie 5.1

discrete 1.1

disjunct 1.1, 1.2, 2.2, 3.3

doorsnede 1.1

E

eindig 1.1, 3.2

element 1.1

elementaire 1.1

enveloppe-probleem 2.2

experiment 1.1, 3.2

F

faculteit 2.2

Feller 0.1

Fermat 0.1

fractie 1.1, 4.3

frequentiequotiënt 1.1, 6.1, 7.4

Fréchet 0.1

G

Galileï 2.3

Gauss 0.1

gebeurtenis 1.1

geheugenloosheid 5.3

gelijktijdig 1.1, 3.1, 5.1

gelijkverdeeld 5.4

gemiddelde 6.1

geometrische formule 3.3

geometrische verdeling 4.3, 6.2, 7.3

geordend 2.2

gestandaardiseerd 7.4

gezamenlijke 2.2, 5.1

greep 2.2

gunstig 1.1, 2.2

H

herhaling 3.3

herhalingscombinatie 2.2, 3.2

herhalingsvariatie 2.2

homogene verdeling 4.2

Huijgens 0.1

hypergeometrische formule 3.3

hypergeometrische verdeling 6.2, 6.3, 7.3, 7.4,

I

isomoor 5.4

K

kansbegrip 1.1

kansboom 3.1

kansfunctie 1.2 5.1, 5.2

kansmaat 5.1

kansruimte 1.2, 2.1, 3.2

kansstructuur 4.2

kansverdeling 4.2,

Khintchine 0.1

Kolmogorov 0.1, 1.2, 1.3 3.1, 4.2

L

Laplace 0.1, 1.2 2.1, 3.2

Lévy 0.1

ligging 6.1, 7.1

lineair 7.4

lukraak 2.2

M

marginale 5.1, 6

Markov 0.1

meetkundige 1.3

met terugleggen 2.2

midden 6.1, 7.1

mislukking 3.3

mogelijke 1.1

moment 7.1

Montmort 0.1

multinomiaalcoëfficiënt 2.2

multinomiale verdeling 5.1, 7.4

N

Newton 0.1

O

onafhankelijk 2.2, 3.2, 5.2, 7.4

onderscheidbare 2.2

one-armed bandit 6.4

ongecorreleerd 7.4

ongeordend 2.2

onmogelijke 1.1

ontaarde verdeling 4.2, 6.1, 7.2

opsplitsing 3.1

overschrijdingskansen 4.3

P

paarsgewijs onafhankelijk 3.2, 7.4

partitie 1.1, 2.2, 3.1, 3.2

Pascal 0.1

permutatie 2.2

Petersburg 6.4

Poisson 0.1

Poisson-verdeling 4.3, 6.2, 7.3

productregel 2.2, 3.1

productruimte 3.2

R

rangschikking 2.2

regel van Bayes 3.1

rekenformule 7.2, 8

roulette 6.4

S

samengesteld 3.2

samenhang 5.1, 7.3

schaal 7.2

simultane 5.1, 7.2

singleton 1.1

sinterklaaslootjes 2.2

somregel 1.3, 2.2

spreiding 7.2

standaardafwijking 7.2

standaarddeviatie 7.2

steekproef 3.3, 4.3

stochastisch 1.1

stochastische variabele 4.1

succes 3.2, 3.3

succeskans 3.3

symmetrie 1.4, 2.1, 2.2, 4.2

T

Taylor-ontwikkeling 4.3

terugleggen 2.2

toeval 1.1, 4.1

toevalsexperiment 1.1

trinomiale verdeling 5.1

U

uitkomst 1.1

uitkomstenruimte 1.1

uitsluitend 1.1

uniforme verdeling 4.2, 6.2, 7.3

V

vaas 3.2, 5.1

vaasmodel 3.3

variantie 7.2

variatie 2.2

vector 5.1

verdeling 4.2, 5.1

vereniging 1.1

verwachting 6.1

verwachtingswaarde 6.1

Von Mises 1.1

voorwaarde 3.2, 5.2,

voorwaardelijke verwachting 3.1, 6.4, 4.3

W

waardenbereik 5.1

wachttijd 4.3

wet van de totale kans 3.1

willekeurig 2.2

Z

zonder terugleggen 2.2

zwakke wet van de grote aantallen 7.5, 7.6