Discrete Kansrekening/Voorwaardelijke kans en onafhankelijkheid/Voorwaardelijke kans

Discrete Kansrekening

0. Inleiding
   1. Algemene opmerkingen
   2. Geschiedenis
   3. Literatuur
1. Basisbegrippen
   1. Experiment en uitkomstenruimte
   2. Intuïtief kansbegrip
   3. Kans
   4. Eigenschappen van kansen
   5. Vraagstukken
2. Symmetrische kansruimten
   1. Inleiding
   2. Combinatorische kansrekening
   3. Vraagstukken
3. Voorwaardelijke kans en onafhankelijkheid
   1. Voorwaardelijke kans
   2. Onafhankelijke gebeurtenissen
   3. Samengestelde experimenten
   4. Vraagstukken
4. Stochastische variabelen
   1. Inleiding
   2. Kansverdeling
   3. Enkele bekende discrete verdelingen
   4. Vraagstukken
5. Simultane kansverdelingen
   1. Inleiding
   2. Voorwaardelijke kansverdelingen
   3. Onderling onafhankelijke stochastische variabelen
   4. Functies van stochastische variabelen
   5. Gelijkverdeelde stochastische variabelen
   6. Vraagstukken
6. Verwachtingswaarde
   1. Inleiding
   2. Verwachting van bekende discrete verdelingen
   3. Verwachting van functies van stochastische variabelen
   4. Eigenschappen van verwachtingswaarde
   5. Voorwaardelijke verwachtingswaarde
   6. Vraagstukken
7. Momenten
   1. Inleiding
   2. Variantie en standaardafwijking
   3. Variantie van bekende discrete verdelingen
   4. Covariantie en correlatie
   5. De ongelijkheid van Chebyshev
   6. De zwakke wet van de grote aantallen
   7. Vraagstukken
8. Tabellen
   1. Binomiale verdeling
   2. Poisson-verdeling
9. Register

3.1 Voorwaardelijke kans

Het komt dikwijls voor dat over de uitkomst van een experiment tevoren al iets bekend is of iets verondersteld wordt. Als we een willekeurige voorbijganger in Amsterdam aanspreken, dan is de kans dat hij op de PVDA stemt een andere dan voor iemand uit Wassenaar. We kunnen ons het experiment zo voorstellen dat we lukraak een Nederlander aanwijzen, echter als extra voorwaarde stellen dat hij in Amsterdam moet wonen. Onder deze voorwaarde kunnen we vragen naar de kans dat hij op de PVDA stemt. Deze "kans" is niet een kans zoals we die tot nu toe kennen. Er is een nieuwe definitie nodig voor dit begrip. In het voorbeeld vragen we naar de voorwaardelijke kans dat een willekeurige Nederlander op de PVDA stemt, gegeven dat hij in Amsterdam woont. Intuïtief ligt het voor de hand om deze voorwaardelijke kans gelijk te stellen aan de kans dat een willekeurige Amsterdammer op de PVDA stemt. Als we met A de Nederlanders aangeven die op de PVDA stemmen en met B de Amsterdammers, dan is deze voorwaardelijke kans gelijk aan #AB/#B, waarbij #B het aantal Amsterdammers is en #AB het aantal daarvan dat op de PVDA stemt. We duiden deze voorwaardelijke kans aan met P(A|B); als N het totale aantal Nederlanders is, geldt:

P(A|B)={\frac {\#AB}{\#B}}={\frac {\#AB/N}{\#B/N}}={\frac {P(AB)}{P(B)}}.

Op deze manier kunnen we de voorwaardelijke kans uitdrukken in onvoorwaardelijke kansen. Dit intuïtieve resultaat voor deze symmetrische kansruimte gebruiken we nu als definitie van het begrip voorwaardelijke kans voor willekeurige kansruimten.

Definitie 3.1.1
Als A en B gebeurtenissen zijn en P(B) > 0, dan noemen we:

P(A|B)={\frac {P(AB)}{P(B)}}

de voorwaardelijke kans op A gegeven B. We spreken ook wel van de kans op A onder de voorwaarde B.

Opmerking 1
De notatie P(A|B) voor de voorwaardelijke kans op de gebeurtenis A gegeven de gebeurtenis B is historisch bepaald, maar kan gemakkelijk verwarrend werken. Zo moeten we dit niet lezen als de kans P op de gebeurtenis (?) "A|B". Het zou logischer zijn om P_B(A) te schrijven, daarmee aanduidend dat het gaat om een andere kans, nl. P_B, en niet om de (onvoorwaardelijke) kans P zelf. Het heeft echter nadelen om gecompliceerde gebeurtenissen B als index aan P te hangen, zodat we de notatie P(A|B) handhaven.

Voorbeeld 1
We trekken geordend en zonder terugleggen lukraak 5 keer een knikker uit een vaas met 10 rode en 20 witte knikkers. De kans dat de eerste knikker rood is, is 1/3. De kans dat de tweede knikker rood is, is ook 1/3. Echter de voorwaardelijke kans dat de tweede knikker rood is, gegeven dat de eerste rood is, is:

P("2e rood"|"1e rood") = P("2e rood" en "1e rood")/P("1e rood") =

{\frac {\frac {10\times 9}{30\times 29}}{\frac {1}{3}}}={\frac {9}{29}}

.

Dat antwoord zal ons niet verbazen. Deze voorwaardelijke kans leiden we direct af door naar het experiment te kijken dat ontstaat als we als eerste een rode knikker getrokken hebben en vervolgens weer een knikker gaan trekken.

Voorbeeld 2
Een doos bevat twee munten, waarvan er één zuiver is, dwz. kruis en munt worden met gelijke kans geworpen, terwijl de andere aan beide zijden kruis heeft. We kiezen nu lukraak een van de munten en werpen deze. Als het resultaat van deze worp kruis is, wat is dan de kans dat de andere kant van deze munt ook kruis is? Zij A de gebeurtenis dat de uitkomst kruis is en B de gebeurtenis dat de geworpen munt aan beide zijden kruis heeft dan is P(B|A) de gevraagde voorwaardelijke kans. Nu geldt P(A) = 3/4, immers drie van de in totaal 4 zijden van de munten zijn kruis en deze zijden komen alle met gelijke kans boven. Bovendien geldt P(BA) = P(B) = 1/2, want B ⊂ A en beide munten hebben gelijke kans om getrokken te worden. Dus P(B|A) = P(BA)/P(A) = 2/3.

Uit de definitie van voorwaardelijke kans volgt eenvoudig dat voor vaste B met P(B) > 0 de voorwaardelijke kans P(W|B) een kans is op S zowel als op B, dwz. dat hij net als P voldoet aan de axioma's van Kolmogorov.

Stelling 3.1.1
Als (S,P) een kansruimte is en B een gebeurtenis met P(B) > 0, is de voorwaardelijke kans P(.|B) zowel een kans op S als op B.

Bewijs: Beschouw de bijbehorende kansfunctie p_B. Daarvoor geldt: p_B(s) ≥ 0, voor alle s ∈ S en:

\sum _{s\in S}p_{B}(s)=\sum _{s\in B}p_{B}(s)=1

.

Uit de definitie van voorwaardelijke kans volgt direct voor twee gebeurtenissen A en B: P(AB) = P(A)P(B|A). We kunnen deze relatie uitbreiden tot meer dan twee gebeurtenissen en krijgen dan de zgn. productregel voor kansen.

Stelling 3.1.2 (productregel)
Voor de gebeurtenissen A₁,A₂,...,A_n met P(A₁A₂...A_n–1) > 0 geldt: P(A₁A₂...A_n) = P(A₁).P(A₂|A₁)...P(A_n|A₁A₂...A_n–1).

Voorbeeld 3 (vervolg voorbeeld 1)
Zij A_i de gebeurtenis dat de i^e getrokken knikker rood is. Dan is: P(A₁) = 1/3 en P(A₂|A₁) = 9/29, zodat P(A₁A₂) = P(A₁)P(A₂|A₁) = 3/29. We kunnen op de volgende manier P(A₂) berekenen:

P(A_{2})=P(A_{2}A_{1}\cup A_{2}A_{1}^{c})=P(A_{2}A_{1})+P(A_{2}A_{1}^{c})=

=P(A_{2}|A_{1})P(A_{1})+P(A_{2}|A_{1}^{c})P(A_{1}^{c})={\frac {9}{29}}\times {\frac {10}{30}}+{\frac {10}{29}}\times {\frac {20}{30}}={\frac {10}{30}}

.

De laatste berekening in het voorbeeld kunnen we heel algemeen formuleren. We hebben daar de kans op de gebeurtenis A₂ bepaald door een opsplitsing (partitie) van A₂ te bekijken. We zeggen wel dat we de totale kans op A₂ berekenen via de voorwaardelijke kansen van de partitie. We bekijken nog een voorbeeld.

Voorbeeld 4
Stel dat we de fractie Nederlanders die op de PVDA stemmen willen bepalen. We kunnen daartoe het aantal Nederlanders N en het aantal #A onder hen die op de PVDA stemmen bepalen. De gevraagde fractie is dan p = #A/N. Stel dat voor elke provincie i de fractie

p_{i}={\frac {\#A_{i}}{N_{i}}}

al bekend is; dan is:

p={\frac {\#A}{N}}=\sum {\frac {\#A_{i}}{N}}=\sum {\frac {\#A_{i}}{N_{i}}}{\frac {N_{i}}{N}}=\sum p_{i}{\frac {N_{i}}{N}}

.

In een symmetrische kansruimte met S = {alle Nederlanders} en A = {PVDA-stemmers} correspondeert deze relatie met

P(A) = ∑ P(A|provincie i).P(provincie i).

De algemene formulering luidt:

Stelling 3.1.3 (Wet van de totale kans)
Laat de (ten hoogste aftelbaar veel) gebeurtenissen A₁,A₂,..., met P(A_n) > 0 voor alle n, een partitie vormen van de uitkomstenruimte S, dan geldt:

P(B)=\sum _{n}P(B|A_{n})P(A_{n})\,

.

In de praktijk is het dikwijls zo, dat we de voorwaardelijke kansen P(B|A_n) uit het model afleiden en gebruiken voor het berekenen van de onvoorwaardelijke kans P(B), die vaak niet direct uit het model volgt. In deze zin wordt de wet van de totale kans gebruikt in het volgende voorbeeld.

Voorbeeld 5
Een bedrijf bezit drie fabrieken A, B en C, waar scheerapparaten van hetzelfde type worden gemaakt. Gedurende een bepaalde periode maakte fabriek A 2000 scheerapparaten, waarvan er 200 defect waren, fabriek B maakte in die periode 5000 apparaten, waarvan er 300 defect waren en C maakte 3000 apparaten, waaronder 150 defecte. Uit de totale productie wordt lukraak een scheerapparaat gekozen; wat is de kans dat dit apparaat defect (D) is? De gegevens van die periode kunnen we op de volgende overzichtelijke manier weergeven:

fabriek $F$	$P(F)$	$P(D\|F)$	$P(D\|F)P(F)$

$A$	2000/10000	200/2000	200/10000
$B$	5000/10000	300/5000	300/10000
$C$	3000/10000	150/3000	150/10000

totaal	1		650/10000

De berekening in de laatste kolom laat zien hoe met behulp van de wet van de totale kans de gevraagde kans berekend wordt: P(D) = P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(C) = 0,065.

Het gekozen scheerapparaat blijkt defect te zijn! Wat is de kans dat het afkomstig is van fabriek A? We vragen dus naar P(A|D), de voorwaardelijke kans dat het van A afkomstig is, gegeven dat het defect is. We berekenen:

P(A|D)={\frac {P(A\cap D)}{P(D)}}={\frac {P(D|A)P(A)}{P(D)}}={\frac {0{,}020}{0{,}065}}={\frac {4}{13}}

.

In het voorbeeld is de laatste berekening een toepassing van de zgn. regel van Bayes. Terwijl de voorwaardelijke kansen op de gebeurtenis D, gegeven elk van A, B en C, bekend zijn, laat deze regel zien hoe we de "omgekeerde" voorwaardelijke kans op elk van A, B en C, gegeven D, moeten berekenen.

Stelling 3.1.4 (Regel van Bayes)
Zij B een gebeurtenis met P(B) > 0 en A₁,A₂,... een partitie van S met P(A_i) > 0 voor alle i, dan geldt voor iedere i:

P(A_{i}|B)={\frac {P(B|A_{i})P(A_{i})}{P(B)}}={\frac {P(B|A_{i})P(A_{i})}{\sum _{j}P(B|A_{j})P(A_{j})}}

.

Bewijs: Volgt direct uit de definitie van voorwaardelijke kans en de wet van de totale kans.

Voorbeeld 6
Een prototype van een machine om bij banken geldstukken te sorteren vertoonde nogal wat gebreken. De machine accepteerde een mengsel van guldens, rijksdaalders en vijfjes (5-guldenstukken) en telde de munten, maar maakte nogal wat fouten. Uit proeven bleek dat een vijfje soms voor een rijksdaalder of een gulden werd gehouden of andersom. Van 1000 vijfjes werden 16 als rijksdaalder en 33 als gulden gezien. van 1000 rijksdaalders werden slechts 5 als vijfje geteld, maar 71 als gulden en van 1000 guldens werden 14 als rijksdaalder gezien en 32 als vijfje. Hoe groot is de kans dat een munt werkelijk een vijfje is {5!} als de machine aangeeft een vijfje te tellen {5?}? We gaan er daarbij van uit dat 10% van de aangeboden munten vijfjes zijn en 40% rijksdaalders. We kunnen de gegevens ordelijk in de volgende tabel weergeven.


munt $M$	$P(M)$	$P(2?\|M)$	$P(2?\|M)P(M)$

2	0,10	0,951	0,0951
1	0,40	0,005	0,0020
0,5	0,50	0,032	0,0160

totaal	1,00		0,1131	= $P(2?)$

Met de regel van Bayes berekenen we:

P(5!|5?) = P(5?|5!)P(5!)/P(5?) = 0,0951/0,1131 = 0,841.

De wet van de totale kans wordt ook wel weergegeven in een kansboom. Aan de hand van een voorbeeld zullen we dit duidelijk maken.

Voorbeeld 7 (kansboom)
We beschouwen de situatie van voorbeeld 5 en geven die op de volgende wijze weer. Deze figuur, die kansboom wordt genoemd, spreekt verder voor zich.

Een kansboom laat zich op voor de hand liggende wijze ook gebruiken in gecompliceerdere situaties. We geven daarvan verder geen voorbeeld.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.