Discrete Kansrekening/Printversie

Uit Wikibooks

Ga naar: navigatie, zoek
Wikibooks:Infobox/Discrete Kansrekening
___
Discrete Kansrekening/Printversie

Dit boek is de praktisch ongewijzigde tekst van het overeenkomstige collegedictaat geschreven door drs. W. Nijdam en prof. dr. W.Albers van de Universiteit Twente en is met toestemming van beide auteurs hier opgenomen.

Het boek biedt een eerste kennismaking met kansrekening op universitair niveau voor wiskundestudenten.

nl-1-19-000-00001

Inhoud

  1. Inleiding
    1. Algemene opmerkingen
    2. Geschiedenis
    3. Literatuur
  1. Basisbegrippen
    1. Experiment en uitkomstenruimte
    2. Intuïtief kansbegrip
    3. Kans
    4. Eigenschappen van kansen
  2. Symmetrische kansruimten
    1. Inleiding
    2. Combinatorische kansrekening
  3. Voorwaardelijke kans en onafhankelijkheid
    1. Voorwaardelijke kans
    2. Onafhankelijke gebeurtenissen
    3. Samengestelde experimenten
  4. Stochastische variabelen
    1. Inleiding
    2. Kansverdeling
    3. Enkele bekende discrete verdelingen
  5. Simultane kansverdelingen
    1. Inleiding
    2. Voorwaardelijke kansverdelingen
    3. Onderling onafhankelijke stochastische variabelen
    4. Functies van stochastische variabelen
    5. Gelijkverdeelde stochastische variabelen
  6. Verwachtingswaarde
    1. Inleiding
    2. Verwachting van bekende discrete verdelingen
    3. Verwachting van functies van stochastische variabelen
    4. Eigenschappen van verwachtingswaarde
    5. Voorwaardelijke verwachtingswaarde
  7. Momenten
    1. Inleiding
    2. Variantie en standaardafwijking
    3. Variantie van bekende discrete verdelingen
    4. Covariantie en correlatie
    5. De ongelijkheid van Chebyshev
    6. De zwakke wet van de grote aantallen
  8. Tabellen
    1. Binomiale verdeling
    2. Poisson-verdeling
  9. Register
De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties




Inhoud

[bewerk] Algemene opmerkingen

In natuur, techniek en samenleving treffen we veel verschijnselen aan die niet met zekerheid te voorspellen zijn, maar niettemin bepaalde wetmatigheden vertonen. Bijvoorbeeld de hoeveelheid neerslag op een bepaalde dag, het geslacht van een baby die geboren wordt, het defect raken van een auto. Deze verschijnselen kunnen we niet met zekerheid voorspellen. Toch weten we dat het in Nederland meer regent dan in Ethiopië, dat bijna de helft van de pasgeboren baby's meisjes zijn en dat een oude auto vaker defect raakt dan een nieuwe.

Kansrekening is een wiskundige theorie die zulke wetmatigheden beschrijft en bestudeert. Deze theorie is gebaseerd op enkele veronderstellingen waarvan we aannemen dat ze redelijk aansluiten bij de werkelijkheid. De juistheid van deze veronderstellingen wordt in de kansrekening echter nooit geverifieerd. De statistiek houdt zich bezig met methodes om de juistheid van veronderstellingen omtrent de werkelijkheid te verifiëren en de parameters van een probleem te "meten".

Een streng wiskundige behandeling van de kansrekening vereist het gebruik van maattheorie. In dit boek wordt geen maattheorie gebruikt, maar ligt de nadruk op een intuïtieve benadering. Kansrekening vindt toepassing in vele gebieden van wetenschap en techniek. We noemen slechts enkele voorbeelden: statistiek, statistische mechanica, operationele research, verzekeringswiskunde, econometrie, informatie- en communicatietheorie, biologie en psychologie.

[bewerk] Geschiedenis

De kansrekening is in de zeventiende eeuw ontstaan uit problemen in verband met het dobbelspel. Vragen van de dobbelende Chevalier DeMéré (1610-1685) werden in 1654 aanleiding tot een briefwisseling tussen Pascal (1623-1662) en Fermat (1601-1665). Een van de vragen luidde ongeveer: "Wat is waarschijnlijker: met één dobbelsteen in vier worpen minstens één zes te gooien óf met twee dobbelstenen in 24 worpen minstens één dubbelzes te gooien". De kansen op deze gebeurtenissen zijn ongeveer 0,5177 en 0,4914. Dat DeMéré door ervaring (en tot zijn verbazing) had geconstateerd dat de eerste kans groter dan een half was en de tweede kleiner dan een half, zegt wel iets over zijn hartstocht voor het dobbelen.

De frivole oorsprong van de kansrekening is nog altijd merkbaar in de moderne leerboeken en komt zeer duidelijk tot uiting in de vroegste literatuur. Het eerste boek over kansrekening werd in 1657 geschreven door Christiaan Huijgens (1629-1695): "De ratiociniis in ludo aleae" (Over berekeningen bij het dobbelspel). Andere boeken uit de begintijd zijn: "Essai d'Analyse sur les Jeux de Hasard" in 1708 door DeMontmort (1678-1719), "Ars conjectandi" (de kunst van het gissen (gokken?)) in 1713 door Jacob Bernoulli (1654-1705) en "The Doctrine of Chances" in 1718 door DeMoivre (1667-1754). Namen van anderen die in belangrijke mate hebben bijgedragen tot het ontstaan van de kansrekening, zijn Laplace (1749-1827), Gauss (1777-1855) en Poisson (1781-1840). De eerste definitie van het begrip "kans" werd gegeven door Laplace in zijn "Théorie analytique des probabilités" (1812). Van de zeer vele wiskundigen die de kansrekening verder hebben ontwikkeld, noemen we nog Chebyshev (1821-1894), Markov (1856-1922), Borel (1871-1956), Lévy (1886-1972), Khintchine (1895-1959), Bernstein (1878-1956), Fréchet (1878-1973), Kolmogorov (1903-1987) en Feller (1906-1970).

[bewerk] Literatuur

De volgende boeken bevatten ongeveer de stof die hier behandeld wordt en bovendien verdere uitbreidingen van de theorie:

  1. C.R. Heathcote, "Probability, Elements of the Mathematical Theory", George Allen & Unwin Ltd., London, 1971.
  2. S.M. Ross, "A First Course in Probability", 4th edition, MacMillan, New York, 1994.
  3. A.J. Stam, "Inleiding tot de waarschijnlijkheidsrekening", H. Stam, Haarlem 1964.
  4. W. Feller, "An Introduction to Probability Theory and Its Applications", Vol. I, Third Edition, Wiley, New York, 1968 (verkrijgbaar als paperback).



Terug naar Inhoud

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 1.1 Experiment en uitkomstenruimte

In de kansrekening (of waarschijnlijkheidsrekening) houden we ons bezig met (wiskundige) modellen voor het beschrijven van experimenten waarin het toeval een rol speelt. We kunnen daarbij denken aan het werpen van een dobbelsteen of het meten van de levensduur van een bepaald type gloeilamp. In deze gevallen is duidelijk welke handelingen we moeten verrichten om een uitkomst van het experiment te verkrijgen. De uitkomst zelf staat echter in het algemeen niet van te voren vast, maar pas nadat het experiment is uitgevoerd. Dergelijke experimenten noemen we stochastisch.

Definitie 1.1.1
Onder een toevalsexperiment (of stochastisch experiment) verstaan we een experiment dat, onder gelijke omstandigheden herhaald, niet noodzakelijk tot gelijke uitkomsten leidt. \square

Opmerking 1
In het vervolg zullen we steeds van experiment spreken als we een stochastisch experiment bedoelen.\square

Het uitvoeren van een experiment leidt altijd tot een resultaat: de uitkomst van het experiment. Bij het werpen van een dobbelsteen is de uitkomst het aantal geworpen ogen; de geboorte van een baby leidt tot een van de uitkomsten "jongen" of "meisje"; de uitkomst bij het meten van de levensduur van een gloeilamp is de vastgestelde levensduur, een positief reëel getal, en het lanceren van de satelliet leidt tot een van de uitkomsten "succes" of "mislukking".

Bij de uitvoering van een experiment kan de uitkomst zelf van veel belang zijn, denk aan een spelletje dobbelen of roulette, of aan ouders die graag een zoon willen hebben. In de kansrekening gaat het echter niet om een specifieke uitkomst, maar om de mogelijke uitkomsten. Hoewel de uitkomst van een stochastisch experiment niet a-priori vaststaat, kunnen we wel vaststellen welke uitkomsten mogelijk zijn. Deze mogelijke uitkomsten horen onverbrekelijk bij het experiment en staan, in tegenstelling tot de uitkomst, ook vast voordat het experiment is uitgevoerd. De verzameling van alle mogelijke uitkomsten noemen we de uitkomstenruimte van het experiment. Deze verzameling duiden we gewoonlijk aan door S (van Engels: Sample space).

Definitie 1.1.2
De uitkomstenruimte S (S ≠ ∅) van een experiment is de verzameling van alle mogelijke uitkomsten; een element s ∈ S heet uitkomst. We spreken van een discrete uitkomstenruimte als de uitkomstenruimte eindig dan wel aftelbaar oneindig is.\square

Opmerking 2
We zullen ons in dit boek uitsluitend bezighouden met discrete uitkomstenruimten; vandaar de titel Discrete Kansrekening. Met de bestudering hiervan wordt een goed beeld gekregen van wat kansrekening inhoudt en een goede basis gelegd voor verdere bestudering van de algemene theorie.\square

Een experiment geeft aanleiding tot bepaalde gebeurtenissen. Zo kunnen we bij het werpen van een dobbelsteen spreken over de gebeurtenis dat het geworpen aantal ogen even is of de gebeurtenis dat dit aantal groter dan 3 is. De gebeurtenis "aantal ogen is even" treedt op als de uitkomst 2, 4 of 6 is. Daarom identificeren we deze gebeurtenis met de deelverzameling {2,4,6} van de uitkomstenruimte. Zo is de gebeurtenis "aantal ogen groter dan 3" identiek met de deelverzameling {4,5,6}. Algemeen zullen we gebeurtenissen opvatten als deelverzamelingen van de uitkomstenruimte.

Definitie 1.1.3
Een gebeurtenis is een deelverzameling van de uitkomstenruimte S.\square

We geven gebeurtenissen veelal aan met hoofdletters uit het begin van het alfabet, dus A, B, C etc.

Voorbeeld 1 (ontaarde situatie)
Een experiment met één mogelijke uitkomst u. De uitkomstenruimte is een verzameling met slechts één element: S = {u}. Er is eigenlijk niet van toeval sprake.\square

Voorbeeld 2 (alternatief)
We werpen een munt. Er zijn twee mogelijke uitkomsten K(ruis) en M(unt). We nemen dus als uitkomstenruimte de verzameling S = {K,M}. Een gebeurtenis is bv. {K} = "we hebben kruis geworpen"; deze gebeurtenis is praktisch niet verschillend van de uitkomst K.\square

Voorbeeld 3 (dobbelsteen)
We werpen een dobbelsteen; het aantal geworpen ogen is de uitkomst van het experiment. De uitkomstenruimte is dus S = {1,2,3,4,5,6}. Gebeurtenissen zijn bv. E = {2,4,6} (we gooien een even ogenaantal), D = {1,2} (we gooien minder dan 3) of A = {1,6} (we gooien 1 of 6).\square

Voorbeeld 4 (twee worpen met een dobbelsteen)
We werpen twee maal een dobbelsteen. Als uitkomst van dit experiment nemen we het getallenpaar bestaande uit het aantal geworpen ogen bij de eerste worp en dat bij de tweede worp. De uitkomstenruimte is S = {(1,1),...,(1,6),(2,1),...,(2,6),...,(6,6)} = {(i,j)|i = 1,2,...,6 en j = 1,2,...,6} en bevat dus 36 uitkomsten. Grafisch kan men deze uitkomstenruimte als volgt voorstellen:

                    |  |  |  |  |  |
                6  -o--o--o--o--o--o--
uitkomsten          |  |  |  |  |  |
                5  -o--o--o--o--o--o--
2e worp             |  |  |  |  |  |
                4  -o--o--o--o--o--o--
                    |  |  |  |  |  |
                3  -x--o--o--o--o--o--
                    |  |  |  |  |  |
                2  -o--x--o--o--o--o--
                    |  |  |  |  |  |
                1  -o--o--x--o--o--o--
                    |  |  |  |  |  |
   
uitkomsten 1e worp  1  2  3  4  5  6 

Figuur 1.1.1. Uitkomstenruimte bij twee worpen met een dobbelsteen.

Een gebeurtenis is bv. A = {(1,3),(2,2),(3,1)} (de som van de ogen van beide dobbelstenen is 4); in de figuur zijn de uitkomsten die tot A behoren aangegeven door "x". De gebeurtenis B dat beide worpen hetzelfde aantal ogen opleveren is B = {(1,1),(2,2),...,(6,6)}.\square

Voorbeeld 5
Uit een partij bestaande uit 1000 chips worden er 10 gekozen. Deze 10 chips worden elk getest en goedgekeurd of afgekeurd. De uitkomst van dit experiment is het aantal afgekeurde chips; als uitkomstenruimte nemen we: S = {0,1,...,10}. Een gebeurtenis is A = {0,1,2} (dwz. er zijn ten hoogste twee afgekeurde chips).\square

Voorbeeld 6
We werpen een dobbelsteen zo vaak tot voor het eerst 6 boven komt. Het aantal worpen vatten we op als uitkomst van het experiment; de uitkomstenruimte is dan S = {1,2,...}. Deze uitkomstenruimte is niet eindig, zoals in de voorgaande voorbeelden, maar aftelbaar oneindig. Een gebeurtenis is bv. A = {1,2,3,4,5} (dwz. om 6 te gooien, hoefden we niet meer dan 5 keer te werpen).\square

Voorbeeld 7
De levensduur van een gloeilamp kan men beschouwen als de uitkomst van een experiment. Aangezien een lamp op ieder willekeurig tijdstip defect kan raken, moeten we als uitkomstenruimte nemen S = [0,∞). Deze uitkomstenruimte is niet meer aftelbaar. Een gebeurtenis is bv. A = (1000,∞) (de lamp brandde langer dan 1000). Met zulke niet-discrete uitkomstenruimten houden we ons in dit boek niet bezig.\square


Aangezien gebeurtenissen gedefinieerd zijn als verzamelingen, kunnen we aan verschillende begrippen uit de verzamelingenleer een voor de kansrekening eigen interpretatie geven (de begrippen worden bekend verondersteld).

-De uitkomstenruimte S zelf, in de verzamelingenleer als universele verzameling aangeduid, is ook een gebeurtenis, die we de zekere gebeurtenis noemen; aangezien elke uitkomst in S ligt, treedt deze gebeurtenis dus altijd op.

-Ook de lege verzameling ∅ is een gebeurtenis; we noemen die de onmogelijke gebeurtenis, omdat geen enkele uitkomst element is van ∅ en deze gebeurtenis dus nooit optreedt.

-Een gebeurtenis {s} die slechts één uitkomst s bevat, een singleton, noemen we een elementaire gebeurtenis. Zo'n gebeurtenis is praktisch gesproken niet verschillend van de uitkomst s, maar formeel daarvan verschillend.

-Het complement (t.o.v. S) van A:

\overline{A} = A^c = S \setminus A ,

heet complementaire gebeurtenis van A, dus de gebeurtenis die optreedt als A niet optreedt.

-De vereniging A ∪ B van twee gebeurtenissen A en B is de gebeurtenis die optreedt als A optreedt of B optreedt.

-De doorsnede AB (= A ∩ B) van twee gebeurtenissen A en B is de gebeurtenis die optreedt als A en B (beide) optreden.

-Indien A ⊂ B (A is een deelverzameling van B), dan zeggen we: A impliceert B, dwz. als A optreedt, treedt ook B op.


In de kansrekening spelen gebeurtenissen die niet gelijktijdig kunnen optreden een belangrijke rol; we geven daarom de volgende definitie:

Definitie 1.1.4a
De gebeurtenissen A en B noemen we disjunct (of elkaar uitsluitend) als AB = ∅, dwz. A en B kunnen niet gelijktijdig optreden.\square

We kunnen deze definitie op voor de hand liggende wijze uitbreiden naar een rij gebeurtenissen, bestaande uit een aftelbaar aantal gebeurtenissen (Ai), dwz. de rij is eindig (A1,A2,...,An) of de rij is aftelbaar oneindig (A1,A2,...). In beide gevallen duiden we de rij aan met (Ai).

Definitie 1.1.4b
We spreken van een rij disjuncte (of elkaar uitsluitende) gebeurtenissen (Ai), als AiAj = ∅ voor elk mogelijk paar (i,j) waarvoor i ≠ j.\square


-Voor een rij gebeurtenissen (Ai) bedoelen we met \bigcap A_i (zowel in het eindige als in het aftelbaar oneindige geval) de gebeurtenis die optreedt als elk van de gebeurtenissen Ai optreedt en met  \bigcup A_i de gebeurtenis die optreedt als tenminste een van de gebeurtenissen Ai optreedt.

De volgende eigenschappen van verzamelingen worden bekend geacht:

Stelling 1.1.1 (eigenschappen van gebeurtenissen)
(a) A(B\cup C) = AB \cup AC;\, A \cup BC = (A\cup B) \cap (A\cup C)

(b) A \cup B = A \cup A^cB;\, B=AB \cup A^cB

(c) (\bigcup A_n)^c = \bigcap A_n^c; (\bigcap A_n)^c = \bigcup A_n^c;(regels van De Morgan).\square

Definitie 1.1.5
De rij disjuncte gebeurtenissen (Ai) noemen we een partitie van de gebeurtenis B als  B=\bigcup A_i. Een partitie wordt ook wel aangeduid als categorisch systeem.\square


Voorbeeld 8
Op een school zitten 1000 leerlingen waaronder 600 meisjes. De school bestaat uit de afdelingen MAVO, HAVO en VWO. Uit deze leerlingen wordt er één gekozen. Bij dit "experiment" kunnen we de volgende gebeurtenissen omschrijven:

M treedt op als de gekozen leerling een meisje is,
J treedt op als de gekozen leerling een jongen is,
A treedt op als de gekozen leerling MAVO volgt,
B treedt op als de gekozen leerling HAVO volgt,
C treedt op als de gekozen leerling VWO volgt.

De uitkomst van het experiment is een leerling s en de uitkomstenruimte S is de verzameling van alle 1000 leerlingen. M is een deelverzameling van S, namelijk de verzameling van alle meisjes, J die van alle jongens, A die van alle MAVO-leerlingen, enz. We zien nu onder meer het volgende:

  • J = Mc;
  • A ∪ B is de verzameling van leerlingen die MAVO of HAVO volgen, dus de gebeurtenis dat de gekozen leerling MAVO of HAVO volgt;
  • AB = ∅, dus A en B sluiten elkaar uit: de gekozen leerling kan niet tegelijk MAVO en HAVO volgen;
  • A ∪ B ∪ C = S, dus A, B en C vormen een partitie van S, dwz. een opdeling van S in elkaar uitsluitende gebeurtenissen.
  • M ∪ J = S; ook M en J vormen een partitie van S.
  • MC is de verzameling van meisjes die VWO volgen, dus de gebeurtenis dat de gekozen leerling een meisje is dat VWO volgt;
  • J ∪ B is de verzameling van leerlingen die van het mannelijk geslacht zijn of HAVO volgen.\square
De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 1.2 Intuitief kansbegrip

Om tot een kansbegrip te komen, bespreken we eerst een tweetal intuïtieve benaderingswijzen van het begrip kans. Als eerste baseren we ons op het ervaringsfeit dat, als een uitkomst in bv. 30% van een lange reeks waarnemingen optreedt, we dit getal van 30% als de kans van optreden van die uitkomst interpreteren (Von Mises, 1920). We beschouwen daartoe een experiment waarbij de gebeurtenis A kan optreden. Voeren we het experiment N maal uit, dan noemen we de fractie keren dat de gebeurtenis A optreedt, het frequentiequotiënt van A bij N uitvoeringen van het experiment.

Definitie 1.2.1
Het frequentiequotiënt fq(A) van de gebeurtenis A bij n herhalingen van een experiment is de fractie malen dat A optreedt, dus

 fq(A) = \frac{N(A)}{n};

daarin is N(A) het aantal keren dat A bij die n herhalingen optreedt.


Voor vaste n heeft het frequentiequotiënt de volgende eigenschappen.

Stelling 1.2.1 (eigenschappen van frequentiequotiënt)
Voor het frequentiequotiënt fq(A) van een gebeurtenis A geldt:

(a) fq(A) ≥ 0
(b) fq(S) = 1.
(c1) als A en B twee disjuncte gebeurtenissen zijn, dan is: fq(A ∪ B) = fq(A) + fq(B).
(c2) algemeen geldt voor aftelbaar oneindig veel disjuncte gebeurtenissen A1,A2,... dat:
fq(\bigcup_{i=1}^n A_i) = \sum_{i=1}^n fq(A_i).


Voorbeeld 1
We doen het volgende experiment. We voeren achtereenvolgens 1000 worpen met een munt uit en noteren voor elke N = 1,2,3,...,1000 de waarde van fq(A), waarbij A de gebeurtenis "kruis komt boven" is. In figuurt1.2.1 staat de grafiek van fq getekend voor de eerste 35 worpen en in figuur 1.2.2 voor alle 1000 worpen.

Figuur 1.2.1 Diagram van fq(A) bij de eerste 35 worpen
Figuur 1.2.1 Diagram van fq(A) bij de eerste 35 worpen
Figuur 1.2.2 Diagram van fq(A) bij de eerste 1000 worpen
Figuur 1.2.2 Diagram van fq(A) bij de eerste 1000 worpen

Uit figuur 1.2.1. zien we dat de uitkomsten van de eerste 35 worpen waren: KMKMM KKKMK MMKKM KMMMM KKKKK MKMKK KMKKK. Ook zien we dat de frequentiequotiënten in het begin (als N nog klein is) vrij sterke schommelingen vertonen; echter als N eenmaal vrij groot is, vertoont fq(A) niet veel variatie meer, zoals we kunnen zien in figuur 1.2.2. Het lijkt veeleer alsof fq(A) met toenemende N tot een limietgetal nadert.


Wat we in het voorbeeld constateerden, is geen incidenteel verschijnsel; algemeen blijkt dat, wanneer we een zeer lange serie experimenten (van hetzelfde type) uitvoeren, van welke aard ook, de frequentiequotiënten op den duur steeds minder variëren en als het ware tot een limietgetal naderen. Dit experimenteel gevonden verschijnsel heet de experimentele wet van de grote aantallen.

Intuïtief correspondeert dit denkbeeldige limietgetal met de betekenis die we gewoonlijk aan het begrip kans hechten. Het geeft immers de fractie malen aan dat een gebeurtenis optreedt in een "oneindig lange" serie herhalingen van een experiment. Toch kunnen we op deze wijze niet het begrip kans invoeren, omdat we oneindig lange series experimenten nooit kunnen uitvoeren. We zullen later het begrip kans zo invoeren dat het de bovenstaande eigenschappen heeft.

Ook op andere wijze krijgen we een intuïtieve benadering van het kansbegrip. We laten dat zien aan het volgende voorbeeld.

Voorbeeld 2
We werpen een zuivere dobbelsteen (dwz. een exacte kubus, gemaakt van een homogeen materiaal en de 6 zijden voorzien van de ogenaantallen 1 tot en met 6, zonder de gewichtsverdeling te verstoren). Op grond van de (fysische) symmetrie van de dobbelsteen zeggen we dat elk van de mogelijke uitkomsten (ogenaantallen) 1 tot en met 6 gelijke kans van optreden heeft.


Definitie 1.2.2
Een experiment met een eindig aantal uitkomsten noemen we symmetrisch, als alle uitkomsten even waarschijnlijk zijn (dwz. als er geen voorkeur van optreden is voor een van de uitkomsten).


Het idee van symmetrie is wel geschikt voor een definitie van het begrip kans. Het werd geïntroduceerd door Laplace (1749-1827).

Definitie 1.2.3 (kansdefinitie van Laplace)
In een symmetrisch experiment wordt de kans op een gebeurtenis A gegeven door de fractie voor A gunstige (dwz. tot A behorende) uitkomsten.


Voorbeeld 3
Voor een opiniepeiling wordt willekeurig een volwassen Nederlander uitgekozen uit de gehele bevolking. Omdat er willekeurig wordt gekozen, is er sprake van symmetrie. De kans dat de gekozen persoon uit Limburg komt, kunnen we dus berekenen als

\frac{\mbox{aantal volwassen Limburgers}}{\mbox{aantal volwassen Nederlanders}}


Eenvoudig is in te zien dat de kans volgens Laplace voldoet aan de voor het frequentiequotiënt genoemde eigenschappen.

Stelling 1.2.2
De kans volgens Laplace voldoet aan de eigenschappen 1.2.1.a - c.


Toch heeft de kansdefinitie van Laplace twee ernstige beperkingen. De definitie veronderstelt een eindige uitkomstenruimte, terwijl we ook experimenten in onze beschouwingen willen betrekken waarbij de uitkomstenruimte oneindig veel elementen bevat. Bovendien, al telt de uitkomstenruimte van een experiment eindig veel elementen, de veronderstelling dat iedere elementaire gebeurtenis dezelfde kans heeft, sluit zeker niet altijd aan bij de realiteit. We zoeken daarom naar een definitie van het begrip kans die meer algemeen is.

Opmerking 1
De frequentie-interpretatie van kansen is gebaseerd op een lange rij herhalingen van het experiment. Het is daarbij niet nodig dat dergelijke herhalingen werkelijk uitgevoerd worden. We denken ons in dat het experiment een groot aantal malen herhaald zou worden. Maar ook met deze ruime opvatting is de idee van herhaalbaarheid nogal eens gewrongen.

Opmerking 2
Een arts vertelt een patiënt dat de slaagkans van een operatie 80% is. Wat moeten we ons bij een dergelijke uitspraak voorstellen? Allereerst zouden we moeten weten waar een dergelijke uitspraak op gebaseerd is. Vaak is een dergelijke uitspraak niet erg gefundeerd. Beschouwen we echter de uitspraak op zichzelf en stellen we ons op het standpunt van de arts dan is een frequentie-interpretatie zeer wel denkbaar. Als de arts de operatie vele malen uitvoert, slaagt de operatie in zo'n 8 van de 10 gevallen. Stellen we ons op het standpunt van de patiënt, dan lijkt een dergelijke interpretatie niet erg zinvol. De patiënt ondergaat de operatie niet vele malen. Het is meestal een eenmalige aangelegenheid. Om toch een beeld te vormen van de betekenis van die 80%, doen we het volgende gedachte-experiment. In een kamer staat een bak met 100 knikkers, 80 witte en 20 zwarte. Er wordt op goed geluk één knikker uit de bak getrokken. Is de knikker wit, dan slaagt de operatie; is de knikker zwart, dan mislukt de operatie. Helaas wordt ons niet verteld of er een witte dan wel een zwarte knikker getrokken is.

Met een dergelijk beeld in het achterhoofd groeit, naarmate we meer voorbeelden en toepassingen tegenkomen, de operationele betekenis van de intuïtieve interpretatie van het begrip kans.

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 1.3 Kans

In 1933 legde de Russische wiskundige A. N. Kolmogorov (1903-1987) in zijn boekje "Grundbegriffe der Wahrscheinlichkeitsrechnung" de basis voor de moderne kansrekening. Hierdoor kwamen de in de vorige paragrafen genoemde beperkingen te vervallen. Bij deze aanpak is een willekeurige (niet-lege) verzameling als uitkomstenruimte toegestaan. Zo is bv. de verzameling van alle reële getallen toegestaan, waardoor het o.a. mogelijk is dat er oneindig veel verschillende gebeurtenissen zijn. Voor de elementaire gebeurtenissen is niet meer vereist dat ze alle "gelijkelijk mogelijk" zijn. Kolmogorov poneerde drie axioma's waaraan een kans moet voldoen. Deze drie axioma's zijn het analogon van de eigenschappen 1.2.1.a - c uit paragraaf 2, waaraan het frequentiequotiënt zowel als de kans volgens Laplace voldoet.

Definitie 1.3.1 (axioma's van Kolmogorov)
Zij S een willekeurige uitkomstenruimte. Een functie P die aan elke gebeurtenis A ⊂ S een reëel getal P(A) toevoegt, noemen we een kans op S, als P voldoet aan de volgende eisen:

(a) P(A) ≥ 0 voor elke gebeurtenis A;
(b) P(S) = 1;
(c) voor elke aftelbaar oneindige rij disjuncte gebeurtenissen (Ai) geldt:
P(\bigcup_{i=1}^n A_i) = \sum_{i=1}^n P(A_i).


Op deze drie rekenregels voor kansen berust de gehele kansrekening!

Opmerking
De axioma's van Kolmogorov zijn van toepassing op willekeurige uitkomstenruimten. In dit boek zullen we ons echter alleen met discrete uitkomstenruimten bezighouden.


In de vorige paragraaf hebben we al opgemerkt dat een kans volgens de definitie van Laplace voldoet aan de axioma's en dus terecht de naam kans verdient. Op welke andere manieren kunnen we nu een kans construeren? Voor discrete uitkomstenruimten kunnen we op natuurlijke wijze de kans p(s) = P({s}) op een elementaire gebeurtenis vastleggen door de kansfunctie p.

Definitie 1.3.2
Zij S een willekeurige (discrete) uitkomstenruimte. Een functie p: S \to \R, die aan iedere uitkomst s een getal p(s), dat we ook kans op s noemen, toevoegt, heet kansfunctie als:

p(s) \ge 0

en

\sum_{s \in S} p(s) = 1 .

We kunnen nu bij een kansfunctie een kans definiëren, door de kans op een gebeurtenis te berekenen als de som van de kansen op de uitkomsten die tot die gebeurtenis behoren. Dat zo inderdaad een kans gedefinieerd is blijkt uit de volgende stelling.

Stelling 1.3.1
Als p een kansfunctie is op de uitkomstenruimte S, dan is de functie P, gedefinieerd voor iedere gebeurtenis A door:

P(A) = \sum_{s \in A} p(s)

een kans op S.


Bij iedere kansfunctie p op een discrete uitkomstenruimte S hoort dus een kans P op S. Omgekeerd hoort bij iedere kans P op een discrete uitkomstenruimte S een kansfunctie p op S.

Stelling 1.3.2
Als P een kans is op de uitkomstenruimte S, dan is de functie \,p: S \to \R gedefinieerd door:

\,p(s) = P(\{s\})

een kansfunctie.


Uit het voorgaande blijkt dus dat kansen P en kansfuncties p op een-eenduidige wijze bij elkaar horen.

Definitie 1.3.3
Zij S een uitkomstenruimte en P een kans op S, dan noemen we het paar (S,P) een kansruimte. Ook het paar (S,p), waarin p de bij P behorende kansfunctie is, zullen we als kansruimte aanduiden.


Voorbeeld 1 (alternatief; vervolg)
De uitkomstenruimte is S = {K,M}. We geven een willekeurige kansfunctie aan door p(K) = 1 - p(M) = p, met 0 ≤ p ≤ 1. Er zijn maar vier gebeurtenissen; de bij p behorende kans P kent daaraan de volgende kansen toe: P(∅) = 0, P({K}) = p, P({M}) = 1-p en P(S) = 1. We kunnen de kansruimte ook in een tabel geven:

    s   │  K  │  M  │  S
  ──────┼─────┼─────┼─────
   p(s) │  p  │ 1-p │  1 

Voorbeeld 2 (zuivere dobbelsteen; vervolg)
De uitkomstenruimte is S = {1,2,3,4,5,6}. Voor een zuivere dobbelsteen is de kans op elke uitkomst gelijk, dus p(1) = p(2) = ... = p(6) = 1/6. De bijbehorende kans P is gedefinieerd volgens Laplace, dus is bv. P(E) = 3/6 voor de gebeurtenis E = {2,4,6} (we gooien een even ogenaantal) en P(D) = 2/6 voor D = {1,2} (we gooien minder dan 3). In tabel ziet de kansruimte er als volgt uit:

    s   │  1    2    3    4    5    6     │ totaal   
  ──────┼─────────────────────────────────┼────────
   p(s) │ 1/6  1/6  1/6  1/6  1/6  1/6    │   1 


Voorbeeld 3 (twee worpen met een dobbelsteen; vervolg)
De uitkomstenruimte is S = {(i,j)|i=1,2,...,6 en j=1,2,...,6} en voor een zuivere dobbelsteen zijn alle 36 uitkomsten even waarschijnlijk, dus is p(s) = 1/36 voor alle s ∈ S. De bijbehorende kans P is weer gedefinieerd volgens Laplace; zo heeft de gebeurtenis A = {(1,3),(2,2),(3,1)} (de som van de ogen van beide worpen is 4) een kans P(A) = 3/36 van optreden.

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 1.4 Eigenschappen van kansen

Uit de axioma's van Kolmogorov kunnen we enkele eigenschappen afleiden die het rekenen met kansen vereenvoudigen of overzichtelijker maken.

Stelling 1.4.1 (eigenschappen van kansen)
Omdat ∅ = ∅ ∪ ∅ ∪ ... geldt volgens axioma 1.3.1.c dat P(∅) = P(∅) + P(∅) + .... Uit deze gelijkheid volgt:

(a) P(∅) = 0.

Als A1,A2,...,An disjuncte gebeurtenissen zijn en we stellen Ak = ∅ voor k > n, dan volgt uit axioma 1.3.1.c, dat:

(b) P(\bigcup_{i=1}^n A_i) = P(\bigcup_{i=1}^\infty A_i) = \sum_{i=1}^\infty P(A_i) = \sum_{i=1}^n P(A_i) .

Voor elke twee gebeurtenissen A en B kunnen we schrijven B = AB ∪ AcB; omdat AB en AcB disjunct zijn, volgt uit b:

(c) P(B) = P(AB) + P(AcB).

Kiezen we B = S in c, dan vinden we in het bijzonder:

(d) P(Ac) = 1 - P(A).

Is A ⊂ B dan is AB = A, zodat uit c volgt:

(e) als A ⊂ B, dan is P(A) ≤ P(B).

Tevens volgt uit c dat in het algemeen geldt:

(f) P(A∪B) = P(A) + P(AcB) = P(A) + P(B) - P(AB).

Uit f blijkt weer dat (ongelijkheid van Boole):

(g) P(A∪B) ≤ P(A) + P(B).


Opmerking 1
Eigenschap b is niet equivalent met axioma 1.3.1.c. Het voert echter te ver om hier nader op in te gaan.


Voorbeeld 1
We werpen net zolang een zuivere dobbelsteen tot we zes gooien. Hoe groot is de kans dat we meer dan drie keer moeten werpen? Als uitkomstenruimte nemen we {1,2,3,...}, waarin we de uitkomst "n keer werpen" aangeven door n, en als kansfunctie p(n) = (5/6)n-1(1/6). Laat A de gebeurtenis "meer dan drie keer werpen" zijn. De gevraagde kans is dan P(A) = p(4) + p(5) + p(6) + ... Het is nu gemakkelijker om naar het complement van A te kijken; immers P(AC) = p(1) + p(2) + p(3) = 1/6 + 5/36 + 25/216 = 91/216, zodat P(A) = 1 - P(AC) = 125/216. We zullen later zien dat we deze kans ook kunnen bepalen door de gevraagde gebeurtenis op te vatten als "de eerste drie worpen geen zes". Bij elke worp is de kans 5/6 dat we geen zes gooien en we zullen dan zien dat we de gevraagde kans door vermenigvuldiging van deze kansen moeten berekenen, dus als (5/6)3 = 125/216.

Voorbeeld 2
In een bepaalde stad leest 30% van de inwoners krant A, 20% krant B en 5% is geabonneerd op beide kranten. Wat is de kans dat een willekeurig gekozen inwoner tenminste een van beide kranten leest? Er geldt: P(A∪B) = P(A) + P(B) - P(AB) = 0,3 + 0,2 - 0,05 = 0,45.

Eigenschap f laat zich gemakkelijk generaliseren naar meer dan twee gebeurtenissen. Begripsmatig is deze generalisatie niet ingewikkeld, maar wel het opschrijven ervan; we zullen dit dan ook alleen expliciet doen voor drie gebeurtenissen. Door herhaald toepassen van f volgt dan:

Stelling 1.4.2 (algemene somregel)
Voor een drietal gebeurtenissen A, B en C geldt:

P(A∪B∪C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC).


Voorbeeld 3 (ONS DORP)
In ONS DORP, een dorp van 8123 inwoners, is een bloeiend cultureel leven, hetgeen blijkt uit het bestaan van drie toneelverenigingen: ACHTER DE COULISSEN (A) met 42 leden, BURGERTONEEL (B) met 30 leden en de CHRISTELIJKE TONEELVERENIGING (C) met 57 leden. Hoe groot is de kans dat een willekeurig gekozen dorpsbewoner toneel speelt? Die kans is niet (42+30+57)/8123, want 10 dorpsbewoners zijn lid van A zowel als van B, 12 zijn lid van A zowel als van C, 9 van B zowel als van C en 8 zijn zelfs lid van alle drie toneelverenigingen. We vinden dus: P(A∪B∪C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC) = (42 + 30 + 57 - 10 - 12 - 9 + 8)/8123 = 106/8123.

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 2.1 Inleiding

In het voorgaande hoofdstuk hebben we al gesproken over symmetrie, dwz. over situaties waarin alle uitkomsten gelijke kans hebben. Als voorbeeld zijn we het werpen van een zuivere munt of zuivere dobbelsteen tegengekomen. Symmetrie komen we vaker tegen, zoals in de belangrijke gevallen van het lukraak trekken van knikkers (loten) uit een vaas. Uiteraard kunnen er in het geval van symmetrie maar eindig veel uitkomsten zijn.

Definitie 2.1.1
Een kansruimte (S,p) noemen we symmetrisch als S eindig is en iedere uitkomst s ∈ S gelijke kans heeft.


Aangezien we in dit hoofdstuk veel over het aantal uitkomsten in een gebeurtenis zullen spreken, voeren we een aparte notatie in voor het aantal elementen van een verzameling

Definitie 2.1.2
Het aantal elementen van een verzameling A geven we aan door #A.


Omdat de som van alle kansen op uitkomsten in een uitkomstenruimte gelijk is aan 1, heeft elke uitkomst s in een symmetrische kansruimte een kans p(s) = 1/#S.

Stelling 2.1.1
In een symmetrische kansruimte (S,p) wordt de kansfunctie p gegeven door:

p(s) = \frac{1}{\# S},

voor alle s ∈ S.


De kans P(A) op een gebeurtenis A is in een symmetrische kansruimte juist de kans volgens de definitie van Laplace. We kunnen de kans op A bepalen door te tellen hoeveel uitkomsten tot A behoren (gunstig zijn voor A) en dat aantal te delen door het totale aantal mogelijke uitkomsten.

Stelling 2.1.2 (kansdefinitie van Laplace)
In een symmetrische kansruimte wordt de kans op een gebeurtenis A gegeven door

P(A) = \frac{\# A}{\# S}

Bewijs:

P(A) = \sum_{s \in A} p(s) = \sum_{s \in A} \frac{1}{\# S} = \frac{\# A}{\# S}


We bespreken nu enkele voorbeelden van symmetrische kansruimten.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
De uitkomstenruimte S bestaat uit de 36 paren (s1,s2), met si= 1,2,...,6. Omdat de dobbelsteen zuiver is en we er lukraak mee gooien, zullen alle 36 uitkomsten dezelfde kans hebben. Dit experiment beschrijven we dus met een symmetrische kansruimte; dwz. de kansfunctie p is eenvoudigweg voor alle 36 uitkomsten gelijk en wel: p(s1,s2) = 1/36. Wat is de kans dat het totaal aantal geworpen ogen gelijk is aan 4? Die gebeurtenis noemden we A, dus P(A) = #A/#S = 3/36, want 3 van de 36 uitkomsten zijn gunstig voor A.

Voorbeeld 2
Op de school van voorbeeld 7 uit par. 1.1 wordt willekeurig één leerling gekozen uit het totaal van 1000 leerlingen. Dat we willekeurig kiezen, betekent dat elke leerling dezelfde kans heeft om gekozen te worden; die kans is dus 1/1000. We hebben te maken met een symmetrische kansruimte. De gebeurtenis dat deze leerling een meisje is, duiden we aan met M; dan is P(M) = 600/1000 = 0,6.

Voorbeeld 3
Uit een spel van 52 kaarten trekken we lukraak één kaart. Er is weer symmetrie. We berekenen bv.:

P("ruiten") = aantal ruiten / totaal aantal = 13/52 = 1/4,
P("aas") = 4/52 = 1/13

en

P("ruiten" of "aas") = 16/52 = 4/13.

De laatste kans kunnen we ook berekenen met de algemene somregel, dan is:

P("ruiten" of "aas") = P("ruiten") + P("aas") - P("ruitenaas") = 13/52 + 4/52 - 1/52 = 16/52.


Voor we beslissen dat er bij een experiment sprake is van symmetrie, dienen we ons er terdege van te overtuigen dat het experiment zo is ingericht dat inderdaad alle uitkomsten even waarschijnlijk zijn. Het volgende historische voorbeeld laat zien hoe hier gemakkelijk fouten kunnen ontstaan.

Voorbeeld 4
We werpen tegelijk twee munten. De uitkomsten kunnen we voorstellen door 2×kruis, 1×kruis en 0×kruis. D'Alembert (1717-1783) stelde ten onrechte dat de bijbehorende kansruimte symmetrisch is.

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 2.2 Combinatorische kansrekening

Veel problemen in de kansrekening kunnen worden opgelost door gebruik te maken van symmetrie, dus door de kansdefinitie van Laplace toe te passen. Het berekenen van kansen komt dan neer op het tellen van uitkomsten. Het zal duidelijk zijn dat de theorie van het tellen, de combinatoriek, een belangrijk hulpmiddel in de kansrekening is. In dit hoofdstuk zullen we een aantal belangrijke resultaten uit de combinatoriek herhalen en toepassen in de kansrekening.

Telkens blijkt goed tellen toch meer een kunst te zijn, dan op het eerste gezicht het geval lijkt. Een eerste moeilijkheid doet zich voor als er een of andere opsplitsing van het probleem is gebruikt en de vraag opduikt of we in dat het geval het totale aantal verkrijgen door optelling dan wel door vermenigvuldiging. Het antwoord luidt - uiteraard - dat het afhangt van de aard van de opsplitsing. De beide volgende stellingen geven hierover uitsluitsel.

Stelling 2.2.1 (speciale somregel)
Voor de vereniging van een collectie disjuncte verzamelingen A1,A2,...,An geldt: #(A1∪A2∪...∪An) = #A1+#A2+...+#An.

Als we het aantal elementen van elke Ai geteld hebben en de Ai's hebben onderling geen gemeenschappelijke elementen, dan hoeven we niet opnieuw te gaan tellen om het totale aantal elementen te bepalen, maar kunnen we gewoon de afzonderlijke aantallen bij elkaar optellen. We kunnen zeggen dat we moeten optellen als de verschillende mogelijkheden naast elkaar kunnen voorkomen, dus de een of de ander.

In de bovenstaande regel ligt een bron van veel fouten besloten. Er wordt nogal eens over het hoofd gezien dat geëist wordt dat de verzamelingen disjunct zijn. Is dat niet het geval, dan moeten we de algemene somregel gebruiken. Voor twee verzamelingen luidt die:

Stelling 2.2.2 (algemene somregel)
Voor een tweetal verzamelingen A en B geldt: #(A∪B) = #A + #B - #AB

Het totale aantal elementen in A en B verkrijgen we door de afzonderlijke aantallen bij elkaar optellen en te verminderen met het aantal gezamenlijke elementen; die gezamenlijke elementen zouden we anders dubbel tellen.

De algemene somregel kan, op analoge wijze als de overeenkomstige somregel voor kansen, op voor de hand liggende wijze worden uitgebreid naar meer dan twee verzamelingen. We geven alleen een voorbeeld.

Voorbeeld 1 (ONS DORP; vervolg)
In ONS DORP zijn drie toneelverenigingen, A met 42 leden, B met 30 leden en C met 57 leden. Hoeveel dorpsbewoners spelen toneel? Dat zijn er niet 30+42+57, want 10 dorpsbewoners zijn lid van A zowel als van B, 12 zijn lid van A zowel als van C, 9 van B zowel als van C en 8 zijn zelfs lid van alle drie toneelverenigingen. We vinden dus: #(A∪B∪C) = #A + #B + #C - #AB - #AC - #BC + #ABC = 106.

Voorbeeld 2
We werpen driemaal een zuivere dobbelsteen. Voor de uitkomstenruimte S geldt #S = 63 = 216. Zij A de gebeurtenis dat we tenminste één keer zes gooien. Er geldt dat A = A1∪ A2∪ A3, waarin Ai de gebeurtenis is dat de ie worp (i=1,2,3) een zes opleverde. Omdat de gebeurtenissen A1, A2 en A3 geen disjunct drietal vormen, mogen we niet de speciale somregel toepassen op dit drietal. Wel kunnen we deze regel toepassen op een partitie van A. Daartoe delen we A op in disjuncte stukken:


A = A_1A_2^cA_3^c \cup A_1^cA_2A_3^c \cup A_1^cA_2^cA_3 \cup A_1A_2A_3^c \cup A_1A_2^cA_3 \cup A_1^cA_2A_3 \cup A_1A_2A_3

zodat volgt:

\# A = \# A_1A_2^cA_3^c  + \# A_1^cA_2A_3^c  + \# A_1^cA_2^cA_3  + \# A_1A_2A_3^c  + \# A_1A_2^cA_3  + \# A_1^cA_2A_3  + \# A_1A_2A_3 =
\,= 25 + 25 + 25 + 5 + 5 + 5 + 1 = 91.

Dit antwoord kan ook verkregen worden door op te merken dat A de gebeurtenis is dat er geen zes bij de drie worpen is; dan is dus #Ac = 53 = 125 en #A = #S - #Ac = 216 - 125 = 91. We kunnen #A ook door toepassing van de algemene somregel bepalen:

\# A = \# A_1 + \# A_2 + \# A_3  - \# A_1A_2 - \# A_1A_3  - \# A_2A_3  + \# A_1A_2A_3 =
\,= 36 + 36 + 36 - 6 - 6 - 6 + 1 = 91.

Als een experiment bestaat uit het uitvoeren van n deelexperimenten en het aantal mogelijke uitkomsten van elk deelexperiment is onafhankelijk van het resultaat van de overige deelexperimenten, dan vinden we het totale aantal mogelijke uitkomsten door de afzonderlijke aantallen met elkaar te vermenigvuldigen. We moeten vermenigvuldigen als de verschillende mogelijkheden tegelijkertijd moeten voorkomen, dus de een en de ander.

Het kan echter ook zijn dat we iedere mogelijkheid van het ene experiment weliswaar niet kunnen combineren met alle mogelijkheden van een ander, maar wel met een gelijk aantal mogelijkheden van het andere experiment. Ook dan krijgen we het totale aantal mogelijkheden door vermenigvuldiging. De produktregel zegt hierover:

Stelling 2.2.3 (produktregel)
Als ieder van de n1 uitkomsten van een eerste experiment gecombineerd kan worden met een gelijk aantal uitkomsten n2 van een tweede experiment en elk van deze combinaties weer met een gelijk aantal uitkomsten n3 van een derde, etc., dan wordt het totale aantal uitkomsten gegeven door het produkt n1× n2× n3×... van deze aantallen.

Een toepassing van de produktregel is:

Stelling 2.2.4
Voor het Cartesisch produkt van de verzamelingen A1,A2,...,An geldt dus volgens de produktregel: #(A1× A2×...× An) = #A1× #A2× ... × #An.

Voorbeeld 3
Op een menukaart staan 3 voorgerechten, 5 hoofdgerechten en 4 nagerechten. Hoeveel menu's van 3 gangen kunnen we van de kaart samenstellen? De produktregel zegt dat er 3 × 5 ×4 = 60 menu's mogelijk zijn.

Voorbeeld 4
De 3 voorgerechten op de menukaart laten zich elk combineren met 4 van de 5 hoofdgerechten en elk van deze combinaties met slechts 2 van de 4 nagerechten. Volgens de produktregel zijn er dan nog 3×4×2 = 24 menu's van 3 gangen mogelijk.

De produktregel maakt het mogelijk te bepalen hoeveel verschillende rangschikkingen er mogelijk zijn van een aantal onderscheidbare objecten. Een rangschikking heet permutatie en het aantal permutaties van n dingen blijkt volgens de produktregel gelijk te zijn aan n! (n faculteit, het produkt van de getallen 1 tot en met n).

Definitie 2.2.1
Onder een permutatie van n onderscheidbare objecten verstaan we een rangschikking op volgorde van die objecten.

Voorbeeld 5
De permutaties van de cijfers 1, 2 en 3 zijn: 123, 132, 213, 231, 312 en 321.

Stelling 2.2.5
Het aantal permutaties van n onderscheidbare objecten is gelijk aan n!.

Voorbeeld 5 (vervolg)
Inderdaad bleken er 3! = 6 permutaties te zijn van de drie getallen 1, 2 en 3.

We beschouwen nu het volgende - klassieke en karakteristieke - combinatorische probleem: hoeveel verschillende resultaten zijn er mogelijk als we uit een verzameling van n onderscheidbare elementen er k kiezen? Het antwoord zal afhangen van de wijze waarop we de trekkingen verrichten, nl. met of zonder terugleggen, en van de manier waarop we tegen de resultaten aankijken, nl. geordend of ongeordend. In figuur 2.1 is dit schematisch in beeld gebracht. De volgende voorbeelden illustreren de diverse mogelijkheden.

Voorbeeld 6
Uit de 100 leden van de vereniging COMBI moet een bestuur van 3 leden gekozen worden. Het bestuur bestaat uit voorzitter, secretaris en penningmeester. Twee functies kunnen niet in één persoon verenigd zijn. We moeten dus trekkingen zonder terugleggen verrichten en het resultaat moet geordend zijn. Hoeveel besturen zijn er mogelijk? Dat zijn er 100×99×98 = 100!/(100-3)!; we kunnen het bestuur samenstellen door eerst de voorzitter te kiezen, hiervoor zijn 100 mogelijkheden, daarna de secretaris, waarvoor nog 99 mogelijkheden zijn en tenslotte de penningmeester, met nog 98 mogelijkheden. We kunnen een mogelijkheid beschrijven door de namen van de bestuursleden in volgorde van de functies te vermelden; zo'n mogelijkheid heet variatie.

Voorbeeld 7
Voor het komende lustrum kiest COMBI een feestcommissie bestaande uit 3 leden. De leden van de feestcommissie hebben geen verschillende taak. We moeten trekken zonder terugleggen, maar het resultaat hoeft niet geordend te zijn. Net als in het vorige voorbeeld kunnen we op 100!/97! een geordend drietal kiezen; echter de ordening is nu niet van belang, zodat de 3! rangschikkingen van elk zo'n drietal dezelfde commissie voorstelt. Er zijn dus 100!/(3!97!) = ( 3 ) mogelijkheden. We kunnen een mogelijkheid beschrijven door de namen van de drie leden te vermelden; de volgorde van de namen is niet van belang. Een mogelijkheid heet combinatie (of greep).

Voorbeeld 8
Bij COMBI moeten 3 verschillende klussen gedaan worden. Het bestuur vraagt de leden om vrijwilligers. Omdat een lid best meer dan één klus kan doen, moeten we nu trekken met terugleggen; wel moet het resultaat geordend zijn aangezien de klussen verschillen. We kiezen nu achtereen- volgens steeds een lid uit de 100 voor elk der klussen; er zijn dus 100×100×100 = 1003 mogelijkheden. We kunnen een mogelijkheid beschrijven door bij elke klus de naam te vermelden van degene die de klus uitvoert; de vermelde namen hoeven nu niet verschillend te zijn. Een mogelijkheid heet hier herhalingsvariatie.

Voorbeeld 9
Voor het lustrum bij COMBI moeten 3 biertonnen opgeschilderd worden. De feestcommissie vraagt de leden om vrijwilligers. Nu zijn de klussen niet van elkaar te onderscheiden, zodat het resultaat niet geordend hoeft te zijn; we moeten wel weer trekken met terugleggen. We beschrijven het resultaat op eenduidige wijze door voor elk van de 100 leden te vermelden hoeveel biertonnen hij zal opschilderen. We kunnen dit schematisch doen door de biertonnen voor te stellen door een o en de biertonnen voor de opgestelde leden neer te zetten; tussen de leden zetten we een streep |. Een mogelijkheid is dan bv.

                      1 2  3  4   5         100
                       | | o | | o o | ... | 

hetgeen wil zeggen dat lid 1 geen bierton opschildert, evenals lid 2; nr 3 schildert één ton op, nr 4 weer geen, nr 5 schildert 2 tonnen op en de overigen geen. Elke mogelijkheid bestaat dus uit een rijtje van 3 nullen (de tonnen) en 99 enen (de scheidingsstrepen); er zijn

{100-1+3 \choose 3} = {102 \choose 3}

van zulke rijtjes. Hier heet een mogelijke uitkomst herhalingscombinatie.

De bovenstaande voorbeelden beschrijven we wel mbv. een vaasmodel. We trokken drie keer uit een vaas met 100 genummerde balletjes, de ene keer met terugleggen, de andere keer zonder terugleggen. In twee gevallen beschouwden we geordende drietallen als uitkomsten, in twee andere gevallen ongeordende. In de volgende figuur is een en ander schematisch weergegeven.


              trekken met of zonder terugleggen 
          ┌─────────────────────────┬─────────────┐
          │                         │  resultaat  │            
                                  1 2 3
     │ o o o o │                 ┌─┬─┬─┐        │ o │
     │o o o o o│                 │o│o│o│        │o o│
     └─────────┘                 └─┴─┴─┘        └───┘                
  vaas met knikkers             geordend     ongeordend     
      populatie                       steekproef

Figuur 2.1. Trekkingen uit een vaas.

In de voorbeelden kwamen de volgende begrippen en resultaten aan de orde.

Definitie 2.2.2
Onder een variatie van k uit n (onderscheidbare objecten) verstaan we de uitkomst van een geordende trekking zonder terugleggen van k van de n objecten.

Stelling 2.2.6
Het aantal variaties van k uit n is gelijk aan n!/(n-k)!.

Definitie 2.2.3
Onder een combinatie (of greep) van k uit n onderscheidbare objecten verstaan we de uitkomst van een ongeordende trekking zonder terugleggen van k van de n objecten.

Stelling 2.2.7
Het aantal combinaties van k uit n is gelijk aan:

{n \choose k} = \frac{n!}{k!(n-k)!}.

Definitie 2.2.4
Onder een herhalingsvariatie van k uit n onderscheidbare objecten verstaan we de uitkomst van een geordende trekking met terugleggen van k van de n objecten.

Stelling 2.2.8
Het aantal herhalingsvariaties van k uit n is gelijk aan nk.

Definitie 2.2.5
Onder een herhalingscombinatie van k uit n onderscheidbare objecten verstaan we de uitkomst van een ongeordende trekking met terugleggen van k van de n objecten.

Stelling 2.2.9
Het aantal herhalingscombinaties van k uit n is gelijk aan:

{n-1+k \choose k}.

In het volgende schema geven we een overzicht van het trekken van k elementen uit een verzameling (vaas) van n onderscheidbare elementen (knikkers).

          ┌───────────┬───────────────────────────┐
          │           │          trekking         │
          │           ├─────────────┬─────────────┤
          │           │   zonder    │     met     │        
          │ resultaat │ terugleggen │ terugleggen │ 
          ├───────────┼─────────────┼─────────────┤ 
          │ geordend  │  variatie   │ herhalings- │
          │           │             │   variatie  │
          ├───────────┼─────────────┼─────────────┤             
          │ongeordend │ combinatie  │ herhalings- │                         
          │           │             │ combinatie  │
          └───────────┴─────────────┴─────────────┘                 

In het volgende voorbeeld hebben we het geval n=4 en k=3 helemaal uitgeschreven.

Voorbeeld 10

┌───┐┌───┐┌───┐┌───┐                                         ┐
│123││124││134││234│                                         │     64
│132││142││143││243│     24 variaties  (rijtjes)             │herhalings─
│213││214││314││324│                                         │ variaties                  
│231││241││341││342│                                         │  (rijtjes) 
│312││412││413││423│      4 combinaties (hokjes)             │
│321││421││431││432│                                         │
└───┘└───┘└───┘└───┘                                         │
┌───┐┌───┐┌───┐┌───┐┌───┐┌───┐┌───┐┌───┐┌───┐┌───┐┌───┐┌───┐ │    20
│112││113││114││221││223││224││331││332││334││441││442││443│ │herhalings─
│121││131││141││212││232││242││313││323││343││414││424││434│ │combinaties
│211││311││411││122││322││422││133││233││433││144││244││344│ │ (hokjes)
└───┘└───┘└───┘└───┘└───┘└───┘└───┘└───┘└───┘└───┘└───┘└───┘ │
┌───┐┌───┐┌───┐┌───┐                                         │
│111││222││333││444│                                         ┘
└───┘└───┘└───┘└───┘   


In het vaasmodel denken we ons de trekkingen altijd aselect, dwz. bij iedere trekking hebben de resterende knikkers alle gelijke kans om getrokken te worden. We realiseren aselecte trekkingen door de vaas goed te schudden en er willekeurig (blindelings, lukraak) een knikker uit te trekken.

Definitie 2.2.6
Onder een aselecte trekking uit een populatie verstaan we een symmetrisch experiment met die populatie als uitkomstenruimte.

Aselecte trekkingen leiden in de gevallen van variaties, combinaties en herhalingsvariaties tot symmetrische kansruimten. We zullen pas in een volgend hoofdstuk, na de invoering van het begr. voorwaardelijke kans, het waarom hiervan goed kunnen inzien. Voorlopig, en dat ligt ook in de lijn van dit hoofdstuk, zullen we ons moeten beroepen op de symmetrie van de situatie. In het geval van herhalingscombinaties ontstaat geen symmetrie ondanks aselect trekken!

Stelling 2.2.10
Als we k keer aselect trekken uit een verzameling van n verschillende elementen, dan is de kansruimte in de volgende gevallen symmetrisch:

(a) trekken zonder terugleggen, geordende uitkomsten:
S={variaties}, \# S=\frac{n!}{(n-k)!};
(b) trekken zonder terugleggen, ongeordende uitkomsten:
S={combinaties}, \# S={n \choose k} = \frac{n!}{k!(n-k)!};
(c) trekken met terugleggen, geordende uitkomsten:
S={herhalingsvariaties}, \# S=n^k;

De ontstane kansruimte is niet symmetrisch in geval:

(d) trekken met terugleggen, ongeordende uitkomsten.

Bewijs: De gevallen a, b en c volgen op grond van de symmetrie in de uitkomsten. In het geval d vatten we de uitkomsten op als gebeurtenissen in de kansruimte van de herhalingsvariaties. De uitkomst (k,0,...,0), dus k keer is object nummer 1 getrokken, komt dan overeen met de gebeurtenis {(1,1,...,1)} bij de herhalingsvariaties en heeft dus een kans 1/nk. De uitkomst (k-1,1,0,...,0), dus k-1 keer is object nummer 1 en 1 keer nummer2 getrokken, komt overeen met de gebeurtenis {(1,1,...,1,2),(1,1,...,1,2,1),...,(2,1,...,1)} en bevat k elementen, nl. alle herhalingsvariaties met k-1 keer een 1 en 1 keer een 2; de kans hierop is k/nk.

We geven nu enkele toepassingen.

Voorbeeld 11
We trekken lukraak achtereenvolgens (dus geordend resultaat0 zonder terugleggen k knikkers uit een vaas met n genummerde knikkers. Wat is de kans dat de eerste getrokken knikker nummer i is? De uitkomsten zijn variaties en de kansruimte is symmetrisch; #S = n!/(n-k)!. De gebeurtenis dat de eerste knikker nummer i heeft, noemen we A; A bevat alle variaties met op de 1e plaats nummer i. De uitkomsten uit A kunnen we krijgen door als eerste knikker nummer i te pakken en vervolgens nog k-1 andere, dus nog een variatie van k-1 uit n-1. A bevat dus (n-1)!/(n-k)! uitkomsten. De gevraagde kans is: P(A) = #A/#S = 1/n, hetgeen ons niet zal verbazen.

Hoe groot is de kans dat de tweede getrokken knikker nummer i is? Op dezelfde manier beredeneren we dat deze gebeurtenis, zeg B, de variaties bevat met op de tweede plaats nummer i. Dat zijn er evenveel als in A; zet nummer i alvast op de tweede plaats en vul de overige plaatsen met een variatie van k-1 uit n-1. We vinden dus P(B) = P(A) = 1/n.

Op analoge wijze vinden we dat de kans dat de knikker die als je getrokken wordt, nummer i is, steeds 1/n is.

De kans dat nummer i getrokken wordt, is P("nummer i") = P("nummer i als 1e" of "als 2e" of ... of "als ke") = = P("als 1e") + P("als 2e") + ... + P("als ke") = k/n.

Voorbeeld 12
We trekken lukraak zonder op de volgorde te letten en zonder terugleggen k knikkers uit een vaas met n genummerde knikkers. De uitkomsten zijn combinaties en de kansruimte is symmetrisch;

\# S = {n \choose k}.
P("nummer i wordt getrokken") = \frac{{n-1 \choose k-1 }}{{n \choose k}} = \frac kn,

want de bedoelde gebeurtenis bevat de combinaties waar nummer i bij is. We krijgen die combinaties door nummer i alvast te pakken en aan te vullen met een combinatie van k-1 uit de overige n-1. Merk op dat deze kans dezelfde is als bij het vorige voorbeeld.

Voorbeeld 13
We trekken lukraak uit een goed geschud kaartspel een tiental kaarten. Er is dus sprake van ongeordende uitkomst en trekken zonder terugleggen. De kansruimte is symmetrisch. Wat is de kans dat bij de getrokken tien kaarten 2 azen en 3 heren zijn? We geven de situatie schematisch weer:

                azen     heren      rest      totaal
populatie:  ├─── 4 ───┼─── 4 ───┼─── 44 ───┤    52
 
steekproef: ├─── 2 ───┼─── 3 ───┼───  5 ───┤     10

In totaal zijn er {52 \choose 10} mogelijke uitkomsten (combinaties); de genoemde gebeurtenis kan op {4 \choose 2}{4 \choose 3}{44 \choose 5} manieren gerealiseerd worden, dus de gevraagde kans is:

\frac{{4 \choose 2}{4 \choose 3}{44 \choose 5}}{{52 \choose 10}} = 0,0016.

Voorbeeld 14 (sinterklaaslootjes; enveloppe-probleem)
Met sinterklaas stoppen n mensen een briefje met hun naam in een hoge hoed. Na goed schudden trekt elk er lukraak weer een lootje uit. Hoe groot is de kans pn dat niemand z'n eigen naam trekt? (Als enveloppe-probleem: een secretaresse stopt n brieven lukraak in de reeds geadresseerde enveloppen.) Noem Ai de gebeurtenis dat nummer i z'n eigen naam trekt; dan is de gevraagde kans:

p_n = P(\overline{A_1\cup A_2\cup...\cup A_n}) = 1 - P(A_1\cup A_2\cup...\cup A_n) =
= 1 - \{ \sum P(A_i) - \sum P(A_iA_j) + \sum P(A_iA_jA_k) - .... \pm  P(A_1A_2...A_n)\} =
=  1 - {n \choose 1}n + {n \choose 2}n(n-1) - {n \choose 3}n(n-1)(n-2) + ... \pm  {n \choose n}n! =
=1 - \{1! - 2! + ... \pm n!\} \approx \frac 1e = 0,368.

De kans pn verandert vanaf n = 6 à 7 niet veel meer; 1/e is dan al een goede benadering.

In tabel:

          n   │  1    2    3    4    5    6    7   
       ───────┼────────────────────────────────────
         pn   │  0  .500 .333 .375 .367 .365 .365  


Het geval van het ongeordend trekken zonder terugleggen van k knikkers uit een vaas met n knikkers, kunnen we ook beschrijven als het verdelen van de n knikkers uit de vaas in twee groepen ter grootte van k en n-k, nl. de wel getrokken k en de niet getrokken n-k. We generaliseren dit experiment door de knikkers te verdelen in m groepen met aantallen n1,n2,...,nm, waarvoor dus geldt: n1+ n2+...+ nm= n. We doen dit door de knikkers te rangschikken, hetgeen kan op n! manieren, en de eerste n1 aan groep 1 toe te wijzen, de volgende n2 aan groep 2, etc. Omdat de volgorde van de n1 knikkers in groep 1 er niet toe doet (er zijn n1! rangschikkingen) en evenzo niet voor de andere groepen, is het totaal aantal verdelingen over de m groepen, de zgn. multinomiaalcoëfficiënt.


Definitie 2.2.7
Onder de multinomiaalcoëfficiënt {n \choose n_1,n_2,...,n_m} verstaan we het aantal manieren om n onderscheidbare objecten te verdelen in m groepen met aantallen n1,n2,...,nm, waarvoor n1+ n2+...+ nm= n.

Stelling 2.2.11
Voor de multinomiaalcoëfficiënt geldt:

{n \choose n_1,n_2,...,n_m}=\frac{n!}{n_1!n_2! \cdots n_m!}

De tweede schrijfwijze van de multinomiaalcoëfficiënt in deze stelling laat zien dat we de stelling ook kunnen bewijzen door de verschillende groepen achtereenvolgens te vullen met het juiste aantal knikkers.

Voorbeeld 15
Op hoeveel manieren kunnen we 30 personen verdelen over 4 groepen van resp. 6, 7, 8 en 9 personen? Dit kan op

{30 \choose 6,7,8,9}=\frac{30!}{6!7!8!9!}={30 \choose 6}{24 \choose 7}{17 \choose 8}{9 \choose9}

manieren. De laatste schrijfwijze laat zien hoe de 4 groepen achtereenvolgens gevuld worden. We kunnen daarvoor ook schrijven:

{30 \choose 24}{24 \choose 17}{17 \choose 9}{9 \choose 0}

daarmee suggererend dat we de gewenste verdeling tot stand brengen door steeds de overblijvende personen weg te nemen.

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

Discrete Kansrekening/Voorwaardelijke kans en onafhankelijkheid/Voorwaardelijke kan

[bewerk] 3.2 Onafhankelijke gebeurtenissen

Als ik willekeurig een Nederlander aanwijs, zal het voor de kans dat ik iemand uit Friesland aanwijs, geen verschil maken of ik weet dat ik een vrouw zal aanwijzen. anders wordt het als ik weet dat degene die ik aanwijs, blond haar heeft. Er zijn immers relatief meer blonde Friezen dan blonde Nederlanders. Als het optreden van een gebeurtenis B geen invloed uitoefent op de kans van optreden van een andere gebeurtenis A, dus als P(A|B) = P(A), zeggen we dat A onafhankelijk is van B. Omgekeerd geldt dan ook dat het optreden van A geen invloed heeft op de kans van optreden van B, want uit P(A|B) = P(A) volgt dat ook P(B|A) = P(AB)/P(A) = P(A|B)P(B)/P(A) = P(B).

Dus als A onafhankelijk is van B, is ook B onafhankelijk van A. We zeggen daarom dat A en B (onderling) onafhankelijk zijn. Daarbij laten we vaak de toevoeging "onderling" weg, hoewel dat strikt genomen niet juist is. Omdat beide relaties P(A|B) = P(A) en P(B|A) = P(B) ook equivalent zijn met de relatie P(AB) = P(A)P(B), gebruiken we deze laatste voor de definitie.

Definitie 3.2.1
De gebeurtenissen A en B heten (onderling) onafhankelijk (afgekort o.o.) als P(AB) = P(A)P(B).

Opmerking 1
Het begrip onafhankelijk wordt nog al eens verward met het begrip disjunct. Twee disjuncte gebeurtenissen A en B, dus met AB = ∅, kunnen echter alleen dan onderling onafhankelijk zijn, als een van beide kans 0 heeft, immers dan is P(A)P(B) = 0 = P(∅) = P(AB).

Voorbeeld 1
Uit een spel van 52 speelkaarten trekken we lukraak één kaart. H is de gebeurtenis dat de getrokken kaart een hartenkaart is en B is de gebeurtenis dat de getrokken kaart een boer is. Dan geldt P(H) = 13/52 = 1/4 en P(B) = 4/52 = 1/13. Omdat HB de gebeurtenis is dat we de hartenboer trekken, is P(HB) = 1/52 = P(H).P(B). De gebeurtenissen H en B zijn dus onderling onafhankelijk.

In het voorbeeld kunnen we de onafhankelijkheid van twee gebeurtenissen aantonen. Vaak echter kennen we de kansen niet en besluiten we op andere gronden tot onderlinge onafhankelijkheid van twee gebeurtenissen. Als gevolg kunnen we dan de kans op het gelijktijdig optreden van beide gebeurtenissen berekenen als het produkt van de kansen op elk afzonderlijk.

Voorbeeld 2
Een apparaat bestaat uit twee componenten. A1 is de gebeurtenis dat de ene component werkt en A2 de gebeurtenis dat de tweede werkt. Het apparaat werkt slechts als beide componenten werken en we hebben goede redenen om aan te nemen dat het werken van de ene component geen invloed heeft op het werken van de andere, dwz. dat A1 en A2 o.o. zijn. Onder deze modelveronderstelling geldt voor de kans dat het apparaat werkt: P(A1A2) = P(A1).P(A2).

Voorbeeld 3 (twee worpen met een dobbelsteen; vervolg)
We werpen tweemaal achtereen een dobbelsteen. Zij A de gebeurtenis dat we de eerste keer een 5 werpen en B de gebeurtenis dat we de tweede keer een 3 of meer werpen. Als we uitgaan van een zuivere dobbelsteen, is P(A) = 1/6 en P(B) = 2/3. Gaan we ervan uit dat A en B onafhankelijk zijn, hetgeen aannemelijk lijkt omdat A betrekking heeft op de eerste worp en B op de tweede, dan volgt: P(AB) = P(A)P(B) = 1/6 × 2/3 = 1/9.

Merk op dat we in het bovenstaande twee veronderstellingen maakten tav. ons kansmodel, namelijk dat de dobbelsteen zuiver is en dat gebeurtenissen die alleen betrekking hebben op de tweede worp, onafhankelijk zijn van gebeurtenissen die alleen betrekking hebben op de eerste worp. Deze veronderstellingen samen zijn equivalent met de veronderstelling dat we met een symmetrische kansruimte van doen hebben. Immers zij Ai de gebeurtenis dat we de eerste keer i ogen gooien en Bj de gebeurtenis dat we de tweede keer j ogen gooien, dan geldt op grond van de zuiverheid van de dobbelsteen dat P(Ai) = P(Bj) = 1/6 en op grond van de onafhankelijkheid dat P(AiBj) = P(Ai).P(Bj) = 1/36. We hadden dus de kans op de gebeurtenis AB ook kunnen bepalen door de kansdefinitie van Laplace te gebruiken. De beschreven methode van berekening, die direct gebruik maakt van de onderlinge onafhankelijkheid van de beide gebeurtenissen, is echter veelal eenvoudiger.

Ook in het geval van meer dan twee gebeurtenissen willen we over onafhankelijkheid spreken. Er zijn dan verscheidene mogelijkheden.

Definitie 3.2.2
De gebeurtenissen A1,A2,... heten paarsgewijs onafhankelijk als elk tweetal onderling onafhankelijk is.

Paarsgewijze onafhankelijkheid sluit echter de mogelijkheid van een zekere afhankelijkheid tussen gebeurtenissen niet uit, zoals uit het volgende voorbeeld blijkt.

Voorbeeld 4
We werpen tweemaal achtereen een zuivere munt. De uitkomstenruimte is S = {KK,KM,MK,MM} en elk van deze uitkomsten heeft kans 4. Zij A de gebeurtenis "de eerste keer kruis", B de gebeurtenis "de tweede keer kruis" en C de gebeurtenis "beide keren hetzelfde", dus A = {KK,KM}, B = {KK,MK} en C = {KK,MM}. A, B en C zijn paarsgewijs onafhankelijk, immers P(AB) = 1/4 = P(A)P(B), P(AC) = 1/4 = P(A)P(C) en P(BC) = 1/4 = P(B)P(C). Echter P(C|AB) = 1 ≠ P(C), dus de gebeurtenis AB = {KK} (dwz. A en B samen) geeft "informatie" over C.

Om elke vorm van afhankelijkheid tussen de gebeurtenissen A, B en C uit te sluiten, zullen we dus meer moeten eisen dan paarsgewijze onafhankelijkheid. Er zal bv. ook moeten gelden dat P(A|BC) = P(A), dus dat P(ABC) = P(A)P(B)P(C). Deze laatste eis echter blijkt op zich weer niet voldoende om paarsgewijze onafhankelijkheid af te dwingen.

Voorbeeld 5 (twee worpen met een dobbelsteen; vervolg)
We werpen tweemaal een zuivere dobbelsteen. Zij A de gebeurtenis dat de eerste worp 1, 2 of 3 ogen en B de gebeurtenis dat de eerste worp 3, 4 of 5 ogen oplevert. C is de gebeurtenis dat de som van het aantal ogen 9 is, dus C = {(3,6),(4,5),(5,4),(6,3)}. P(A) = P(B) = 1/2 en P(C) = 1/9. De doorsnede ABC = {(3,6)}, dus P(ABC) = 1/36 = 1/2×1/2×1/9 = P(A)P(B)P(C), terwijl P(AB) = 1/6 ≠ 1/2 × 1/2 = P(A)P(B) P(BC) = 1/36 ≠ 1/2 × 1/9 = P(B)P(C) en P(AC) = 1/36 ≠ 1/2 × 1/9 = P(A)P(C). A, B en C zijn dus niet paarsgewijs onafhankelijk.

We noemen A, B en C daarom pas onderling onafhankelijk als voor elk tweetal én voor het drietal de kans op de doorsnede te schrijven is als het produkt van de afzonderlijke kansen. Voor een eindige of aftelbaar oneindige rij gebeurtenissen A1,A2,A3,... zullen we deze eis moeten opleggen aan elk tweetal, drietal, viertal, etc.

Definitie 3.2.3
De gebeurtenissen A1,A2,... heten (onderling) onafhankelijk (afgekort o.o.), als voor elke eindige deelrij A_{i_1},A_{i_2},...,A_{i_k} (k \ge 2), geldt:

P(A_{i_1},A_{i_2}...A_{i_k}) = P(A_{i_1})P(A_{i_2})...P(A_{i_k}) .

Als twee gebeurtenissen A en B o.o. zijn, dan zijn ook Ac en B o.o., A en Bc en ook Ac en Bc. Soortgelijke eigenschappen kan men ook voor meer dan twee gebeurtenissen bewijzen. Als A, B, C en D o.o. zijn, dan zijn "disjuncte combinaties" zoals bv. AB en C∪D ook o.o., immers P(AB(C∪D)) = P(ABC ∪ ABD) = P(ABC) + P(ABD) - P(ABCD) = P(A)P(B)P(C) + P(A)P(B)P(D) - P(A)P(B)P(C)P(D) = P(A)P(B){[P(C) + P(D) - P(CD)} = P(AB)P(C∪D). Ook andere disjuncte combinaties, zoals AB∪C en D zijn dan o.o.

Stelling 3.2.1
Als A1,A2,... onderling onafhankelijk zijn, dan zijn ook disjuncte combinaties van deze gebeurtenissen o.o.

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 3.3 Samengestelde experimenten

Vaak bestaat een kansexperiment uit een opeenvolging van een reeks deelexperimenten, zoals bv. bij het herhaald uitvoeren van een bepaald (deel)experiment. We zullen dan de kansstructuur (dwz. de kansruimte) van elk van de deelexperimenten kennen en daaruit de kansstructuur van het totale experiment afleiden.

Voorbeeld 1
We gooien drie keer een zuivere munt. Elke worp afzonderlijk kunnen we beschrijven door een copie van de symmetrische kansruimte (S0,p0), met S0 = {K,M} en p0(K) = p0(M) = 1/2. Het totale experiment zal als uitkomstenruimte hebben: S = {KKK,KKM,KMK,MKK,KMM,MKM,MMK,MMM} en als de experimenten onafhankelijk zijn, zal het totale experiment ook symmetrisch zijn, dus p(s) = 1/8, voor alle s ∈ S. Het totale experiment is samengesteld uit drie onafhankelijke deelexperimenten (S1,p1), (S2,p2) en (S3,p3), met Si= S0 en pi= p0. Er geldt: S = S1 × S2 × S3 en p(s1,s2,s3) = p1(s1).p2(s2).p3(s3). In deze laatste relatie zien we de onafhankelijkheid van de experimenten weerspiegeld.

Wat we in het voorbeeld zien geeft ons aanleiding tot de volgende definitie.

Definitie 3.3.1
Laat voor i = 1,2,...,n de kansruimten (Si,pi) gegeven zijn. Zij S = S1× S2×....× Sn en p(s1,s2,...,sn) = p1(s1).p2(s2)...pn(sn), dan noemen we (S,p) de produktruimte van de kansruimten {(Si,pi)}.

Gemakkelijk kunnen we zien dat de produktruimte weer een kansruimte is.

Stelling 3.3.1
De produktruimte (S,p) van de kansruimten {(Si,pi)|i=1,2,...,n} is een kansruimte.

We zullen een experiment dat bestaat uit de successievelijke uitvoering van onafhankelijke deelexperimenten (dwz. deelexperimenten die elkaar niet beïnvloeden), beschrijven door de produktruimte van de kansruimten van de deelexperimenten.

Definitie 3.3.2
Laat voor i = 1,2,...,n het experiment Ei beschreven worden door de kansruimte (Si,pi). We zeggen dat het experiment E samengesteld is uit de onafhankelijke deelexperimenten E1,E2,...,En, als de kansruimte (S,p) van E de produktruimte is van (S1,p1), (S2,p2), ..., (Sn,pn).

We zullen nu aantonen dat in de produkruimte de deelexperimenten inderdaad "onafhankelijk" van elkaar zijn, in die zin dat gebeurtenissen die alleen op de afzonderlijke deelexperimenten betrekking hebben o.o. zijn. Daarbij doet zich nog een formele moeilijkheid voor die we aan de hand van een voorbeeld verduidelijken.

Voorbeeld 1 (vervolg)
De gebeurtenis "de eerste worp leverde kruis op" geven we in het eerste experiment weer als de deelverzameling A = {K} van S1. In het samengestelde experiment wordt deze gebeurtenis voorgesteld door A* = {KKK,KKM,KMK,KMM}, die we ook kunnen we schrijven als: A* = {K} × {K,M} × {K,M} = A × S2× S3. De beide gebeurtenissen A en A*; zijn dus weliswaar formeel verschillende verzamelingen, maar stellen praktisch gezien dezelfde gebeurtenis voor.

Definitie 3.3.3
Laat voor i = 1,2,...,n de kansruimten (Si,pi) gegeven zijn. Bij de gebeurtenis A in (Si,pi) definiqren we de gebeurtenis A* in de produktruimte door: A* = S1× ... × Si-1 × A × Si+1 × ... × Sn.

We zullen praktisch geen onderscheid maken tussen de gebeurtenis A in een deelexperiment en de gebeurtenis A* in het experiment voorgesteld door de produktruimte. Zo zal in het samengestelde experiment de kans op A* gelijk zijn aan de kans op A in het deelexperiment.

Stelling 3.3.2
Laat voor i = 1,2,...,n de kansruimten (Si,pi) gegeven zijn. Zij A een gebeurtenis in (Si,pi), dan geldt in de produktruimte (S,p) P(A*) = Pi(A).

Bewijs:


P(A^*) = \sum_{s \in A^*} p(s) = \sum_{s \in A^*} p(s_1,...,s_n) = \sum_{s \in A^*} p_1(s_1)...p_n(s_n) =

 = \sum_{s_1 \in S_1} p_1(s_1)...\sum_{s_{i-1} \in S_{i-1}} p_{i-1}(s_{i-1}) \sum_{s_i \in A} p_i(s_i) \sum_{s_{i+1} \in S_{i+1}} p_{i+1}(s_{i+1})...\sum_{s_n \in S_n} p_n(s_n) =P_i(A)
.


We kunnen nu laten zien dat in een experiment dat is samengesteld uit onafhankelijke deelexperimenten, gebeurtenissen die alleen betrekking hebben op de afzonderlijke deelexperimenten onderling onafhankelijk zijn.

Stelling 3.3.3
Laat voor i = 1,2,...,n de kansruimten (Si,pi) met daarin een gebeurtenis Ai gegeven zijn. Dan zijn in de produktruimte de gebeurtenissen A1,...,An onderling onafhankelijk.

Bewijs: Voor een greep van k indices, waarvoor we voor het gemak 1,...,k nemen, geldt:


P(A_1^*\cap...\cap A_k^*) = P(A_1\times \cdots \times A_k \times S_{k+1}\times \cdots \times S_n) =

=\sum_{s \in \cdots} p(s_1,...,s_n) = \sum_{s \in \cdots} p_1(s_1)...p_n(s_n) =

= \sum_{s_1 \in A_1\cdots s_k\in A_k} p_1(s_1)...p_k(s_k) = P_1(A_1)\cdots P_k(A_k) = P(A_1^*)\cdots P(A_k^*)
.


We zullen als belangrijke toepassing het herhaald uitvoeren van een experiment met slechts twee mogelijke uitkomsten bekijken. We kunnen daarbij denken aan het werpen van een munt, of het trekken met terug- leggen uit een dichotome populatie (dwz. een populatie die in tweeqn is gedeeld, bv. mannen en vrouwen, geslaagd en niet-geslaagd, etc.).

Definitie 3.3.4
Onder een Bernoulli-experiment (of alternatief) verstaan we een experiment met slechts twee mogelijke uitkomsten. Die uitkomsten zullen we algemeen aanduiden als succes en mislukking (Jacob Bernoulli, nagelaten werk, 1713).

Herhalen we enkele keren hetzelfde Bernoulli-experiment, zo, dat de experimenten onafhankelijk zijn, dan spreken we van Bernoulli-pogingen.

Definitie 3.3.5
Onder Bernoulli-pogingen verstaan we onderling onafhankelijke herhalingen van een Bernoulli-experiment.

We zullen steeds het onderliggende Bernoulli-experiment beschrijven door de uitkomstenruimte S0= {0,1}, waarin 0 de uitkomst "mislukking" voorstelt en 1 de uitkomst "succes", en de kansfunctie p0, gegeven door de kans op succes p = p0(1) = 1 - p0(0).

We kunnen nu op twee manieren Bernoulli-pogingen uitvoeren:

(a) een vast aantal, zeg n, keren; we moeten dan maar afwachten hoeveel keer we succes hebben.

(b) net zolang doorgaan tot we succes hebben; we moeten dan maar afwachten hoeveel experimenten we moeten doen.

In het eerste geval wordt de kansruimte gegeven door de produktruimte S = {0,1}n, en p(s) = p∑s(1-p)n-∑ s. Een uitkomst beschrijven we dus door een rijtje 0'en en 1'en, en de kans op zo'n rijtje door het produkt van zoveel factoren p als het aantal 1'en en nog zoveel factoren (1-p) als het aantal 0'en. We noemen de gebeurtenis dat we in precies k van de deelexperimenten succes hebben, Bk; dus Bk= {s| ∑ si= k}. Alle uitkomsten die tot Bk behoren, hebben dezelfde kans pk(1-p)n-k en tot Bk behoren de uitkomsten die we krijgen door k van de n plaatsen aan te zijzen als succes. De kans op Bk wordt gegeven in de volgende stelling.

Stelling 3.3.4(binomiale formule)
De kans op precies k successen bij n Bernoulli-pogingen met succeskans p, wordt voor k = 0,1,...,n gegeven door

b_k= {n\choose k} p^k(1-p)^{n-k}.

In geval b herhalen we het Bernoulli-experiment net zolang tot we succes hebben. We kunnen dit experiment beschrijven door willekeurig veel Bernoulli-pogingen en de gebeurtenis Cn dat we n pogingen moeten doen om succes te vinden, beschrijven door alle rijtjes die beginnen met n-1 keer een 0 en gevolgd door een 1, dus Cn = {s|si= 0 voor i < n en sn = 1} Aangezien de deelexperimenten o.o. zijn geldt voor de kans op Cn:

Stelling 3.3.5 (geometrische formule)
. De kans gn dat bij Bernoulli-pogingen met succeskans p het eerste succes bij de n-e poging is, wordt voor n = 1,2,3,... gegeven door:

\, g_n= (1-p)^{n-1}p.

We kunnen ook experimenten tegenkomen die zijn samengesteld uit afhankelijke deelexperimenten. We zullen geen formele beschrijving geven van zo'n experiment in termen van de deelexperimenten. Hoe de kansruimte gekozen moet worden volgt van geval tot geval uit de beschrijving van het experiment.

We beschrijven ter vergelijking met Bernoulli-pogingen het trekken zonder terugleggen uit een dichotome populatie. We gebruiken het vaasmodel en nemen een vaas gevuld met M rode knikkers en N- M witte. We doen n trekkingen en duiden het trekken van een rode knikker aan als "succes". Een uitkomst kunnen we ook nu beschrijven door een rijtje 0'en en 1'en. Daarbij moeten we echter bedenken dat mogelijk niet elk rijtje kan voorkomen, aangezien er maximaal M 1'en en N-M 0'en ter beschikking zijn. We noemen de gebeurtenis dat we m keer succes hebben, dus dat we precies m rode knikkers trekken, Hm. We kunnen de kans op Hm berekenen: door te bedenken dat de m "successen" uit de M rode komen en de n-m "mislukkingen" uit de N-M witte. In totaal moeten we n trekkingen doen uit het totaal van N.

                 rode             witte              totaal
populatie   |----- M -----|------- N-M -------|         N

steekproef  |----- m -----|------- n-m -------|         n

Stelling 3.3.6 (hypergeometrische formule)
De kans hm op m successen bij n trekkingen zonder terugleggen uit een dichotome populatie van omvang N, waaronder M successen, wordt voor m = 0,1,...,n gegeven door:

h_m= \frac{{M \choose m}{N-M \choose n-m}}{{N \choose n}}.

Daarbij is de vanzelfsprekende veronderstelling gemaakt dat

{n \choose k} = 0, als k > n.
De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 4.1 Inleiding

Wat kunnen we zeggen van de leeftijd van een "willekeurige" Nederlander? Om deze vraag te beantwoorden beschouwen we de symmetrische kansruimte met S = {alle Nederlanders}. Iedere Nederlander heeft een zekere leeftijd, gemeten in gehele aantallen jaren, en als we volgens dit model lukraak één Nederlander kiezen en daarvan de leeftijd bepalen, hangt het getal dat we krijgen duidelijk van het toeval af. Immers wie er gekozen wordt hangt van het toeval af, dus ook de leeftijd die gemeten wordt. De grootheid leeftijd voegt aan iedere uitkomst s een reëel getal, zeg X(s), toe; we hebben dus te maken met een functie X op S, waarvan het argument, en daarmee ook de functiewaarde, door een kansmechanisme wordt aangewezen.

Definitie 4.1.1
Als S een discrete uitkomstenruimte is, noemen we een functie X:S -> \R een (discrete) stochastische variabele (in dit boek vaak afgekort tot s.v.).

Een stochastische variabele X voegt dus aan elke uitkomst s ∈ S een reëel getal X(s) toe. In de praktijk komt dat erop neer dat we bij een experiment door het toeval een uitkomst s verkrijgen en aan die uitkomst nog een kenmerk X(s) meten. Als s een willekeurig gekozen Nederlander is, kunnen we z'n leeftijd X, z'n gewicht G, het aantal kinderen K dat hij heeft, als stochastische variabelen opvatten. We zullen s.v.-en in het algemeen aangeven met hoofdletters veelal met X, Y en Z; soms ook met hoofdletters die een aanwijzing geven over de betekenis van de s.v., G voor gewicht, K voor kindertal ed. Veel experimenten kunnen we gemakkelijk beschrijven in termen van een of meer stochastische variabelen.

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)

We werpen twee keer een dobbelsteen; S = {(s1,s2)|s1, s2= 1,2,...,6}. Het totale aantal geworpen ogen Z is een stochastische variabele, gedefinieerd door Z(s1,s2) = s1 + s2. Ook het ogenaantal X bij de eerste worp is een s.v.: X(s1,s2) = s1.

De wijzigingen aan deze pagina van voor 15 april 2007 vallen alléén onder de GFDL, en niet onder de CC-BY-SA-licentie.
U kunt de inhoud van deze pagina dan ook alleen onder de voorwaarden van de GFDL (her)gebruiken.

Niet alle bijdragers van voor 15 april 2007 hebben hun werk vrijgegeven onder de dubbellicentie GFDL&CC-BY-SA. Kijk hier voor meer informatie.
Lijst van gebruikers die hun wijzigingen niet hebben vrijgegeven onder beide licenties

[bewerk] 4.2 Kansverdeling

In het algemeen zijn we niet zozeer in de s.v. zelf (dwz. als functie) geïnteresseerd, als wel in de kansen op gebeurtenissen betreffende die s.v. Als X weer de leeftijd van een willekeurige Nederlander voorstelt, zijn we mogelijk geïnteresseerd in de kans dat de gekozen persoon 18 jaar of ouder is, dus in de kans op de gebeurtenis {s|X(s) ≥ 18}. We zullen deze gebeurtenis kort noteren als {X ≥ 18} en de kans erop als P(X ≥ 18). Op soortgelijke wijze voor andere gebeurtenissen: bv. P({s|45 < X(s) < 65}) noteren we kort als P(45 < X < 65).

Definitie 4.2.1
Als X een s.v. is en B een verzameling reële getallen