Discrete Kansrekening/Verwachtingswaarde/Voorwaardelijke verwachtingswaarde

6.5 Voorwaardelijke verwachtingswaarde

Als X en Y een simultane verdeling hebben, kunnen we, zoals we eerder zagen, spreken over de voorwaardelijke verdeling van X gegeven Y=y. Deze voorwaardelijke verdeling wordt gegeven door de kansfunctie p_X( · |Y=y). Voor iedere y is dit een gewone kansfunctie, zodat we op voor de hand liggende wijze de bijbehorende verwachting kunnen uitrekenen, en wel als:

\sum _{x\in S_{X}}x\cdot p_{X}(x|Y=y).

We noemen die verwachting de voorwaardelijke verwachting van X gegeven Y=y, en noteren dit als:

{\rm {E}}(X|Y=y).

Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
De voorwaardelijke verdeling van het totale ogenaantal Z gegeven dat het maximale ogenaantal M=3 staat in de volgende tabel.

$z$	2	3	4	5	6	7	8	9	10	11	12	totaal
$P(Z=z\|M=3)$	0	0	2/5	2/5	1/5	0	0	0	0	0	0	1
$zP(Z=z\|M=3)$	0	0	8/5	10/5	6/5	0	0	0	0	0	0	24/5

De verwachting van deze verdeling is berekend in de onderste rij:

{\rm {E}}(Z|M=3)=\sum _{z=2}^{12}z\cdot p_{Z}(z|M=3)={\tfrac {24}{5}}.

De voorwaardelijke verwachting van het totale ogenaantal Z als we weten dat het maximale ogenaantal M gelijk is aan 3, is dus 24/5. Als over het maximale ogenaantal niets bekend is, verwachten we als totale ogenaantal EZ = 7. Als het maximum van de ogenaantallen echter 3 is, dan kunnen we geen hoge ogen gegooid hebben en blijkt de verwachting van het totaal ook kleiner dan 7 te zijn.

Definitie 6.5.1
Laat de s.v.-en X en Y een simultane verdeling hebben en zij P(Y=y) > 0. Onder de voorwaardelijke verwachting(swaarde) van X gegeven Y=y verstaan we het getal

{\rm {E}}(X|Y=y)=\sum _{x\in S_{X}}x\cdot p_{X}(x|Y=y)

,

mits de som absoluut convergeert, dus mits

\sum _{x\in S_{X}}|x|\cdot p_{X}(x|Y=y)<\infty .

Voorbeeld 2
Stel voor zekere 0 < y < 1 is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y binomiaal verdeeld met parameters n en y. Dan is E(X|Y=y) = ny.

Voorbeeld 3
Stel voor zekere 0 < y < 1 is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y geometrisch verdeeld met parameter y. Dan is E(X|Y=y) = 1/y.

Voorbeeld 4
Stel voor zekere y ∈ $\mathbb {N}$ is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y binomiaal verdeeld met parameters y en p. Dan is E(X|Y=y) = yp.

Voorbeeld 5
Stel voor zekere y > 0 is P(Y=y) > 0 en is X voorwaardelijk gegeven Y=y Poisson-verdeeld met parameter y. Dan is E(X|Y=y) = y.

Het zal duidelijk zijn dat de voorwaardelijke verwachting van X gegeven Y=y afhankelijk is van y. In de voorbeelden 2 - 5 is dat ook duidelijk te zien. We berekenen deze afhankelijkheid ook eens in de situatie van voorbeeld 1.

Voorbeeld 6 (twee worpen met een dobbelsteen; vervolg)
In voorbeeld 1 berekenden we dat E(Z|M=3) = 24/5. Ook voor andere waarden van M kunnen we de voorwaardelijke verwachting van Z bepalen. In de volgende tabel staan de voorwaardelijke verdelingen van Z gegeven de waarden m van M en tevens de berekening van de voorwaardelijke verwachtingswaarden.

	$z$	2	3	4	5	6	7	8	9	10	11	12	totaal
$m$

1	$P(Z=z\|M=1)$	1	0	0	0	0	0	0	0	0	0	0	1
	$zP(Z=z\|M=1)$	2	0	0	0	0	0	0	0	0	0	0	2

2	$P(Z=z\|M=2)$	0	2/3	1/3	0	0	0	0	0	0	0	0	1
	$zP(Z=z\|M=2)$	0	2	4/3	0	0	0	0	0	0	0	0	10/3

3	$P(Z=z\|M=3)$	0	0	2/5	2/5	1/5	0	0	0	0	0	0	1
	$zP(Z=z\|M=3)$	0	0	8/5	10/5	6/5	0	0	0	0	0	0	24/5

4	$P(Z=z\|M=4)$	0	0	0	2/7	2/7	2/7	1/7	0	0	0	0	1
	$zP(Z=z\|M=4)$	0	0	0	10/7	12/7	14/7	8/7	0	0	0	0	44/7

5	$P(Z=z\|M=5)$	0	0	0	0	2/9	2/9	2/9	2/9	1/9	0	0	1
	$zP(Z=z\|M=5)$	0	0	0	0	12/9	14/9	16/9	18/9	10/9	0	0	70/9

6	$P(Z=z\|M=6)$	0	0	0	0	0	2/11	2/11	2/11	2/11	2/11	1/11	1
	$zP(Z=z\|M=6)$	0	0	0	0	0	14/11	16/11	18/11	20/11	22/11	12/11	102/11

Hieronder staat het resultaat van de berekening samengevat:

$m$	1	2	3	4	5	6
${\rm {E}}(Z\|M=m)$	2	10/3	24/5	44/7	70/9	102/11

De tabel laat zien hoe E(Z|M=m) afhangt van m. In formule zouden we kunnen schrijven:

{\rm {E}}(Z|M=m)={\frac {m(3m-1)}{2m-1}}

We zien dus dat E(X|Y=y) afhankelijk is van y. Omdat Y een s.v. is en de (waargenomen) waarde y van Y dus door het toeval bepaald is, zal ook de waarde E(X|Y=y) door het toeval bepaald zijn. Zo zullen we in voorbeeld 6 als bij de twee worpen het maximale ogenaantal 2 is, voor de voorwaardelijke verwachting van het totale ogenaantal de waarde 10/3 vinden; is daarentegen het maximale ogenaantal 25, dan vinden we voor het voorwaardelijk verwachte ogenaantal de waarde 70/9. De voorwaardelijke verwachting E(X|Y=y) is dus op te vatten als de waarde van een s.v. die van Y afhangt. We noemen die s.v. de voorwaardelijke verwachting van X gegeven Y. In het volgende schema zien we dit in beeld gebracht; daarin duiden we de functie die aan y de waarde E(X|Y=y) toevoegt, voor het gemak even aan door g, dus g(y) = E(X|Y=y).

S{\xrightarrow {\quad \quad \quad \quad g\circ Y\quad \quad \quad \quad }}\mathbb {R}

S{\xrightarrow {\quad Y\quad }}\mathbb {R} {\xrightarrow {\ \ g={\rm {E}}(X|Y=\,\cdot \,)\ }}\mathbb {R}

s\ \ \mapsto \ Y(s)\ \mapsto \ g(Y(s))={\rm {E}}(X|Y=Y(s))

y\quad \mapsto \ g(y)={\rm {E}}(X|Y=y)

De s.v. goY (meestal geschreven als g(Y)) is dus de bedoelde voorwaardelijke verwachting van X gegeven Y. Het is de s.v. die bij de uitkomst s, dus als Y de waarde Y(s) aanneemt, zelf de waarde E(X|Y=Y(s)) aanneemt.

Definitie 6.5.2
Laat de s.v.-en X en Y een simultane verdeling hebben en zij P(Y=y) > 0. Onder de voorwaardelijke verwachting van X gegeven Y verstaan we de stochastische variabele E(X|Y) gedefinieerd door E(X|Y)(s) = E(X|Y=Y(s)).

We kunnen nu in de voorbeelden 2 - 5 deze s.v. E(X|Y) bepalen.

Voorbeeld 7 (vervolg van voorbeeld 2)
Omdat E(X|Y=y) = ny, volgt E(X|Y) = nY.

Voorbeeld 8 (vervolg van voorbeeld 3)
Omdat E(X|Y=y) = 1/y, volgt E(X|Y) = 1/Y.

Voorbeeld 9 (vervolg van voorbeeld 4)
Omdat E(X|Y=y) = yp, volgt E(X|Y) = Yp.

Voorbeeld 10 (vervolg van voorbeeld 5)
Omdat E(X|Y=y) = y, volgt E(X|Y) = Y.

Voorbeeld 11 (vervolg van voorbeeld 6)
Ga na dat E(Z|M) = M(3M-1)/(2M-1).

We zien in de voorbeelden duidelijk hoe E(X|Y) een functie is van Y. De verdeling van E(X|Y) volgt dan ook uit de verdeling van Y op de gebruikelijke manier. Dwz.

\,P({\rm {E}}(X|Y)=z)=\sum _{\{y|{\rm {E}}(X|Y=y)=z\}}P(Y=y)

,

waarbij we dus sommeren over alle y die tot dezelfde waarde z = E(X|Y=y) leiden.

Voorbeeld 12 (vervolg van voorbeeld 7)
De kansverdeling van E(X|Y) wordt gegeven door: P(E(X|Y) = ny) = P(Y=y), voor y ∈ S_Y. Als we de kansverdeling van Y kennen, dan volgt ook die van E(X|Y).

Wat zal de verwachting E(E(X|Y)) van de voorwaardelijke verwachting E(X|Y) zijn? Die moet natuurlijk gelijk zijn aan EX. E(X|Y) is een functie van Y, dus we berekenen:

{\rm {E}}({\rm {E}}(X|Y))=\sum _{y}{\rm {E}}(X|Y=y)P(Y=y)=\sum _{x,y}x\cdot p_{X}(x|Y=y)P(Y=y)=

=\sum _{x,y}x\cdot p_{X}(x|Y=y)P(Y=y)=\sum _{x,y}x\cdot p_{X,Y}(x,y)={\rm {E}}X

,

Uit het bovenstaande blijkt tevens dat als EX bestaat, ook E(X|Y=y) bestaat (mits P(Y=y) > 0); immers voor elke y met P(Y=y) > 0 is:

\sum _{x}|x|\cdot p_{X}(x)=\sum _{x,y'}|x|\cdot p_{X}(x|Y=y')P(Y=y')\geq \sum _{x}|x|\cdot p_{X}(x|Y=y)P(Y=y).

De volgende stelling vat deze resultaten samen.

Stelling 6.5.1
Laat X en Y een simultane verdeling hebben en EX bestaan, dan geldt:

(a) E(X|Y=y) bestaat voor elke y met P(Y=y) > 0

(b) E(E(X|Y)) = EX.

Voorbeeld 13 (twee worpen met een dobbelsteen; vervolg)
In voorbeeld 6 berekenden we E(Z|M=m) als functie van M. Het resultaat staat, met de bijbehorende kansverdeling, in de volgende tabel; daarin is ook de verwachting van E(Z|M) uitgerekend.

$m$	1	2	3	4	5	6	totaal
$P(M=m)$	1/36	3/36	5/36	7/36	9/36	11/36	36/36
${\rm {E}}(Z\|M=m)$	2	10/3	24/5	44/7	70/9	102/11
${\rm {E}}(Z\|M=m)P(M=m)$	2/36	10/36	24/36	44/36	70/36	102/36	252/36 = 7

We zien dat inderdaad E(E(Z|M)) = 7 = EZ.

Voorbeeld 14 (vervolg van voorbeeld 9)
Stel Y is geometrisch verdeeld met parameter q, dan is: EX = E(E(X|Y)) = pEY = p/q.

Omdat de voorwaardelijke verwachting E(X|Y=y) eigenlijk een "gewone" verwachtingswaarde is, heeft hij onder andere de eigenschappen die in stelling 6.4.1 voor de verwachtingswaarde genoemd worden, dus:

Stelling 6.5.2
Laat X, Y en Z een simultane verdeling hebben. Indien P(Y=y) > 0 geldt:

(a) E(X + Z|Y=y) = E(X|Y=y) + E(Z|Y=y)

(b) E(aX + b|Y=y) = a E(X|Y=y) + b, voor alle a,b ∈ R

(c) als X en Y o.o. zijn, dan is E(X|Y=y) = EX.

Voor de voorwaardelijke verwachting geldt een analoge eigenschap als in stelling 6.4.1.c, waar bleek dat voor X₁ en X₂ o.o., EX₁X₂ = EX₁.EX₂. Als X en Y voorwaardelijk gegeven een gebeurtenis A onafhankelijk zijn, dan kunnen we ook de voorwaardelijke verwachting van het product van X en Y schrijven als het product van de voorwaardelijke verwachtingen, steeds gegeven A. Voor de gewone verwachting hoeft dit dan niet te gelden. De volgende voorbeelden verduidelijken we dit.

Voorbeeld 15
Laat X₁ en X₂ twee onafhankelijke alternatieven zijn, beide met succeskans p, dan is:

P(X_{1}X_{2}=0|X_{1}+X_{2}=1)=1

,

dus

{\rm {E}}(X_{1}X_{2}|X_{1}+X_{2}=1)=0

;

echter

P(X_{1}=0|X_{1}+X_{2}=1)={\tfrac {1}{2}}

,

zodat

{\rm {E}}(X_{1}|X_{1}+X_{2}=1)={\tfrac {1}{2}}.

Evenzo voor X₂, dus

{\rm {E}}(X_{1}X_{2}|X_{1}+X_{2}=1)=0\neq {\tfrac {1}{4}}={\rm {E}}(X_{1}|X_{1}+X_{2}=1){\rm {E}}(X_{2}|X_{1}+X_{2}=1).

Hoewel X₁ en X₂ o.o. zijn, zijn ze gegeven X₁+ X₂= 1 afhankelijk.

Voorbeeld 16
In een doos bevinden zich twee (oneerlijke) munten, genummerd 1 en 2, met kansen op "munt" resp. 1/3 en 2/3. We nemen lukraak een munt M uit de doos en werpen er twee keer mee. De worpen zijn van elkaar onafhankelijk. Met X₁ en X₂ geven we de uitkomst van resp. de eerste en tweede worp aan en wel zo dat X_i= 0 of 1 al naar gelang de uitkomst "kruis" dan wel "munt" is. Dan zijn, gegeven de munt, X₁ en X₂ onafhankelijk en is voor m = 1,2:

{\rm {E}}(X_{1}X_{2}|M=m)={\rm {E}}(X_{1}|M=m){\rm {E}}(X_{2}|M=m)={\tfrac {m^{2}}{9}}.

Echter

{\rm {E}}(X_{1}|M)={\rm {E}}(X_{2}|M)={\frac {M}{3}}

,

dus is

{\rm {E}}X_{1}={\rm {E}}X_{2}={\tfrac {1}{3}}{\rm {E}}M={\tfrac {1}{3}}({\tfrac {1}{2}}\times 1+{\tfrac {1}{2}}\times 2)={\tfrac {1}{2}}

en

{\rm {E}}X_{1}X_{2}={\tfrac {1}{2}}{\rm {E}}(X_{1}X_{2}|M=1)+{\tfrac {1}{2}}{\rm {E}}(X_{1}X_{2}|M=2)={\tfrac {1}{2}}({\tfrac {1}{9}}+{\tfrac {4}{9}})={\tfrac {5}{18}}

,

zodat blijkt dat

{\rm {E}}X_{1}X_{2}\neq {\rm {E}}X_{1}{\rm {E}}X_{2}

.

Dus X₁ en X₂ zijn afhankelijk, maar gegeven de munt M onafhankelijk.

We bespreken nu nog enkele voorbeelden waarin met voorwaardelijke verwachtingen gerekend wordt.

Voorbeeld 17
De doelman van FC DE TRAPPERS speelt na de training vaak nog wat met z'n zoontje buiten. Afhankelijk van de beschikbare tijd vuurt het knaapje enkele ballen, zeg N, af op z'n vader, die in het doel staat. We nemen aan dat N Poisson-verdeeld is met parameter μ. De doelman kan door de bank genomen een fractie p van de afgevuurde ballen tegenhouden. Het aantal gestopte ballen noemen we X. Dan is de voorwaardelijke verdeling van X gegeven N=n binomiaal met parameters n en p. Dan is dus:

\,P(X=x|N=n)={\tbinom {n}{x}}p^{x}(1-p)^{n-x}

,

voor x = 0,1,...,n, zodat E(X|N=n) = np en E(X|N) = Np, met verdeling

\,P({\rm {E}}(X|N)=np)=P(N=n)={\frac {\mu ^{n}}{n!}}e^{-\mu }

,

voor n = 0,1,...

We kunnen ook de (onvoorwaardelijke) verdeling van X bepalen:

\,P(X=x)=\sum _{n\geq 0}P(X=x|N=n)P(N=n)=\sum _{n=x}^{\infty }{\tbinom {n}{x}}p^{x}(1-p)^{n-x}{\frac {\mu ^{n}}{n!}}e^{-\mu }=

\,={\frac {\mu ^{x}}{x!}}p^{x}e^{-\mu }\sum _{n=x}^{\infty }(1-p)^{n-x}{\frac {\mu {n-x}}{(n-x)!}}={\frac {(\mu p)^{x}}{x!}}e^{-\mu p}

,

voor x = 0,1,2,...; dus X heeft een Poisson-verdeling met parameter μp. Daaruit volgt direct: EX = μp en inderdaad is ook E(E(X|N)) = ENp = μp.

Als de doelman thuiskomt en tegen z'n vrouw zegt dat hij 10 ballen die het zoontje afvuurde, gestopt heeft, dan zal z'n vrouw natuurlijk vragen hoeveel het zoontje er afgevuurd heeft. We berekenen daarom de voorwaardelijke verdeling van N gegeven X=x; volgens de regel van Bayes is dat:

\,P(N=n|X=x)={\frac {P(X=x|N=n)P(N=n)}{P(X=x)}}={\frac {{n \choose x}p^{x}(1-p)^{n-x}{\frac {\mu ^{n}}{n!}}e^{-\mu }}{{\frac {(\mu p)^{x}}{x!}}e^{-\mu p}}}=

,

\,{\frac {(\mu (1-p))^{n-x}}{(n-x)!}}(1-p)^{n-x}e^{-\mu (1-p)}

,

voor n = x,x+1,... We zien dat, gegeven het aantal gestopte ballen X=x, het aantal niet-gestopte ballen N-X (dat onder de voorwaarde X=x gelijk is aan N-x) een Poisson-verdeling heeft met parameter μ(1-p). Daaruit kunnen we weer afleiden: E(N|X=x) = E(N-x|X=x) + x = μ(1-p) + x zodat E(N|X) = X + μ(1-p) en EN = E(E(N|X)) = EX + μ(1-p) = μp + μ(1-p) = μ, hetgeen we overigens al wisten.

Voorbeeld 18
We maken een eenvoudig model om werkloosheidscijfers te behandelen. Daartoe beschouwen we de populatie S = {Nederlanders van 25 tot 65 jaar} (= uitkomstenruimte) en voeren we twee s.v.-en in, nl. N de provincie waar de betrokkene (= uitkomst) woont en X, die aangeeft of de betrokkene een volledige baan heeft (X=0), een deeltijdbaan (X = 1/2) of zonder werk is (X=1). Als kansmechanisme denken we ons een symmetrische kansruimte. Dan is:

P(N=n)={\frac {{\text{aantal uit de populatie dat in de provincie }}n{\text{ woont}}}{\text{totale aantal uit de populatie}}}

en

P(X=1|N=n)={\frac {{\text{aantal uit de populatie dat in }}n{\text{ woont en zonder werk is}}}{{\text{totale aantal uit de populatie dat in }}n{\text{ woont}}}}

$P(X=1/2|N=n)$ en $P(X=0|N=n)$ zijn op analoge wijze gedefinieerd.

Voor de provincie n kunnen we als werkloosheidscijfer $E(X|N=n)$ hanteren en voor Nederland als geheel $EX$ . Tussen de deelcijfers per provincie en het cijfer voor geheel Nederland bestaat de relatie

{\rm {E}}X={\rm {E}}({\rm {E}}(X|N))=\sum _{n}{\rm {E}}(X|N=n)P(N=n).

Het cijfer voor geheel Nederland krijgen we dus door de cijfers van de provincies gewogen te middelen, met als gewichten de relatieve aandelen van de provincies in de totale populatie.

Voorbeeld 19 (levensduur)
De s.v. L stelt de levensduur (d.i. de leeftijd bij sterven, gemeten in gehele jaren) van een mens (apparaat, onderdeel) voor. De levensduurverdeling is p_L, veelal gegeven door de overlevingskansen P(L ≥ k), voor k = 0,1,2,... De verwachte levensduur (voor een mens wel levensverwachting genoemd) is EL, die we kunnen berekenen als de som van de overlevingskansen (ga na):

{\rm {E}}L=\sum _{k}P(L\geq k).

(De levensverwachting is eigenlijk gelijk aan EL + 0,5, aangezien leeftijden gemeten worden als volbrachte gehele jaren; we zullen daar niet verder op ingaan.)

Hoe lang zal iemand die juist 65 jaar is geworden, nog leven? We moeten dan kijken naar de voorwaardelijke verdeling van L gegeven L ≥ 65. (Let op het verschil tussen leeftijd en levensduur.) Deze verdeling wordt gegeven door de voorwaardelijke overlevingskansen,

P(L\geq 65+k|L\geq 65)={\frac {P(L\geq 65+k)}{P(L\geq 65)}}

,

voor k = 1,2,... aangeduid als leeftijdsspecifieke overlevingskansen voor een 65-jarige. De voorwaardelijke levensverwachting gegeven dat men de leeftijd van 65 jaar heeft bereikt, aangeduid als de leeftijdsspecifieke levensverwachting voor een 65-jarige, is:

{\rm {E}}(L|L\geq 65)=\sum _{l=1}^{\infty }P(L\geq l|L\geq 65)=65+\sum _{k=1}^{\infty }P(L\geq 65+k|L\geq 65).

Ga zelf na hoe we de overlevingskansen in een bevolking kunnen schatten.

Aangezien E(X|Y) een functie is van Y, zal het voor een andere functie van Y, zeg h(Y), niet uitmaken of we E(h(Y)X|Y) bepalen, dan wel h(Y)·E(X|Y), immers gegeven een waarde van Y is h(Y) toch constant. We kunnen dit eenvoudig als volgt laten zien:

{\rm {E}}(h(Y)X|Y=y)=\sum _{y\in S_{Y}}h(y)\cdot x\cdot p_{X}(x|Y=y)=h(y)\sum _{y\in S_{Y}}x\cdot p_{X}(x|Y=y)=h(y)\cdot {\rm {E}}(X|Y=y).

Stelling 6.5.3
Laat X en Y s.v.-en zijn, gedefinieerd op dezelfde kansruimte en P(Y=y) > 0, dan geldt voor iedere s.v. h(Y) die een functie is van Y: E(h(Y)X|Y) = h(Y)·E(X|Y).

Voorbeeld 20
De s.v. Y is uniform verdeeld op de getallen 1/10, 2/10, ..., 10/10. Gegeven een waarde y van Y is de s.v. X geometrisch verdeeld met parameter y. Dan is

{\rm {E}}XY=\sum _{x,y}xy\cdot p_{X,Y}(x,y)=\sum _{k=1}^{10}\sum _{x=1}^{\infty }x{\tfrac {k}{10}}{\tfrac {1}{10}}(1-{\tfrac {k}{10}})^{x-1}{\tfrac {k}{10}}=\ldots =1.

Dit resultaat krijgen we eenvoudiger en sneller door toepassing van bovenstaande stelling:

{\rm {E}}XY={\rm {E}}{\rm {E}}(XY|Y)={\rm {E}}(Y\cdot {\rm {E}}(X|Y))={\rm {E}}(Y{\frac {1}{Y}})=1.

Deze pagina is vrijgegeven onder de GNU Free Documentation License (GFDL) en nog niet onder CC-BY-SA. Klik hier voor meer informatie.