Gebruiker:KKoolstra/Onderzoek/Steekproeftheorie
Kopie w:Steekproef:
Steekproef
[bewerken]Een steekproef of monster, een statistisch begrip, is een selectie uit een totale populatie ten behoeve van een meting van bepaalde eigenschappen van die populatie. In het spraakgebruik kan een monster ook 1 individu uit de populatie betekenen.
De term steekproef is afkomstig van de kaasmarkt, waar de keurmeester met een speciaal soort mes in de kaas stak om uit het midden van de kaas een stukje te keuren (proeven).
De keuze voor een meting met behulp van een steekproef in plaats van de totale populatie wordt bepaald door de volgende overwegingen:
- bij een populatie van grote omvang is het praktisch ondoenlijk alle elementen te meten
- als de metingen kostbaar zijn kan men slechts een beperkt aantal metingen doen
- bij destructief onderzoek zou de hele populatie verloren gaan
- als snelheid gewenst is, kan niet de hele populatie onderzocht worden
- als er geen al te grote nauwkeurigheid verlangd is, kan met een steekproef worden volstaan
- het is gemakkelijker slechts een deel van de populatie te onderzoeken.
Men kan op verschillende manieren een steekproef verkrijgen. Als alle elementen uit de populatie dezelfde kans hebben om in de steekproef te worden opgenomen, spreekt men van een aselecte steekproef. Men spreekt van een selecte steekproef wanneer de elementen niet op toevalsbasis uit een populatie worden genomen. Zorgt men ervoor dat de verhouding mannen en vrouwen in de steekproef voorkomen ongeveer gelijk is aan deze verhouding in de bevolking dan heet de steekproef representatief (althans wat het kenmerk geslacht betreft). De keuze bepaalt in grote mate de validiteit van verdere analyse.
Kopie w:Aselecte steekproef:
Aselecte steekproef
[bewerken]Onder een aselecte steekproef verstaat men in de statistiek een aantal onafhankelijke trekkingen uit dezelfde verdeling. Een aselecte steekproef laat zich beschrijven door een n-tal onderling onafhankelijke gelijkverdeelde stochastische variabelen . Men spreekt wel over een aselecte steekproef van X, als de verdeling waaruit de trekkingen afkomstig zijn, de verdeling van X is. De elementen van de steekproef zijn dan onafhankelijke kopieën van X.
Het begrip komt overeen met een aselecte steekproef met terugleggen uit de steekproeftheorie. Omdat ook aselecte trekkingen zonder terugleggen bestaan en men niet altijd de associatie met steekproef wil benadrukken, wordt ook vaak gesproken van o.g.v.s.v.: onafhankelijke gelijk verdeelde stochastische variabelen, in navolging van het Engelse i.i.d.r.v.: independent identically distributed random variables. Ook de afkorting o.g.v. alleen wordt gebruikt, zoals ook in het Engels i.i.d. of nog korter iid.
Aselecte steekproeven spelen een belangrijke rol in de statistiek, enerzijds omdat vaak gegevens op deze manier verkregen worden en anderzijds omdat zulke steekproeven het gebruik van verschillende statistische methoden vereenvoudigen. Veel technieken gaan er vanuit dat een aselecte steekproef gegeven is, en bepalen een geschikte steekproeffunctie, dus een functie van deze steekproef, als conclusie.
Kopie w:Schatter
Schatter
[bewerken]Een categorie van methoden die de statistiek hanteert om informatie te verkrijgen, wordt gevormd door de schattingsmethoden. Een onbekende parameter van een populatie (of verdeling) wordt geschat door een uit de steekproef berekende grootheid, de schatting. Het voorschrift dat bepaalt hoe de schatting uit de steekproef moet worden berekend, wordt schatter genoemd.
Algemeen bekend is het (steekproef-)gemiddelde als schatting voor het populatiegemiddelde (of de verwachtingswaarde).
Voorbeelden
[bewerken]Een vreemde munt ziet er niet bepaald symmetrisch uit, zodat de kans p op kop vermoedelijk niet zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kop vinden. We zouden dan de onbekende parameter p (de populatiefractie) kunnen schatten door de steekproeffractie .
Een ander voorbeeld is bekend uit de Tweede Wereldoorlog. Het viel de Engelsen op dat de neergehaalde Duitse bommenwerpers "gründlich" voorzien waren van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van het totale aantal geproduceerde vliegtuigen N van dat type. Het zal duidelijk zijn dat alleen het hoogste gevonden serienummer M van belang is. Men kan laten zien dat bij een steekproefomvang n, een goede schatting van N gegeven wordt door:
Schatter
[bewerken]Het schatten van een parameter van en populatie of kansverdeling gebeurt door middel van een schatter, dat is een steekproeffunctie, dus een functie die uit de steekproef een getal, de schatting, berekend. Hoewel iedere steekproeffunctie aangemerkt kan worden als schatter, is het zaak goede schatters te vinden. Een goede schatter zal schattingen vinden die in bepaalde zin niet veel afwijken van de onbekende waarde van de parameter.Goede schatters zijn bijvoorbeeld zuivere schatters, dat zijn schatters die gemiddeld (over alle mogelijke steekproeven) precies de waarde van de te schatten parameter opleveren.
Voorbeelden
[bewerken]Laat een aselecte steekproef zijn uit een populatie of kansverdeling.
- Binomiale verdeling: B(n,p). De te schatten parameter is de succeskans (populatiefractie) p. Laat X het aantal successen in de steekproef zijn, dan kan p geschat worden door o.a. de schatters: (de steekproeffractie), en .
- Uniforme verdeling op het interval [0,M]. De te schatten parameter is de bovengrens M. Geschikte schatters zijn: maxSjabloon:Math (de bovengrens in de steekproef) en max Sjabloon:Math.
- Willekeurige populatie (of verdeling) met populatiegemiddelde en populatievariantie . Goede schatters zijn de overeenkomstige grootheden in de steekproef. Het steekproefgemiddelde als schatter voor , en de steekproefvariantie voor .