Statistiek-1 + R

Hypergeometrische verdeling

» Start

Hypergeometrische verdeling


Bij de binomiaalverdeling en normaalverdeling zijn we bij het berekenen van kansen op bepaalde trekkingsuitkomsten steeds uitgegaan van steekproeven met teruglegging. In de praktijk zal men vrij vaak een situatie aantreffen waarin sprake is van het trekken van een steekproef zonder teruglegging, uit een populatie van eindige omvang. In zulke gevallen moeten we bij het berekenen van kansen op bepaalde trekkingsuitkomsten gebruik maken van de hypergeometrische verdeling.


Alleen als de populatieomvang N groot is ten opzichte van de steekproefomvang n, zeg n < 0.1 N, is er nauwelijks verschil tussen de uitkomsten van de hypergeometrische en de binomiale verdeling, en geven we de voorkeur aan de laatste. Wanneer bovendien geldt dat de steekproef voldoende groot is, zeg n >= 20, en zowel n.pi >= 5 en n(1-pi) >= 5, dan verdient het [rekentechnisch] de voorkeur om de binomiaalverdeling te benaderen met de normaalverdeling. 


R


Voor de hypergeometrische verdeling heten de 4 beschikbare functies: phyper, qhyper, dhyper, and rhyper.


Voorbeeld 6.7 - Buijs p. 200:

Het aantal studenten dat zich voor een bepaalde studierichting heeft aangemeld bedraagt 400. Hierbij zijn 140 vrouwelijke studenten. De toelating tot de studierichting geschiedt door uit deze groep studenten willekeurig 80 studenten te loten. Hoe groot is de kans dat hierbij 40 vrouwelijke studenten zijn?


Antwoord:


> dhyper(40, 260 ,140, 80)

    [1] 0.000859445


En hoe groot is de kans dat hierbij meer dan 40 vrouwelijke studenten zijn?


    > phyper(40, 260 ,140, 80)

    [1] 0.001490201


> x <- rhyper(400, 160, 240,80)

> hist(x, ylim=c(0,0.12), freq = FALSE)

hyper.pdf

Voorbeeld 3.14 - Buijs p. 124:

Een winkel in huishoudelijke apparaten heeft in 1 maand 10 haardrogers verkocht. Volgens de fabrikant zijn daar 4 haardrogers bij waarin een verwarmingselement zit dat een ernstig technisch gebrek heeft. Na een oproep in een krant melden zich 3 klanten die de door hen gekochte haardroger laten controleren. Hoe groot is de kans dat alle 3 de apparaten goed zijn ?


    > dhyper(3,6,4,3)

    [1] 0.1666667


En hoe groot is de kans dat 2 foute apparaten - en dus 1 goed - worden gevonden?


    > dhyper(1,6,4,3)

    [1] 0.3


Bron:

Buijs, A. - Statistiek om mee te werken. Stenfert Kroese, Groningen (2003)

Geyer, Ch.  - Statistics 5102 - Examples: Probability Distributions in R

Klingens, D. - Kansrekening

Ravenstein, W. van - Wiswijzer - Hypergeometrische verdeling-2