Normaalverdeling.
Voor iedere kansverdeling bestaan er in R 4 functies. De naam van die functies is opgebouwd uit een basisnaam ('wortel'), plus een daaraan voorafgaande letter. De basisnaam voor de normaalverdeling is norm. De letters die je voor die basisnaam kunt plaatsen zijn:
p = probability [kans], de kansverdelingsfunctie
q = quantile [kwantiel], de inverse van de kansverdelingsfunctie
d = density [dichtheid], de dichtheidsfunctie
r = random, een random variabele die getrokken is uit de gespecificeerde verdeling
Voor de normaalverdeling heten de 4 functies dus: pnorm, qnorm, dnorm, and rnorm.
pnorm is de R functie die de kans berekent dat x kleiner of gelijk is aan X:
F(x) = P(X <= x)
waarin X een normaal verdeelde variabele is.
In R doen onderstaande opdrachten het zelfde:
pnorm(27.4, mean=50, sd=20)
pnorm(27.4, 50, 20)
namelijk de kans uitrekenen op het vinden van een waarde kleiner dan 27.4 gegeven een normaalverdeling met gemiddelde 50 en een standaardeviatie 20. Optionele argumenten voor de functie pnorm kun je vinden op de overeenkomstige normaalverdeling-helppagina van R.
Voorbeeld 5.2 - Buijs p. 166:
Gegeven x ~ N(7000, 800).
Gevraagd P(x<6400).
Antwoord:
> pnorm(6400, 7000, 800)
[1] 0.2266274
En voorbeeld 5.3 (pag. 167) wordt dan:
Bepaal g zodanig dat P(x>g) = 0.1 waarbij mu = 15 en sigma = 2
> qnorm(0.9, 15, 2)
[1] 17.56310
Waarom is 0.9 hier een parameter van de functie qnorm, en niet 0.1 zoals in de vraag is gegeven? Omdat we er rekening mee moeten houden dat de functies pnorm en qnorm werken met de cumulatieve verdeling. In feite gaat het in vraag 5.3 dus om het uitrekenen van P(x<g) = 0.9
In voorbeeld 5.2 gaat het 'gewoon' goed omdat we met de waarde 6400 links van het gemiddelde 7000 zitten. De inverse kansfunctie voor die vraag gaat als volgt:
> qnorm(0.226674, 7000, 800)
[1] 6400.124
wat in de praktijk gelijk is aan 6400, gegeven de orde van grootte van de getallen waarmee we in dit voorbeeld werken.
Random variabelen maken
rnorm is de R functie die random variabelen genereert uit een bepaalde normaalverdeling. Net zoals het geval is bij pnorm, qnorm, and dnorm, kunnen bij aanroep optionele parameters meegegeven worden die het gemiddelde en de standaarddeviatie van de verdeling specificeren.
In onderstaande opdrachten worden eerst 1000 waarden getrokken uit een normaalverdeling met gemiddelde 100 en een standaarddeviatie 15. Vervolgens wordt van die waarden een histogram geplot. Tenslotte wordt in het plaatje van het histogram de dichtheidsfunctie van dezelfde verdeling toegevoegd.
> x <- rnorm(1000, mean = 100, sd = 15)
> hist(x, ylim=c(0,0.03), freq = FALSE)
> curve(dnorm(x, mean = 100, sd = 15), add = TRUE)

zie ook: Kwantielplot voor kontrole op normaliteit van een steekproef.
Normaalverdeling-Quincunx, Quincunx-2
Bron:
Buijs, A. - Statistiek om mee te werken. Stenfert Kroese, Groningen (2003)
Klingens, D. - http://www.pandd.demon.nl/kansrekening.htm
Ravenstein, W. van - Wiswijzer - Normale verdeling