Statistiek-1 + R

Histogram

» Start

Histogram.


Een histogram van een op een ratio schaal gemeten continue variabele is te maken met de functie hist ipv barplot. Een histogram is de tegenhanger van een staafdiagram bij discrete verdelingen. Je moet bij gebruik van hist wel zelf zorgen voor de frekwentieklassen. Je kunt bijv eerst mbv de functies min en max de laagste en hoogste waarde van de te plotten variabele uitzoeken, en vervolgens dat bereik in bijv 5 of 10 gelijke stappen opdelen. Hier zie je het effect van twee verschillende stapgroottes op het histogram van de variabele lichaam.


> bron <- "http://www.mzandee.net/~zandee/statistiek/data/gegevens.txt"

> cohort <- read.table(bron, header=T)

> attach(cohort)

> names(cohort)

[1] "lichaam"  "arm"      "pols"     "geslacht" "hand"     "ogen"    


> min(lichaam)

[1] 154

> max(lichaam)

[1] 193

# de range bedraag ca 50, van 150 tot 200; 

# dat betekent 10 klassen van 5 cm, of 20 van 2.5 cm.

> par(mfrow=c(1,2)) # we willen 2 plots naast elkaar zien in hetzelfde plotvenster

> hist(lichaam, breaks=150+(0:10)*5, xlab="Lichaamslengte") # stapgrootte = 2.5 cm

> hist(lichaam, breaks=150+(0:20)*2.5, xlab="Lichaamslengte") # stapgrootte = 5 cm

> par(mfrow=c(1,1)) # terug naar 1 plot per venster

hist-lich.pdf


We kunnen om een goede indruk van de verdeling te krijgen ook een dichtheidsfunctie in het plaatje van het histrogram plotten.


> dens <- density(lichaam) # bereken de dichtheidsfunctie

> xlim <- range(dens$x) # gebruik de dichtheid om grenswaarden voor x-as te bepalen

> ylim <- range(dens$y) # idem, y-as

> par(mfrow=c(1,2)) # we willen 2 plots naast elkaar zien in hetzelfde plotvenster

> hist(lichaam, breaks=150+(0:20)*2.5, xlab="Lichaamslengte", probability=T, xlim=xlim, ylim=ylim) # stapgrootte = 2.5 cm

> lines(dens)

> hist(lichaam, breaks=150+(0:10)*5, xlab="Lichaamslengte", probability=T, xlim=xlim, ylim=ylim) # stapgrootte = 5 cm

> lines(dens)

> par(mfrow=c(1,1)) # terug naar 1 plot per venster

hist-dens-lich.pdf

Een klassegrootte van 5 cm geeft duidelijk een betere overeenkomst tussen dichtheidsfunctie en histogram dan een klassegrootte van 2.5 cm.


Bron:

Buijs, A. - Statistiek om mee te werken. Stenfert Kroese, Groningen (2003)

Maindonald, J. & J. Brown. - Data Analysis and Graphics Using R. Cambridge University Press, Cambridge (2003)