Statistiek-1 + R

Scatterplot

» Start

Scatterplot


Wordt in gewoon Nederlands een strooidiagram of spreidingsdiagram genoemd. Een dergelijk diagram is bij uitstek geschikt om een indruk te krijgen van de samenhang [zie: correlatie, regressie] tussen twee variabelen.


We lezen eerst de data in:


> bron <- "http://www.mzandee.net/~zandee/statistiek/data/gegevens.txt"

> cohort <- read.table(bron, header=T) # lees de datamatrix in

> attach(cohort) # maak de variabelen uit de datamatrix beschikbaar in de R workspace

> names(cohort) # wat zijn de namen van de variabelen ?

[1] "lichaam"  "arm"      "pols"     "geslacht" "hand"     "ogen"    

Vervolgens maken we een strooidiagram van de variabele arm als functie van lichaam [uit de datamatrix cohort], met plotsymbool nr 16 [zie plotsymbolen]:


> plot(arm ~ lichaam, data=cohort, pch=16)


En we laten op de x- en y-as ook de waarde zien van alle waarnemingen uit de twee variabelen:


> rug(lichaam)

> rug(arm, side=2)

scatter-arm-lich.pdf

Er bestaan in R twee bibliotheken met grafische functies. Bovenstaand spreidingsdiagram is gemaakt met de 'standaard' functie plot. Door gebruik te maken van het pakket lattice krijgen we de beschikking over meer en/of andere mogelijkheden. 

We laten het zelfde spreidingsdiagram zien, maar nu gemaakt met de functie xyplot, en de waarnemingen opgedeeld in 4 groepen, namelijk de verschillende combinaties van man/vrouw en links/rechtshandigheid, en dat alles in meerdere panelen in 1 venster:


> library(lattice)

> xyplot(arm~lichaam | geslacht*hand)

scatter-arm-lich+sex+hand.pdf


Bron:

Website van John Maindonald en John Braun's boek : Data Analysis and Graphics Using R - An Example-Based Approach, met plot voorbeelden en R-code.