Variatiecoëfficient.
De variatiecoëfficient is een schaalvrije maat voor de variatie in een variabele, en wordt berekend als het quotient van de standaarddeviatie en het gemiddelde: sd/m
Als je de variatiecoëfficient voor een variabele opgesplitst naar een andere variabele wilt berekenen, dan kan dat bijvoorbeeld met behulp van de R-functie tapply.
In dit voorbeeld wordt dit gedaan voor de lichaamslengte onderverdeeld m.b.t. de verschillende oogkleuren.
> bron <- "http://www.mzandee.net/~zandee/statistiek/data/gegevens.txt"
> cohort <- read.table(bron, header=T)
> attach(cohort)
> names(cohort)
[1] "lichaam" "arm" "pols" "geslacht" "hand" "ogen"
Je berekent achtereenvolgens de standaarddeviatie en het gemiddelde van de lichaamslengten van de groepen personen, ingedeeld op oogkleur:
> losd <- tapply(lichaamslengte, ogen, sd)
> lom <- tapply(lichaamslengte, ogen, mean)
Je krijgt dan twee vectoren als output: losd (standaarddeviaties) en lom (gemiddelden).
Om de variatiecoëfficient voor de lichaamslengte per oogkleur te krijgen moeten deze vectoren elementsgewijs gedeeld worden, en in R gebeurt dit door de twee vectoren zelf te delen. M.a.w., de variatiecoëfficienten vind je als:
> losd / lom
of in 1 regel R:
> tapply(lichaamslengte, ogen, sd)/tapply(lichaamslengte, ogen, mean).
Bron:
Buijs, A. - Statistiek om mee te werken. Stenfert Kroese, Groningen (2003)