Statistiek-1 + R

Variatiecoefficient

» Start

Variatiecoëfficient.


De variatiecoëfficient is een schaalvrije maat voor de variatie in een variabele, en wordt berekend als het quotient van de standaarddeviatie en het gemiddelde: sd/m


Als je de variatiecoëfficient voor een variabele opgesplitst naar een andere variabele wilt berekenen, dan kan dat bijvoorbeeld met behulp van de R-functie tapply. 

In dit voorbeeld wordt dit gedaan voor de lichaamslengte onderverdeeld m.b.t. de verschillende oogkleuren. 


> bron <- "http://www.mzandee.net/~zandee/statistiek/data/gegevens.txt"

> cohort <- read.table(bron, header=T)

> attach(cohort)

> names(cohort)

[1] "lichaam"  "arm"      "pols"     "geslacht" "hand"     "ogen"    


Je berekent achtereenvolgens de standaarddeviatie en het gemiddelde van de lichaamslengten van de groepen personen, ingedeeld op oogkleur:


    > losd <- tapply(lichaamslengte, ogen, sd)

    > lom <- tapply(lichaamslengte, ogen, mean)


Je krijgt dan twee vectoren als output: losd (standaarddeviaties) en lom (gemiddelden). 


Om de variatiecoëfficient voor de lichaamslengte per oogkleur te krijgen moeten deze vectoren elementsgewijs gedeeld worden, en in R gebeurt dit door de twee vectoren zelf te delen. M.a.w., de variatiecoëfficienten vind je als:

 

    > losd / lom


of in 1 regel R:


    > tapply(lichaamslengte, ogen, sd)/tapply(lichaamslengte, ogen, mean). 


Bron:

Buijs, A. - Statistiek om mee te werken. Stenfert Kroese, Groningen (2003)