Statistiek-1 + R

t-Toets

» Start

t-Toets


De t-toets gebruiken we wanneer we willen toetsen of twee steekproeven een verschillend gemiddelde hebben. 

Voor een [tamelijk] gedetailleerde uitleg wordt verwezen naar wikipedia_t-toets.


De toetsingsgrootheid is t, en wordt als volgt berekend:

t = (verschil tussen de twee gemiddelden) / (standaardfout van dat verschil)

t = (mean(x) - mean(y)) / s.e[diff] 

s.e[diff] = sqrt( var(x)/length(x)  + var(y)/length(y) )

In R werkt de t-toets als volgt:

# eerst wat gegevens inlezen:

> bron <- "http://www.mzandee.net/~zandee/statistiek/data/gegevens.txt"

> cohort <- read.table(bron, header=T)

> attach(cohort)

> names(cohort)

[1] "lichaam"  "arm"      "pols"     "geslacht" "hand"     "ogen"    

# lichaamslengte opbreken in man / vrouw

> man<-lichaam[geslacht=="m"]

> vrouw<-lichaam[geslacht=="v"]

# t-toets uitvoeren:

> t.test(man,vrouw)

Welch Two Sample t-test

data:  man and vrouw 

t = 7.3254, df = 56.116, p-value = 9.922e-10

alternative hypothesis: true difference in means is not equal to 0 

95 percent confidence interval:  9.4451 16.5549 

sample estimates:

mean of x mean of y : 183.75    170.75 

In deze lijst is t de toetsingsgrootheid, df is het aantal vrijheidsgraden (= length[man] + length[vrouw]-2, met correctie voor het verschil in steekproefgrootte), en p-value is de zg overschrijdingskans, dat wil zeggen de kans dat je een t-waarde met de gegeven grootte (t = 7.3254) aan zult treffen puur op basis van toeval in plaats van op basis van een of ander [biologisch] effect of proces. 


Nu is de hier gevonden p-waarde [heel veel] kleiner dan de standaard afgesproken waarde van 5 procent, zodat we moeten aannemen dat de gevonden waarde van het verschil in lichaamslengte van man en vrouw niet meer toevallig zo groot is, maar wellicht het resultaat van een of ander effect of proces. We zeggen dan dat de gevonden waarde van t significant is [= het gevonden verschil in lengte tussen man en vrouw wijkt significant af van nul].


De 95 percent confidence interval betekent dat wanneer je nog eens een steekproef trekt uit dezelfde populatie [in dit geval Leidse 1e jrs biologiestudenten] je er met een zekerheid van 95% van uit kunt gaan dat het verschil in lichaamslengte tussen mannen en vrouwen dat je uitrekent op basis van die nieuwe steekproef, tussen de aangegeven waarden 9.4451 en 16.5549 zal liggen.


Bron:

Buijs, A. - Statistiek om mee te werken. Stenfert Kroese, Groningen (2003)

Crawley, M.J. - Statistics. An introduction using R. Wiley, Hoboken, NJ, USA (2005)

Zijp, W.L. - Handleiding voor statistische toetsen. Tjeenk Willink, Groningen (1974)