Wilcoxon.
Een bekende verdelingsvrije toets is de toets van Wilcoxon, die men in de literatuur ook wel tegenkomt onder de naam Mann-Whitney-toets of Mann-Whitney-U-toets.
De toets van Wilcoxon wordt gebruikt om te onderzoeken of de medianen van twee continu verdeelde grootheden x en y ten opzichte van elkaar verschoven zijn. Bij deze toets wordt verondersteld dat de verdeling van de beide toevalsvariabelen x en y dezelfde vorm hebben. We toetsen dan dus of de verdeling van y verschoven is ten opzichte van die van x.

Dit komt dus qua probleemstelling overeen met de probleemstelling van de Student-t-toets (met 'pooled variance', zie Buijs § 11.2.2). In het geval van de t-toets wordt echter verondersteld dat de twee steekproeven trekkingen zijn van normaal verdeelde variabelen x en y die dezelfde (onbekende) variantie hebben. Bij toepassing van de toets van Wilcoxon wordt slechts verondersteld dat de vorm van de verdelingen overeenkomt. In beide gevallen toetsen we of μx = μy. Omdat beide verdelingen dezelfde vorm hebben, is dus ook de variantie van beide verdelingen gelijk.
In de toets van Wilcoxon wordt gewerkt met rangnummers van waarnemingen. Deze aanpak wordt vaak gebruikt bij verdelingsvrije toetsen.
Uit de waarde van de rangnummers wordt vervolgens geconcludeerd of de verdelingen van x en y al dan niet ten opzichte van elkaar verschoven zijn. We werken de procedure nader uit.
Uit twee kansverdelingen worden onderling onafhankelijke steekproeven getrokken. Voor de variabele x levert dit de waarnemingen x1, x2, ... , xn en voor de variabele y levert dit de uitkomsten y1, y2, ... , ym (De aantallen waarnemingen n en m van respectievelijk x en y mogen dus verschillen.)
De mooiste manier om de nulhypothese te formuleren is te stellen dat de variabelen x en y dezelfde mediaan (ME) hebben.
Dus: H0: MEx = MEy
H1: MEx ≠ MEy
(beide onder de veronderstelling dat de verdeling van x en y dezelfde vorm hebben).
Bij de opzet van de toets gaan we ervan uit dat voor de aantallen waarnemingen geldt n ≤ m (zo niet, dan moeten de aanduidingen x en y verwisseld worden). Het totaal aantal waarnemingen bedraagt n + m.
De aanpak van de toets is als volgt.
Van de waarnemingen x1, ... , xn en y1, ... , ym wordt een gezamenlijke lijst gemaakt waarin de waarnemingen op een volgorde geplaatst worden. Aan elke waarneming wordt het rangnummer in deze volgorde toegevoegd.
Als H0 geldig is, mogen we verwachten dat deze rangnummers willekeurig bij de x- en y-waarnemingen zijn terechtgekomen. Zijn daarentegen de verdelingen verschoven ten opzichte van elkaar dan zien we bij de x-waarnemingen opvallend veel lage rangnummers of juist veel hoge rangnummers.
Om vast te stellen of een geconstateerd patroon bij de rangnummers voldoende willekeurig mag worden geacht, berekenen we een toetsingsgrootheid Tx, de som van de rangnummers van de uitkomsten x1, x2, ... , xn.
Wat kunnen we voor Tx als uitkomst zien?
Een extreem geval zien we als de waarnemingen van de variabele x de n laagste plaatsen in de volgorde innemen. Dan geldt Tx = 1 + 2 + ... + n = n (n + 1)/2
Het andere uiterste ontstaat als de waarnemingen x1, ... , xn de hoogste rangnummers bezetten. Dan geldt:
Tx = (m + 1) + (m + 2) + ... + (n + m) = n (n + 2m + 1)/2
In de praktijk zal Tx meestal een waarde opleveren tussen deze extreme waarden. De gemiddelde waarde van Tx bedraagt (bij geldigheid van de nulhypothese):
E(Tx) = n (n + m + 1)/2
De redenering bij de toets is dat de nulhypothese verworpen dient te worden als blijkt dat de berekende grootheid Tx te veel verschilt van de verwachtingswaarde n (n + m + 1)/2.
Voor de beoordeling van Tx zijn er in principe twee methoden beschikbaar:
1.
Als de steekproefomvang n en m klein is, dan moet de exacte kansverdeling van de grootheid Tx berekend worden. Daarvoor gebruiken we de functie wilcox.test in R. [zie voorbeeld 1]
2.
Als geldt n ≥ 5 en m ≥ 10 dan mag men gebruik maken van een normale benadering van de verdeling van Tx. Kritieke grenzen van Tx worden dan berekend met de tabel van de standaardnormale verdeling. In dat geval maken we gebruik van:
E(Tx) = n (n + m + 1)/2
Var(Tx) = m n (n + m + 1)/12
Dus de grootheid
volgt bij benadering een standaard normale verdeling.
Omdat Tx alleen gehele getallen als waarde kan tonen, dient hierbij nog de continuiteits- correctie toegepast te worden. [zie voorbeeld 2]
Voorbeeld 1:
Een safariepark heeft 14 olifanten, 6 daarvan verblijven op terrein A, de overige 8 op terrein B.
Een punt van aandacht zijn de dierenartskosten. In het laatste jaar waren die als volgt:
type kosten dierenarts (euro)
A(x) 450 320 50 300 600 200
B(y) 680 850 500 430 1050 700 250 920
We willen toetsen of de dierenartskosten verschillen tussen de twee terreinen. Hierbij gaan we ervan uit dat de toets van Wilcoxon mag worden toegepast. We formuleren de nul-hypothese:
H0: MEx = MEy
We berekenen de toetsingsgrootheid Tx. Allereerst plaatsen we de waarnemingen op volgorde:
Type x x y x x y x y x y y y y y
kosten 50 200 250 300 320 430 450 500 600 680 700 850 920 1050
rangnr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Voor de variabele x zien we de rangnummers 1, 2, 4, 5, 7 en 9, dus Tx = 28.
We toetsen tweezijdig met α = 0,05.
> x<-c(450, 320, 50, 300, 600, 200)
> y<-c(680, 850, 500, 430, 1050, 700, 250, 920)
> wilcox.test(x,y)
Wilcoxon rank sum test
data: x and y
W = 7, p-value = 0.02930
alternative hypothesis: true location shift is not equal to 0
Toetsingsgrootheid uitrekenen in R:
> x <- c(450, 320, 50, 300, 600, 200)
> y <- c(680, 850, 500, 430, 1050, 700, 250, 920)
> rank(c(x,y))
[1] 7 5 1 4 9 2 10 12 8 6 14 11 3 13
> r <- rank(c(x,y))
> Tx <- sum(r[1:length(x)])
> Tx
[1] 28
Voorbeeld 2:
We kijken naar twee krabbensoorten A en B die allebei mosselen in hun dieet hebben. De tijd, die het kost om een mossel te openen, zijn verzameld voor 10 volwassen krabben van soort A en 14 volwassen krabben van soort B.
De resultaten waren (in minuten):
A 10,8 11,4 12,6 9,7 10,0 11,9 13,5 14,7 10,6 12,3
B 14,9 15,8 12,2 11,8 13,0 14,6 15,3 14,8 13,0 12,5 14,1 14,9 11,1 15.2
We nemen aan dat beide verdelingen dezelfde vorm hebben. De vraag is of deze verdelingen ten opzichte van elkaar verschoven liggen. Deze vraag onderzoeken we met de toets van Wilcoxon met α = 0,05.
Allereerst plaatsen we de waarnemingen op volgorde en geven we rangnummers aan.
9,7 10,0 10,6 10,8 11,1 11,4 11,8 11,9 12,2 12,3 12,5 12,6
A A A A B A B A B A B A
1 2 3 4 5 6 7 8 9 10 11 12
13,0 13,0 13,5 14,1 14,6 14,7 14,8 14,9 14,9 15,2 15,3 15,8
B B A B B A B B B B B B
13 14 15 16 17 18 19 20 21 22 23 24
Voor de variabele A is het aantal waarnemingen het kleinst. Deze wordt dus aangegeven als de variabele x. Hierdoor geldt n = 10 en m = 14.
Omdat voldaan is aan de voorwaarden voor toepassing van de normale benadering kunnen we de volgende aanpak voor de toets formuleren.
H0: MEx = MEy
H1: MEx ≠ MEy
Voor de grootheid Tx geldt volgens H0
E(Tx) = n (n + m + 1) / 2 = 10.25 / 2 =125
Var(Tx) = 10 14 25 / 12 = 291,7
Uit de steekproefresultaten volgt:
Tx = 1 + 2 + 3 + 4 + 6 + 8 + 10 + 12 + 15 + 18 = 79.
Voor de toetsingsgrootheid geldt dus z = (79 - 125) / 17.1 = - 2.69
Bij α = 0,05 levert de tabel van de standaardnormale verdeling z = 1,96 (bij tweezijdige toetsing).
Omdat -2,66 < -1,96 moet H0 verworpen worden.
Conclusie: De mediaan van de tijd voor A om een mossel te openen is significant lager dan die voor B.