Test Kruskala-Wallisa

Test Kruskala-Wallisa – rangowy test statystyczny porównujący rozkłady zmiennej w k > 2 {\displaystyle k>2} populacjach. Test nie zakłada normalności rozkładów. Niekiedy uważany jest[1] za nieparametryczną alternatywę dla jednoczynnikowej analizy wariancji pomiędzy grupami.

Hipotezą zerową H 0 {\displaystyle H_{0}} jest równość dystrybuant rozkładów w porównywanych populacjach.

Danymi wejściowymi jest n {\displaystyle n} -elementowa próba statystyczna podzielona na k {\displaystyle k} rozłącznych grup o licznościach n 1 , n 2 , n k . {\displaystyle n_{1},n_{2},\dots n_{k}.} Zakłada się, że każda grupa jest losowana z innej populacji.

Wykonywane jest rangowanie całej próby (połączone wszystkie grupy). Niech R i j {\displaystyle R_{ij}} oznacza rangę w całej próbie j {\displaystyle j} -tego elementu z i {\displaystyle i} -tej grupy.

Statystyka testowa Kruskala-Wallisa:

T = 12 n ( n + 1 ) i = 1 k n i ( R ¯ i n + 1 2 ) 2 , {\displaystyle T={\frac {12}{n(n+1)}}\sum \limits _{i=1}^{k}n_{i}\left({\overline {R}}_{i}-{\frac {n+1}{2}}\right)^{2},}

gdzie:

R ¯ i = 1 n i j = 1 n i R i j . {\displaystyle {\overline {R}}_{i}={\frac {1}{n_{i}}}\sum _{j=1}^{n_{i}}R_{ij}.}

Statystyka ta jest miarą odstępstwa średnich próbkowych rang od wartości średniej wszystkich rang, równej ( n + 1 ) / 2. {\displaystyle (n+1)/2.}

Dokładne obliczenie rozkładu tej statystyki wymagałoby sprawdzenia wszystkich układów rang. W praktyce, do obliczania p-wartości korzysta się z twierdzenia, mówiącego, że przy (jednocześnie):

  • spełnionej hipotezie H0
  • ciągłym rozkładzie cechy w porównywanych populacjach
  • minimalnych licznościach grup n 1 , n 2 , n 3 > 5 {\displaystyle n_{1},n_{2},n_{3}>5} dla k = 3 {\displaystyle k=3} lub n 1 , n 2 , , n k > 4 {\displaystyle n_{1},n_{2},\dots ,n_{k}>4} dla k > 3 {\displaystyle k>3}

zachodzi:

P { T t } P { χ k 1 2 t } {\displaystyle P\{T\leqslant t\}\to P\{\chi _{k-1}^{2}\leqslant t\}} dla t , {\displaystyle t\to \infty ,}

gdzie χ k 1 2 {\displaystyle \chi _{k-1}^{2}} to zmienna o rozkładzie chi-kwadrat z k 1 {\displaystyle k-1} stopniami swobody.

Zobacz też

Zobacz w Wikiźródłach tablicę rozkładu chi-kwadrat

Przypisy

  1. StatSoft – pomoc do programu Statistica.

Bibliografia

  • WilliamW. Kruskal WilliamW., Wilson AllenW.A. Wallis Wilson AllenW.A., Use of ranks in one-criterion variance analysis, „Journal of the American Statistical Association”, 47 (260), grudzień 1952, s. 583–621 [dostęp 2020-04-08] .
  • JacekJ. Koronacki JacekJ., JanJ. Mielniczuk JanJ., Statystyka dla studentów kierunków technicznych i przyrodniczych, Warszawa: WNT, 2001, s. 476–478, ISBN 83-204-2684-7 .