Test serii
Test serii (zwany też testem serii Stevensa lub testem serii Walda-Wolfowitza) – nieparametryczny test losowości próby. Stosuje się go m.in. do sprawdzenia, czy wyniki eksperymentu spełniają postulat losowości próby.
Hipotezę zerową i alternatywną formułujemy w sposób następujący:
- H0: dobór jednostek do próby jest losowy; model jest liniowy.
- H1: dobór jednostek do próby nie jest losowy; model jest nieliniowy.
Jedną z metod weryfikacji wyżej zapisanej hipotezy jest test serii.
Pod pojęciem serii rozumiemy każdy ciąg identycznych elementów w zbiorze uporządkowanym według przyjętego kryterium. Na przykład jeżeli odnotujemy płeć studentów podchodzących kolejno do egzaminu, możemy otrzymać ciąg:
- M M Ż Ż M Ż Ż Ż M M Ż M Ż Ż Ż.
W tym przykładowym ciągu, uporządkowanym według kolejności pojawiania się elementów dwóch rodzajów (M i Ż), powstało 8 serii składających się z jednakowych elementów występujących obok siebie. Zakładając, że pojawienie się kolejnych elementów jest losowe, ogólna liczba serii w ciągu n-elementowym jest zmienną losową o znanym i ujętym w tablice rozkładzie. Jest ona statystyką w opisywanym teście losowości próby.
Sposób wyznaczania wartości statystyki z próby:
- Kolejno zapisane obserwacji zmiennej ciągłej tworzy ciąg podstawowy;
- Obserwacje porządkujemy rosnąco i wyznaczamy medianę;
- W ciągu podstawowym oznaczamy symbolami i wartości różniące się od mediany:
- oznaczamy
- oznaczamy
- pomijamy.
- Analizując ustawienie symboli i zliczamy utworzoną liczbę serii która jest wartością statystyki otrzymaną z próby.
Obszar krytyczny testu jest dwustronny.
Jeżeli to wartości krytyczne odczytujemy z tablic rozkładu liczby serii (tablica H) jako:
- oraz
- gdzie i oznaczają odpowiednio liczbę elementów oznaczonych symbolami i
Zliczoną w próbie liczbę serii porównujemy z wartościami krytycznymi testu.
Jeżeli wystąpi lub odrzucamy H0 na rzecz H1, co będzie oznaczało, że próba nie ma charakteru losowego.
Jeżeli i to zmienna losowa dąży asymptotycznie do rozkładu normalnego Wartość średnia i wariancja zmiennej są określone wzorami:
Wykorzystując te parametry, obliczamy statystykę która przy założeniu prawdziwości ma rozkład N(0,1).