Test chi-kwadrat

Test chi-kwadrat $\left(\chi ^{2}\right)$ – każdy test statystyczny, w którym statystyka testowa ma rozkład chi kwadrat. Test chi-kwadrat służy weryfikacji hipotez mówiących o niezależności zmiennych lub zgodności rozkładu z założeniami. Wyróżnia się między innymi test zgodności chi-kwadrat (ang. goodness-of-fit chi-squared test), test chi-kwadrat niezależności (ang. independence) i test jednorodności (ang. homogeneity) chi-kwadrat^[1]^[2]^[3].

Test Pearsona

W ogólności zachodzi:

\chi ^{2}=\sum _{i=1}^{n}\left({\frac {O_{i}-E_{i}}{\sigma _{i}}}\right)^{2}

gdzie:

O_{i}

– wartość mierzona,

E_{i}

– wartość teoretyczna (oczekiwana) wynikająca z hipotezy odpowiadająca wartości mierzonej,

\sigma _{i}

– odchylenie standardowe,

n

– liczba pomiarów.

Zliczenia

W szczególności, gdy wartościami są zliczenia, wtedy ich odchylenie standardowe wynosi ${\sqrt {E_{i}}}$ i równanie przechodzi na:

\chi ^{2}=\sum _{i=1}^{n}{\frac {(O_{i}{-}E_{i})^{2}}{E_{i}}}

Uwagi:

Przyjmuje się, że wartość $E_{i}$ powinna być większa lub równa 5 (spotyka się też 10 – nie ma ścisłego wyprowadzenia minimalnej wielkości).
- Czasem z tego powodu przy pomiarach wartości dyskretnych łączy się te wartości w jeden przedział (patrz przykład).
Przy pomiarze wartości ciągłej wartość teoretyczna to całka z rozkładu prawdopodobieństwa po odpowiednim przedziale z którego zliczane były wyniki.

Przykład

Rozpatrzmy rzut pięcioma kośćmi i liczbę wyrzuconych szóstek $k.$ Może ona przyjmować wartości 0,1,2,3,4,5, nie widać więc potrzeby dzielenia tych wielkości na przedziały. Rzut został powtórzony 200 razy, wartości teoretyczne dla takiej liczby rzutów przedstawione są w tabeli, w kolumnie $E_{k}.$ Widać, że dla $k=4,5$ są to wartości bardzo małe, dlatego też należy stworzyć nowe przedziały, tak aby w każdym wartość teoretyczna była większa od 5. Przedstawione jest to w tabeli, oznaczone są one przez $n$

$k$	$E_{k}$	$n$	$E_{n}$
0	80,4	0	80,4
1	80,4	1	80,4
2	32,2	2	32,2
3	6,4	3	7,0
4	0,6
5	0,03

Mając dane z rzutów można obliczyć ich zgodność z rozkładem teoretycznym (tutaj jest to rozkład dwumianowy $b_{5,{\frac {1}{6}}}(k)$ ). W praktyce byłby to test kości na to, jak dobrze jest wyważona.

Sprawdzanie zależności dwu mierzonych wartości

Mając dwie serie pomiarów $x_{i}$ i $y_{i},$ a także teoretyczną zależność $y=f(x),$ można określić dzięki testowi chi-kwadrat na ile ta zależność pasuje do danych doświadczalnych. Przyjmując, że wartość błędu x jest zaniedbywalna i $\sigma _{i}$ jako błąd wartości $y_{i}$

\chi ^{2}=\sum _{i=1}^{n}\left({\frac {y_{i}-f(x_{i})}{\sigma _{i}}}\right)^{2}.

Normalizacja

Wartość zredukowanego testu chi-kwadrat wynosi

{\widehat {\chi ^{2}}}={\frac {1}{d}}\chi ^{2},

d=n-c-1

– liczba stopni swobody,

gdzie $c$ to liczba parametrów modelu teoretycznego szacowanych na podstawie danych pomiarowych. Może to być np. średnia, dyspersja, parametr funkcji $f(x)$ czy całkowita liczba pomiarów. Można udowodnić, że nieznormalizowany test chi-kwadrat ma oczekiwaną wartość $d,$ zatem test unormowany powinien wynosić 1. Widać także, że liczba pomiarów powinna być większa od liczby szacowanych parametrów. Okazuje się, że za pomocą testu chi-kwadrat można potwierdzić każdą teorię o dostatecznie dużej liczbie parametrów.

W poprzednim przykładzie, aby obliczyć wartość oczekiwaną należy pomnożyć rozkład przez liczbę rzutów, przyjąć $c=0$ (nie szacujemy żadnych parametrów modelu); wtedy $d=4-0-1=3.$

Interpretacja

Otrzymaną wartość znormalizowanego testu ocenia się za pomocą rozkładu chi kwadrat. Polega to na obliczeniu prawdopodobieństwa otrzymania wartości testu równej lub większej, niż otrzymanej przez nas. Ponieważ takie obliczenia są dość skomplikowane, najczęściej korzysta się z danych zamieszczonych w odpowiednich tablicach.

Mając odpowiednie prawdopodobieństwo, należy określić jego najmniejszą wartość, dla której jesteśmy w stanie zaakceptować hipotezę jako prawdę. Przyjmuje się te wartości różnie. Okazuje się, że zbyt duże prawdopodobieństwo także świadczy o złym wyniku (lub o wyniku nieuczciwym). Wynika to z faktu, że dane podlegają pewnemu rozkładowi, więc bardzo mało prawdopodobne jest, aby wszystkie otrzymane wyniki tak dobrze pasowały do modelu teoretycznego.

Zastosowania

Test $\chi ^{2}$ jest najważniejszym testem nieparametrycznym. Znajduje zastosowania w rachunku błędu pomiarowego w naukach przyrodniczych, technicznych i naukach społecznych. Jest to jeden z najczęściej stosowanych w naukach społecznych testów istotności statystycznej^[4].

Przypisy

↑ JacekJ. Koronacki JacekJ., JanJ. Mielniczuk JanJ., Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, ISBN 978-83-204-3242-8 [dostęp 2024-05-28] .
↑ Amir D.A.D. Aczel Amir D.A.D. i inni, Statystyka w zarządzaniu, Wydanie 2, Warszawa: Wydawnictwo Naukowe PWN, 2018, ISBN 978-83-01-19510-6 [dostęp 2024-05-28] .
↑ SheldonS. Zedeck SheldonS. (red.), APA dictionary of statistics and research methods, First edition, Washington, DC: American Psychological Association, 2014, ISBN 978-1-4338-1533-1 [dostęp 2024-05-28] .
↑ Earl Babbie: Badania społeczne w praktyce. Warszawa: Wydawnictwo Naukowe PWN, 2007, s. 508.

Bibliografia

John R. Taylor, Wstęp do analizy błędu pomiarowego.

Linki zewnętrzne

[1] JacekJ. Koronacki JacekJ., JanJ. Mielniczuk JanJ., Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, ISBN 978-83-204-3242-8 [dostęp 2024-05-28] .

[2] Amir D.A.D. Aczel Amir D.A.D. i inni, Statystyka w zarządzaniu, Wydanie 2, Warszawa: Wydawnictwo Naukowe PWN, 2018, ISBN 978-83-01-19510-6 [dostęp 2024-05-28] .

[3] SheldonS. Zedeck SheldonS. (red.), APA dictionary of statistics and research methods, First edition, Washington, DC: American Psychological Association, 2014, ISBN 978-1-4338-1533-1 [dostęp 2024-05-28] .

[4] Earl Babbie: Badania społeczne w praktyce. Warszawa: Wydawnictwo Naukowe PWN, 2007, s. 508.

[1]

[2]

[3]

[4]