Test chi-kwadrat – każdy test statystyczny, w którym statystyka testowa ma rozkład chi kwadrat. Test chi-kwadrat służy weryfikacji hipotez mówiących o niezależności zmiennych lub zgodności rozkładu z założeniami. Wyróżnia się między innymi test zgodności chi-kwadrat (ang. goodness-of-fit chi-squared test), test chi-kwadrat niezależności (ang. independence) i test jednorodności (ang. homogeneity) chi-kwadrat[1][2][3].

W ogólności zachodzi:

 

gdzie:

  – wartość mierzona,
  – wartość teoretyczna (oczekiwana) wynikająca z hipotezy odpowiadająca wartości mierzonej,
 odchylenie standardowe,
  – liczba pomiarów.

Zliczenia

edytuj

W szczególności, gdy wartościami są zliczenia, wtedy ich odchylenie standardowe wynosi   i równanie przechodzi na:

 

Uwagi:

  • Przyjmuje się, że wartość   powinna być większa lub równa 5 (spotyka się też 10 – nie ma ścisłego wyprowadzenia minimalnej wielkości).
    • Czasem z tego powodu przy pomiarach wartości dyskretnych łączy się te wartości w jeden przedział (patrz przykład).
  • Przy pomiarze wartości ciągłej wartość teoretyczna to całka z rozkładu prawdopodobieństwa po odpowiednim przedziale z którego zliczane były wyniki.
Przykład

Rozpatrzmy rzut pięcioma kośćmi i liczbę wyrzuconych szóstek   Może ona przyjmować wartości 0,1,2,3,4,5, nie widać więc potrzeby dzielenia tych wielkości na przedziały. Rzut został powtórzony 200 razy, wartości teoretyczne dla takiej liczby rzutów przedstawione są w tabeli, w kolumnie   Widać, że dla   są to wartości bardzo małe, dlatego też należy stworzyć nowe przedziały, tak aby w każdym wartość teoretyczna była większa od 5. Przedstawione jest to w tabeli, oznaczone są one przez  

       
0 80,4 0 80,4
1 80,4 1 80,4
2 32,2 2 32,2
3 6,4 3 7,0
4 0,6
5 0,03

Mając dane z rzutów można obliczyć ich zgodność z rozkładem teoretycznym (tutaj jest to rozkład dwumianowy  ). W praktyce byłby to test kości na to, jak dobrze jest wyważona.

Sprawdzanie zależności dwu mierzonych wartości

edytuj

Mając dwie serie pomiarów   i   a także teoretyczną zależność   można określić dzięki testowi chi-kwadrat na ile ta zależność pasuje do danych doświadczalnych. Przyjmując, że wartość błędu x jest zaniedbywalna i   jako błąd wartości  

 

Normalizacja

edytuj

Wartość zredukowanego testu chi-kwadrat wynosi

 
   – liczba stopni swobody,

gdzie   to liczba parametrów modelu teoretycznego szacowanych na podstawie danych pomiarowych. Może to być np. średnia, dyspersja, parametr funkcji   czy całkowita liczba pomiarów. Można udowodnić, że nieznormalizowany test chi-kwadrat ma oczekiwaną wartość   zatem test unormowany powinien wynosić 1. Widać także, że liczba pomiarów powinna być większa od liczby szacowanych parametrów. Okazuje się, że za pomocą testu chi-kwadrat można potwierdzić każdą teorię o dostatecznie dużej liczbie parametrów.

W poprzednim przykładzie, aby obliczyć wartość oczekiwaną należy pomnożyć rozkład przez liczbę rzutów, przyjąć   (nie szacujemy żadnych parametrów modelu); wtedy  

Interpretacja

edytuj

Otrzymaną wartość znormalizowanego testu ocenia się za pomocą rozkładu chi kwadrat. Polega to na obliczeniu prawdopodobieństwa otrzymania wartości testu równej lub większej, niż otrzymanej przez nas. Ponieważ takie obliczenia są dość skomplikowane, najczęściej korzysta się z danych zamieszczonych w odpowiednich tablicach.

Mając odpowiednie prawdopodobieństwo, należy określić jego najmniejszą wartość, dla której jesteśmy w stanie zaakceptować hipotezę jako prawdę. Przyjmuje się te wartości różnie. Okazuje się, że zbyt duże prawdopodobieństwo także świadczy o złym wyniku (lub o wyniku nieuczciwym). Wynika to z faktu, że dane podlegają pewnemu rozkładowi, więc bardzo mało prawdopodobne jest, aby wszystkie otrzymane wyniki tak dobrze pasowały do modelu teoretycznego.

Zastosowania

edytuj

Test   jest najważniejszym testem nieparametrycznym. Znajduje zastosowania w rachunku błędu pomiarowego w naukach przyrodniczych, technicznych i naukach społecznych. Jest to jeden z najczęściej stosowanych w naukach społecznych testów istotności statystycznej[4].

Przypisy

edytuj
  1. Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, ISBN 978-83-204-3242-8 [dostęp 2024-05-28].
  2. Amir D. Aczel i inni, Statystyka w zarządzaniu, Wydanie 2, Warszawa: Wydawnictwo Naukowe PWN, 2018, ISBN 978-83-01-19510-6 [dostęp 2024-05-28].
  3. Sheldon Zedeck (red.), APA dictionary of statistics and research methods, First edition, Washington, DC: American Psychological Association, 2014, ISBN 978-1-4338-1533-1 [dostęp 2024-05-28].
  4. Earl Babbie: Badania społeczne w praktyce. Warszawa: Wydawnictwo Naukowe PWN, 2007, s. 508.

Bibliografia

edytuj
  • John R. Taylor, Wstęp do analizy błędu pomiarowego.

Linki zewnętrzne

edytuj