Test chi-kwadrat
Test chi-kwadrat – każdy test statystyczny, w którym statystyka testowa ma rozkład chi kwadrat. Test chi-kwadrat służy weryfikacji hipotez mówiących o niezależności zmiennych lub zgodności rozkładu z założeniami. Wyróżnia się między innymi test zgodności chi-kwadrat (ang. goodness-of-fit chi-squared test), test chi-kwadrat niezależności (ang. independence) i test jednorodności (ang. homogeneity) chi-kwadrat[1][2][3].
W ogólności zachodzi:
gdzie:
- – wartość mierzona,
- – wartość teoretyczna (oczekiwana) wynikająca z hipotezy odpowiadająca wartości mierzonej,
- – odchylenie standardowe,
- – liczba pomiarów.
Zliczenia
edytujW szczególności, gdy wartościami są zliczenia, wtedy ich odchylenie standardowe wynosi i równanie przechodzi na:
Uwagi:
- Przyjmuje się, że wartość powinna być większa lub równa 5 (spotyka się też 10 – nie ma ścisłego wyprowadzenia minimalnej wielkości).
- Czasem z tego powodu przy pomiarach wartości dyskretnych łączy się te wartości w jeden przedział (patrz przykład).
- Przy pomiarze wartości ciągłej wartość teoretyczna to całka z rozkładu prawdopodobieństwa po odpowiednim przedziale z którego zliczane były wyniki.
- Przykład
Rozpatrzmy rzut pięcioma kośćmi i liczbę wyrzuconych szóstek Może ona przyjmować wartości 0,1,2,3,4,5, nie widać więc potrzeby dzielenia tych wielkości na przedziały. Rzut został powtórzony 200 razy, wartości teoretyczne dla takiej liczby rzutów przedstawione są w tabeli, w kolumnie Widać, że dla są to wartości bardzo małe, dlatego też należy stworzyć nowe przedziały, tak aby w każdym wartość teoretyczna była większa od 5. Przedstawione jest to w tabeli, oznaczone są one przez
0 | 80,4 | 0 | 80,4 |
1 | 80,4 | 1 | 80,4 |
2 | 32,2 | 2 | 32,2 |
3 | 6,4 | 3 | 7,0 |
4 | 0,6 | ||
5 | 0,03 |
Mając dane z rzutów można obliczyć ich zgodność z rozkładem teoretycznym (tutaj jest to rozkład dwumianowy ). W praktyce byłby to test kości na to, jak dobrze jest wyważona.
Sprawdzanie zależności dwu mierzonych wartości
edytujMając dwie serie pomiarów i a także teoretyczną zależność można określić dzięki testowi chi-kwadrat na ile ta zależność pasuje do danych doświadczalnych. Przyjmując, że wartość błędu x jest zaniedbywalna i jako błąd wartości
Normalizacja
edytujWartość zredukowanego testu chi-kwadrat wynosi
gdzie to liczba parametrów modelu teoretycznego szacowanych na podstawie danych pomiarowych. Może to być np. średnia, dyspersja, parametr funkcji czy całkowita liczba pomiarów. Można udowodnić, że nieznormalizowany test chi-kwadrat ma oczekiwaną wartość zatem test unormowany powinien wynosić 1. Widać także, że liczba pomiarów powinna być większa od liczby szacowanych parametrów. Okazuje się, że za pomocą testu chi-kwadrat można potwierdzić każdą teorię o dostatecznie dużej liczbie parametrów.
W poprzednim przykładzie, aby obliczyć wartość oczekiwaną należy pomnożyć rozkład przez liczbę rzutów, przyjąć (nie szacujemy żadnych parametrów modelu); wtedy
Interpretacja
edytujOtrzymaną wartość znormalizowanego testu ocenia się za pomocą rozkładu chi kwadrat. Polega to na obliczeniu prawdopodobieństwa otrzymania wartości testu równej lub większej, niż otrzymanej przez nas. Ponieważ takie obliczenia są dość skomplikowane, najczęściej korzysta się z danych zamieszczonych w odpowiednich tablicach.
Mając odpowiednie prawdopodobieństwo, należy określić jego najmniejszą wartość, dla której jesteśmy w stanie zaakceptować hipotezę jako prawdę. Przyjmuje się te wartości różnie. Okazuje się, że zbyt duże prawdopodobieństwo także świadczy o złym wyniku (lub o wyniku nieuczciwym). Wynika to z faktu, że dane podlegają pewnemu rozkładowi, więc bardzo mało prawdopodobne jest, aby wszystkie otrzymane wyniki tak dobrze pasowały do modelu teoretycznego.
Zastosowania
edytujTest jest najważniejszym testem nieparametrycznym. Znajduje zastosowania w rachunku błędu pomiarowego w naukach przyrodniczych, technicznych i naukach społecznych. Jest to jeden z najczęściej stosowanych w naukach społecznych testów istotności statystycznej[4].
Przypisy
edytuj- ↑ Jacek Koronacki , Jan Mielniczuk , Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, ISBN 978-83-204-3242-8 [dostęp 2024-05-28] .
- ↑ Amir D. Aczel i inni, Statystyka w zarządzaniu, Wydanie 2, Warszawa: Wydawnictwo Naukowe PWN, 2018, ISBN 978-83-01-19510-6 [dostęp 2024-05-28] .
- ↑ Sheldon Zedeck (red.), APA dictionary of statistics and research methods, First edition, Washington, DC: American Psychological Association, 2014, ISBN 978-1-4338-1533-1 [dostęp 2024-05-28] .
- ↑ Earl Babbie: Badania społeczne w praktyce. Warszawa: Wydawnictwo Naukowe PWN, 2007, s. 508.
Bibliografia
edytuj- John R. Taylor, Wstęp do analizy błędu pomiarowego.