Test zgodności chi-kwadrat
Test zgodności chi-kwadrat (ang. Chi-square goodness of fit test) służy do sprawdzenia, czy rozkład empiryczny obserwowanych danych jest zgodny z rozkładem teoretycznym, który zakładamy.
W praktyce oznacza to odpowiedź na pytanie: czy odpowiedzi badanych rozkładają się tak, jak przewidywaliśmy?
Przykład zastosowania
Chcemy sprawdzić, czy studenci wybierają kierunki studiów zgodnie z proporcjami podawanymi w oficjalnych statystykach uczelni. Zakładamy, że 40% wybiera kierunek A, 35% kierunek B i 25% kierunek C. Test zgodności chi-kwadrat pozwoli ocenić, czy w próbie z ankiety faktycznie występuje taki rozkład.
| Kierunek | Wartości obserwowane | Wartości oczekiwane |
| A | 60 | 40 |
| B | 20 | 35 |
| C | 20 | 25 |
Warunki stosowania
Interpretacja
W naszym przypadku najczęściej wybieranym kierunkiem przez studentów (wartości obserwowane) był kierunek A (60%), natomiast pozostałe dwa kierunki miały taki sam odsetek wyboru. Według statystyk uczelnianych (wartości oczekiwane) najczęściej wybierany kierunek to również kierunek A, ale przeszacowany, w porównaniu do danych rzeczywistych, został wybór kierunku B i C. Naszym celem jest sprawdzenie czy omawiana różnica jest statystycznie istotna.
Po dokonaniu obliczeń wartość statystyki chi kwadrat wynosiła 17,43, przy poziomie p < 0,001.
Jeżeli wartość p < 0,05 → odrzucamy hipotezę zerową i uznajemy, że dane odbiegają od zakładanego rozkładu.
W naszym analizowanym przykładzie wartość p była jeszcze mniejsza (<0,001), dlatego odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną, że studenci wybierali kierunki studiów inaczej niż wg oficjalnych prognoz.
Dlaczego to ważne w analizie ankiet?
Test zgodności pozwala sprawdzić, czy wyniki ankiety odbiegają od założeń (np. czy rozkład opinii w badanej próbie odpowiada proporcjom w populacji). Na przykład czy jakaś odpowiedź respondentów w pytaniu ankietowym, była zaznaczana istotnie częściej.