Test zgodności chi kwadrat
Strona główna -> Statystyka -> Test zgodności chi kwadrat

Test zgodności chi-kwadrat

Test zgodności chi-kwadrat (ang. Chi-square goodness of fit test) służy do sprawdzenia, czy rozkład empiryczny obserwowanych danych jest zgodny z rozkładem teoretycznym, który zakładamy.

W praktyce oznacza to odpowiedź na pytanie: czy odpowiedzi badanych rozkładają się tak, jak przewidywaliśmy?

Przykład zastosowania

Chcemy sprawdzić, czy studenci wybierają kierunki studiów zgodnie z proporcjami podawanymi w oficjalnych statystykach uczelni. Zakładamy, że 40% wybiera kierunek A, 35% kierunek B i 25% kierunek C. Test zgodności chi-kwadrat pozwoli ocenić, czy w próbie z ankiety faktycznie występuje taki rozkład.

Kierunek Wartości obserwowane Wartości oczekiwane
A 60 40
B 20 35
C 20 25

Warunki stosowania

  • Dane powinny być w postaci liczności (nie procentów).
  • Liczebności oczekiwane w każdej kategorii powinny być na tyle duże (zwykle ≥ 5), aby wynik był wiarygodny.

Interpretacja

  • Hipoteza zerowa: rozkład obserwowany = rozkład teoretyczny. W naszym przypadku zakładamy, że faktyczny wybór kierunków przez studentów był zgodny z oficjalnymi statystykami uczelni.
  • Hipoteza alternatywna: rozkłady różnią się istotnie. W naszym przypadku zakładamy, że studenci wybierali kierunki studiów inaczej niż to by wynikało z oficjalnych statystyk.

W naszym przypadku najczęściej wybieranym kierunkiem przez studentów (wartości obserwowane) był kierunek A (60%), natomiast pozostałe dwa kierunki miały taki sam odsetek wyboru. Według statystyk uczelnianych (wartości oczekiwane) najczęściej wybierany kierunek to również kierunek A, ale przeszacowany, w porównaniu do danych rzeczywistych, został wybór kierunku B i C. Naszym celem jest sprawdzenie czy omawiana różnica jest statystycznie istotna.

Po dokonaniu obliczeń wartość statystyki chi kwadrat wynosiła 17,43, przy poziomie p < 0,001.

Jeżeli wartość p < 0,05 → odrzucamy hipotezę zerową i uznajemy, że dane odbiegają od zakładanego rozkładu.

W naszym analizowanym przykładzie wartość p była jeszcze mniejsza (<0,001), dlatego odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną, że studenci wybierali kierunki studiów inaczej niż wg oficjalnych prognoz.

Dlaczego to ważne w analizie ankiet?

Test zgodności pozwala sprawdzić, czy wyniki ankiety odbiegają od założeń (np. czy rozkład opinii w badanej próbie odpowiada proporcjom w populacji). Na przykład czy jakaś odpowiedź respondentów w pytaniu ankietowym, była zaznaczana istotnie częściej.