Jak dokonujemy analizy ankiety?
Niniejsza strona ma na celu, pokazanie naszego sposobu opracowywania Państwa ankiet. Jeśli są Państwo zainteresowani naszymi usługami zapraszamy do działu kontakt. Potrzebne dane kontaktowe dostępne są również w bocznym panelu strony.
Na potrzeby tej prezentacji stworzyliśmy krótką ankietę, którą możecie Państwo pobrać tutaj. Wykonaliśmy na podstawie tej ankiety bazę danych, prawidłowy sposób wykonania takiej bazy przedstawiliśmy tutaj.
Na samym początku dokonujemy tzw. analizy grupy badawczej, czyli opracowujemy dane zawarte w metryczce ankiety. Dane z metryczki ankiety to różnego typu zmienne. Mogą się tam znajdować zmienne nominalne np. płeć, zmienne porządkowe np. wykształcenie, czy zmienne ilościowe, mierzalne takie jak wiek, wzrost ankietowanego. Każdą z tych zmiennych można zaprezentować w różny sposób.
Na początku zajmiemy się zmienną nominalną, która składa się z dwóch odpowiedzi np. płeć. Najprostszy sposób to pokazanie częstości odpowiedzi w postaci tabeli:
Rozkład zmiennej płeć
Analizowana grupa badawcza liczyła 100 osób, udział kobiet i mężczyzn był taki sam i wynosił 50%. W tabeli mamy trzy kolumny z danymi, pierwsza informuję nas ile osób znalazło się w danej grupie, druga kolumna informuję nas jaki to stanowiło udział procentowy z pośród wszystkich ankietowanych. Czasami ankietowany nie udziela odpowiedzi na dane pytanie, jest to tzw. brak danych. Jaki był procent osób w danej grupie, z pośród osób które udzieliło odpowiedzi, bez braków danych informuję nas kolumna trzecia – procent ważnych. Ponieważ wszyscy ankietowani udzielili odpowiedzi, procent jest identyczny jak w kolumnie trzeciej.
Innym sposobem prezentowania rozkładu częstości odpowiedzi, bardziej efektowanym, jest sporządzenie wykresu. W przypadku pytań składających się z dwóch odpowiedzi, najbardziej odpowiednim wykresem jest wykres kołowy. Poniżej prezentujemy kilka wykresów, sporządzonych przez nas. Wykresy wykonane są w programie SPSS. Proszę je przejrzeć i prosimy wybrać typ wykresu i jego kolorystykę.
Rozkład zmiennej płeć
Zmienne porządkowe i nominalne zawierające więcej niż dwie odpowiedzi, warto przedstawić już na wykresach słupkowych. Kilka przykładów takich wykresów przedstawiamy poniżej.
Rozkład zmiennej miejsce zamieszkania
Należy pamiętać, że w pracy naukowej, należy zdecydować się na jeden typ prezentowania tych samych danych, unikamy powtarzania informacji. Jeżeli zdecydowaliśmy się na prezentację w formie wykresu, przedstawienie tych samych danych formie tabeli jest zbędnym powtórzeniem.
Inaczej prezentowane są dane ankietowe, pochodzące ze zmiennych ilościowych. Wyniki należy pokazać w formie tabelarycznej, przedstawiając miary tendencji centralnej oraz rozproszenia – średnia, mediana, odchylenie standardowe, dominanta, wartość minimalna, maksymalna.
Miary tendencji centralnej i rozproszenia – wzrost ankietowanych
Podsumowując średni wzrost ankietowanych wynosił 154,5 cm, przy odchyleniu standardowym wynoszącym 22,67 cm. Co najmniej połowa respondentów mierzyła przynajmniej 149 cm, najczęściej podawaną wartością było 137 cm, a rozkład zmiennej kształtował się od 121 do 194 cm.
Dodatkowo całość można zobrazować za pomocą histogramu rozkładu zmiennej. Pokazuję on ile osób znajdowało się w danym przedziale wzrostu.
Histogram zmiennych ilościowych
Rozkład odpowiedzi w przypadku pytań wielokrotnego wyboru, można również zaprezentować na wykresach słupkowych. Inaczej niż w przypadku pytań jednokrotnego wyboru, jest liczony rozkład procentowy odpowiedzi. W przypadku zwykłych pytań suma procentów wynosić będzie 100%, w pytaniach wielokrotnego wyboru taka sytuacja nie nastąpi. Procent w tym przypadku jest liczony za każdym razem dla danej odpowiedzi.
Najczęściej spożywane napoje, możliwość wielokrotnego wyboru odpowiedzi
I tak na podstawie powyższego wykresu możemy odczytać, że z pośród wszystkich osób: 75% z nich piło mleko, 58% wodę, połowa soki niegazowane itd. Ponieważ respondenci mieli możliwość zaznaczenia kilku odpowiedzi, suma wartości procentowych nie wynosi 100%.
Podobnie można dokonać analizy częstości odpowiedzi na pozostałe pytania ankiety.
Właściwa analiza statystyczna ankiety
Na podstawie analizy rozkładu częstości odpowiedzi możemy sformułować już pierwsze wnioski na temat analizowanego tematu, przeważnie jednak taka wiedza jest niewystarczająca. Musimy poszukać czy między poszczególnymi zmiennymi są istotne statystycznie związki, korelacje. Czy daną zmienną różnicują jakieś inne czynniki. Musimy postawić hipotezy, a następnie je zweryfikować. Weryfikujemy hipotezy postawione przez klienta, w przypadku ich braku możemy sami je stworzyć.
W analizie ankiety najczęściej stosowane testy służące do zweryfikowania hipotez to test niezależności chi kwadrat, test t Studenta (lub nieparametryczne odpowiedniki), analiza wariancji, oraz korelacje. Na podstawie stworzonej ankiety i fikcyjnych danych, pokażemy jak ta analiza jest przez nas wykonana.
Na samym początku sprawdźmy czy płeć ankietowanego, jest w sposób statystycznie istotny związana ze stosowaniem diety. Obie zmienne to zmiennej nominalne i właściwym testem w tym przypadku, jest test niezależności chi kwadrat. W tym celu musimy wykonać tzw. tabelę krzyżową.
Stosowanie diety – z podziałem na płeć
Na podstawie powyższej tabeli, możemy zaobserwować, że z pośród osób stosujących dietę nieznacznie więcej było kobiet – 52%, dla porównania w grupie nie stosujących diety, więcej było mężczyzn 52%. Tabelę można odczytać jeszcze w inny sposób, wśród kobiet 54% z nich stosowało dietę, a wśród mężczyzn odsetek ten był mniejszy i wynosił 50%. To czy te różnicę są istotne statystycznie informuję nas ostatni wiersz tabeli, gdy wartość p jest mniejsza od 0,05 to możemy mówić o istotnym statystycznie związku. W naszym przypadku wartość p wynosi 0,689, czyli omawiane powyżej różnicę nie są istotne statystycznie. Nie istnieje związek między płcią ankietowanego, a stosowaniem przez niego diety.
Drugą hipotezę jaką chcemy sprawdzić to czy istnieją różnicę pomiędzy kobietami, a mężczyznami we wzroście. W celu weryfikacji tej hipotezy posłużymy się testem t Studenta. Należy pamiętać, że nie zawsze można skorzystać z tego testu, gdyż posiada on pewne założenia, które należy spełnić. Przed rozpoczęciem analizy zawsze sprawdzamy czy założenia te zostały spełnione.
Przed sprawdzeniem czy istnieją statystycznie istotne różnicę, wykonać należy tabelę z wartościami średnimi dla każdej grupy.
Wzrost ankietowanych [cm] – z podziałem na płeć
Średni wzrost kobiet wynosił 154,4 cm (odchylenie=21,02 cm), średni wzrost mężczyzn był nieznacznie większy i wynosił 154,5 cm. W celu sprawdzenia czy te różnicę są istotne statystycznie musimy zerknąć na ostatni wiersz tabeli, gdy wartość p jest mniejsza od 0,05 to możemy mówić o istotnych statystycznie różnicach. W naszym przypadku wartość p wynosi 0,983, czyli nie istnieją statystycznie istotne różnicę pomiędzy kobietami, a mężczyznami w ich wzroście.
Całość możemy dodatkowo zilustrować za pomocą wykresu przedstawiającego wartości średnie, wraz z 95% przedziałami ufności.
Średni wzrost ankietowanych, wraz z 95% przedziałami ufności, porównanie kobiet i mężczyzn
W celu stwierdzenia czy pomiędzy zmiennymi ilościowymi istnieją statystycznie istotne statystycznie korelacje, należy posłużyć się współczynnikiem korelacji Pearsona. Współczynnik ten przyjmuję wartości od +1 (silna korelacja dodatnia, wraz ze wzrostem jednej zmiennej, następuję wzrost drugiej zmiennej), poprzez 0 (brak korelacji) do –1 (silna korelacja ujemna, wzrost wartości jednej zmiennej, powodował spadek wartości drugiej zmiennej).
Związek między wzrostem, a masą ciała ankietowanych
W naszym przypadku możemy mówić o istotnym związku między wzrostem, a masą ciała (istotność mniejsza od 0,05. Współczynnik korelacji wynoszący 0,93 świadczy o dość silnym powiązaniu dodatnim, czyli wraz ze wzrostem ciała, rosła jego masa. Związek ten, dodatkowo można zilustrować za pomocą wykresu punktowego.
Związek między wzrostem, a masą ciała
To tylko część stosowanych przez nas testów, przedstawiliśmy tylko te, które są najczęściej wykorzystywane w trakcie analizy ankiety. Właściwie każda analiza oraz ankieta jest inna i za każdym razem do danego problemu musimy podejść inaczej. Jeżeli są Państwo zainteresowani naszą ofertą, proszę zajrzeć tutaj.