Hvordan bruke en Chi Square

To sentrale spørsmål i mange typer forskning er om to variabler er korrelert, og hvis så, styrken (eller betydning) av dette forholdet. Er det en signifikant sammenheng, for eksempel mellom kjønn eller etnisitet og politisk tilhørighet? Chi-kvadrat test er en mye brukt metode for å måle om en signifikant sammenheng mellom to nominelle eller kategoriske variabler, som kjønn og politisk tilhørighet.

Bruksanvisning

1 Begynn med en hypotese før du starter dataanalyse. En vanlig hypotese i mye forskning er at det ikke er noen korrelasjon mellom de to variablene av interesse. Den chi (rhymes med "mine") kvadrat test måler nivået av avvik fra en gitt hypotese. Jo større kji-kvadrat statistikk, passer mindre godt hypotesen dataene. For eksempel at vi ser på et sett av data som spurte 125 registrerte velgere (65 kvinner og 60 menn) sin politiske partitilhørighet (Democratic eller republikaner). Anta at vi vet fra tidligere forskning at 55 prosent av velgerne identifiserte seg som demokrater. Vår arbeidshypotese er at dette 55 prosent vil bli jevnt fordelt mellom menn og kvinner.

2 Beregn de forventede verdier basert på en hypotese modell av politisk tilhørighet etter kjønn. Basert på 125 velgere, forventer vi at 55 prosent (69 velgere) vil identifisere seg som demokrater. Etter kjønn, forventer vi at 36 kvinner og 33 menn vil uttrykke en preferanse for det demokratiske partiet, slik at 29 kvinner og 27 menn som favoriserer det republikanske partiet. Organiser dine data i en to-by-2 matrise (to rader og to kolonner). La partitilhørighet være kolonnevariabler og kjønn de være rekke variabler.

3 Sammenligne de faktiske verdiene fra dine data med de forventede verdiene du anslått i trinn 2. For dette eksempelet, la oss si at blant de 65 kvinnene, identifiserte 44 prosent seg som demokrater og 21 som republikanerne, mens 36 menn hevdet en demokratisk tilhørighet og 24 foretrekkes det republikanske partiet.

4 Beregn chi-kvadrat statistikk, som er summen av de kvadrerte forskjeller mellom de observerte og forventede verdier (også kjent som residualene), delt på de forventede verdiene. Du trenger dette for de fire mulige kombinasjoner av kjønn og politisk tilhørighet er angitt i modellen. Hvis du bruker en datamaskin, kan mange statistiske og regnearkprogrammer beregne chi-kvadrat statistikk for deg. I vårt eksempel summen av kvadrerte differensialer delt på forventede verdier er 4.59.

5 Finn ut om chi-kvadrat statistikk du beregnet i trinn 4 er statistisk signifikant. For å gjøre dette, må du vite to ting: grader av frihet og signifikansnivået. Frihetsgrader er antall rader i tabellen minus en, ganger antall kolonner minus én. Signifikansnivå refererer til muligheten for at den observerte korrelasjon kunne ha oppstått tilfeldig alene. Mange forskere foretrekker en 0,05 betydning nivå, noe som betyr at det er bare en fem prosent sannsynlighet for at den observerte sammenhengen er en ren tilfeldighet. I vårt eksempel har vi bare en grad av frihet. Bruke statistikk bok (vanligvis i vedlegget), slå opp chi-kvadrat verdien som tilsvarer signifikansnivået og frihetsgrader. For vårt eksempel, den chi-kvadrat verdi for en grad av frihet og 0,05 signifikansnivå er 3,84. Vår verdi på 4,59 er større, noe som betyr at det er en statistisk signifikant sammenheng mellom kjønn og politisk tilhørighet, med kvinner blir betydelig større sannsynlighet for å identifisere seg som demokrater.

Hint

  • Husk at statistisk signifikans er ikke det samme som vesentlige betydning. Chi-kvadrat verdier angir sannsynligheten for at en observerte forhold mellom to nominelle størrelser kunne ha skjedd bare ved en tilfeldighet.