Slik fjerner rammer i SPSS

Slik fjerner rammer i SPSS


Uteliggere i statistiske analyser er ekstremverdier som ikke synes å passe med de fleste av et datasett. Hvis ikke fjernet, kan disse ekstreme verdiene har en stor effekt på noen konklusjoner som kan trekkes fra dataene i spørsmålet, fordi de kan forskyve korrelasjonskoeffisienter og linjer med best mulig passform i feil retning. SPSS er en av en rekke statistiske analyser programmer som kan brukes til å tolke et datasett og identifisere og fjerne avsidesliggende verdier.

Bruksanvisning

Utforskende data anaylsis

1 Klikk på "Analyze". Velg "Beskrivende statistikk" etterfulgt av "Utforsk".

2 Dra og slipp kolonner som inneholder de avhengige variable data inn i boksen merket "Dependent List." Klikk på "OK".

3 Fjern eventuelle uteliggere identifisert av SPSS i stilk-og-blad plott eller boksplott ved å slette de enkelte datapunkter. Alternativt kan du sette opp et filter for å utelukke disse datapunktene.

4 Velg "Data" og deretter "Velg Cases" og klikk på en tilstand som har uteliggere du ønsker å ekskludere. Bestem en verdi for denne tilstanden som ekskluderer bare uteliggere og ingen av de ikke-avsidesliggende datapunkter.

5 Velg "Hvis betingelsen er oppfylt" i "Velg" boksen og klikk deretter på "Om" -knappen rett under den. Oppgi regel å utelukke uteliggere som du bestemt i forrige trinn inn i boksen øverst til høyre. For eksempel, hvis du var unntatt målinger over 74,5 inches fra tilstanden "height" du ville komme inn "height <= 74,5." Klikk "Fortsett" og "OK" for å aktivere filteret.

Regresjonsanalyse

6 I "Analyze" -menyen, velg "Regression" og deretter "Linear". Velg de avhengige og uavhengige variablene du ønsker å analysere.

7 Klikk "Lagre" og velg deretter "Cooks Avstand." De beregnede for Cook avstand verdier vil bli lagret i datafilen som variabler merket "COO-en."

8 Kjør en boksplott ved å velge "Grafer" etterfulgt av "Boksplott". Klikk på "Simple" og velg "Sammendrag av separate variabler." Skriv "COO-1" inn i boksen merket "boksene representerer", og skriv deretter inn en ID eller navn etter å identifisere sakene i "Label Cases Med" boksen.

9 Utvid boksplott på resultatfilen ved å dobbeltklikke den. Lag et notat av saker som ligger utenfor de svarte linjene --- dette er dine uteliggere. Du kan velge å fjerne alle uteliggere eller bare ekstreme uteliggere, som er merket med en stjerne (*).

10 Gå tilbake til datafilen og finne saker som må slettes. Arbeide fra bunnen opp, markere tallet i den ytterste venstre, i den grå kolonnen, slik at hele raden er valgt. Klikk på "Edit" og velg "Clear". Gjenta dette trinnet for hver avvik du har identifisert fra boksplott.

Hint

  • Når du sletter tilfeller i punkt 2, trinn 5, alltid jobbe fra bunnen av datafil flytte opp fordi ID-numrene endres når du sletter en sak. Hvis du jobber fra toppen og ned, vil du ende opp med å slette feil tilfeller.