Hvordan lese Output av SPSS K-Means

Hvordan lese Output av SPSS K-Means


Clustering analyse er en statistisk teknikk som brukes til å ordne tilfeller i kategorier, slik at de tilfeller i hver kategori er lik hverandre og forskjellig fra tilfelle i andre kategorier. Hver kategori er en klynge. Samfunnsvitere bruker SPSS (Statistical Package for Social Sciences) til å gjennomføre klyngeanalyser. I k-means forskeren angir antall klynger ønsket. K er antall klynger forskere indikerer de ønsker. K-means tillater forskere å klynge svært store datasett.

Bruksanvisning

analysere data

1 Klikk på "Analyze" øverst th SPSS skjermen. Velg "Gi" fra drop-down menyen og "K-Means Cluster."

2 Velg et utvalg av saker. I dialogboksen, klikk på "variabler" og fremheve de variablene du ønsker å bruke i den første K-Means analyse. Klikk på pilen til venstre for å flytte variablene inn i boksen. Sett antall klynger, vanligvis fem i en gjennomsnittlig størrelse datasett, i boksen "Number of Clusters". Antallet grupper må være mer enn to og ikke mer enn det antall tilfeller. Klikk på "Iterate og klassifisere" i dialogboksen for å få klase sentre. Klikk på "Skriv finalen."

3 Omfatte hele datafilen for den endelige K-Means analyse. Klikk på "Analyser" på toppen av SPSS skjermen. Velg "Gi" fra drop-down menyen og "K-Means Cluster." I dialogboksen velger du "variabler" og fremheve de variablene du ønsker å bruke. Klikk på pilen til venstre. Angi antall klynger på 5 i boksen "Number of Clusters". Klikk på "Gi" i dialogboksen. Velg "Les Initial" for å få klynge sentre fra prøven i trinn 2. Klikk på "Lagre". Klikk på "Cluster medlemskap." Klikk på "Fortsett".

Les Output

4 Gjennomgå den første tabellen i produksjon, merket "Endelige Cluster Centers." Toppen av tabellen er tallene 1 til 5 over det, noe som indikerer hver av de 5 klynger. Den venstre kolonnen viser "REGR faktor poengsum" (Regression faktor poengsum eller hvor godt hver variabel spår score) for hver av analysene. Hvis du følger linjen ved siden av partituret en for analyse 1 til høyre, vil det gi deg den faktoren poengsum for hver klynge.

5 Les neste tabell i produksjonen ledet "antall tilfeller i hvert Cluster." Boksen til venstre viser klynger av tall, en gjennom 5. Følg Cluster tallet til høyre, og du vil finne antall tilfeller i den klyngen.

6 Se på den siste tabellen i produksjon, "Cluster medlemskap", som viser hvilke saker som i hver klynge. Sakene er listet i den venstre kolonnen og klyngen -nummeret i kolonnen til høyre.

Hint

  • Fjern uteliggere før du utfører analysene.