Hvordan får du data Cluster av en Prøvetaking Distribution Nærmere Mean?

Hvordan får du data Cluster av en Prøvetaking Distribution Nærmere Mean?


Slutnings statistikk er prosessen med å beregne en variabel i en populasjon på grunnlag av kjente data fra et mindre utvalg av befolkningen. For nøyaktige beregninger skal gjøres, bør den midlere og fordeling av prøven være så nært som mulig til populasjonen som det er tatt. Det er flere tiltak du kan gjøre mot dette målet.

Bruksanvisning

1 Bruk en stor utvalgsstørrelse som tid og midler tillater. Hvis du bruker en mindre prøvestørrelse, er det mer sannsynlig at prøven vil klynge rundt en middelverdi som ikke representerer befolkningen din. Omvendt, jo større prøven er, jo større er sannsynligheten for at det vil statistisk sett sams befolkningen.

2 Bruk stikkprøvekontroll. Ideelt sett bør alle datapunkt i befolkningen har en lik sjanse for å havne i prøven. Hvis dette ikke er tilfelle, vil anslagene være partisk. For eksempel, hvis du ønsker å beregne gjennomsnittlig formue på folk i ditt land, og du bare samle inn eksempeldata fra den rikeste byen, vil prøve mest sannsynlig overvurdere befolkningen mener.

3 Fjern uteliggere. En avvikende er et datapunkt som ligger langt unna den viktigste klyngen. Selv om de representerer legitime datapunkter fra prøven din, kan det være lurt å fjerne dem i noen tilfeller, for eksempel når utvalgsstørrelsen er ganske liten, eller når en eller annen grunn må du bruke gjennomsnittet i stedet for et annet mål på sentraltendens som median . For eksempel, hvis din netto verdt Undersøkelsen omfattet 10 personer - 9 middelklassen, og Bill Gates - anslaget for gjennomsnittlig lønn er sannsynlig å bli oppblåst, slik at du kan motvirke dette ved å fjerne uteliggeren.