Hvordan bruke indikatorvariablene i Minitab Multippel Regresjon

Hvordan bruke indikatorvariablene i Minitab Multippel Regresjon


En multippel regresjon er en statistisk fremgangsmåte som forsøker å forutsi verdien av en variabel basert på verdiene av andre. Fordi det kan bare analysere numeriske data, noen ganger kategoriske variablene er kodet inn tall - men dette er feil fordi kategoriske variabler er vanligvis ikke sammenhengende. For eksempel kan rød, blå og grønn kodes som en, to og tre; men grønt er ikke "høyere" enn blå. I stedet bør indikator variable benyttes.

Bruksanvisning

1 Laste opp Minitab, klikk på "File" og deretter "Open Project." Bla til plasseringen av dataene på harddisken på datamaskinen, og dobbeltklikk på den for å laste det inn Minitab.

2 Klikk "Calc" fra menylinjen, og klikk deretter på "Make indikatorvariablene." Dobbeltklikk på kolonnen som inneholder kategorisk variabel fra listen til venstre. De "Lagre indikatorvariablene i kolonner" seksjonen vil fylle ut med en ny kolonne for hvert nivå av denne kategorien. Så hvis du har rød, blå og grønn, får du tre nye kolonner. Klikk "OK" når du er ferdig.

3 Sjekk regnearkvinduet for de nye kolonnene. Du vil se at de har en rekke nuller og enere i dem, noe som indikerer hvilket nivå hver rad med data er i. Hvis en rad er kategorisert i "røde", for eksempel, vil det ha "1" i den nye rød søyle og "0" i den blå og grønne søyler. Merk navnene på disse kolonnene.

4 . Klikk på "Stat", "Regression" og deretter "Regression" Klikk i "Response" boksen, og deretter dobbeltklikker du på responsvariabelen - den du tar sikte på å forutsi.

5 Klikk i "Prediktorer" boksen. For å legge inn indikatorvariabler, dobbeltklikker alle unntatt én av de nye indikatoren variable kolonner. Det spiller ingen rolle hvilken variabel du ikke skriver inn, og du vil få de samme resultatene. Dette er fordi de er nivåer av en variabel, ikke variabler i seg selv, slik at Minitab kan beregne det endelige nivå verdi ved hjelp av verdiene av de andre. For eksempel, hvis en datapunkt er ikke rød eller blå, må det være grønn.

6 Klikk "OK" for å kjøre regresjon.

Hint

  • Variabelen du ikke velger i trinn fem kalles "base gruppen." Hvis du ønsker å vite bakkene i hvert nivå individuelt, se på regresjonsresultatene i Session vinduet under "COEF" kolonnen. Du vil se verdiene for "Konstant", etterfulgt av verdier for alle nivåer du valgte. "Konstant" er verdien av nivået man ikke velger, og for å få de andre bare trekker noterte verdi fra den som er oppført for konstant. For eksempel, hvis konstant er 40 og rødt er 10, helningen for rødt er 40-10 = 30.