Hvordan komprimere en sekvensiell datasett i SAS

Hvordan komprimere en sekvensiell datasett i SAS


SAS "komprimere =" alternativer "presse ut" og fjern tomme mellomrom fra datasett for å redusere observasjoner til to- eller tre-byte representasjoner og redusere den totale filstørrelsen for datasettet. To fremgangsmåter for sekvensiell datasettet kompresjon oppstår i SAS: innenfor en "DATA" og "UT =" prosedyre trinn eller på systemnivå. DATA skritt komprimering SAS vil komprimere tegndata i en individuell datatabellen. System komprimering vil redusere størrelsen på alle nyopprettede datasett.

Bruksanvisning

datasett nivå

1 Åpne SAS program i SAS program editor. Finn den enkelte datasett som å bruke kompresjon.

2 Påfør COMPRESS = alternativet innen utgangen DATA uttalelse, ved hjelp av følgende syntaks:

DATA MyTestSet (COMPRESS = YES);
SET MyInitialSet;
LØPE;

3 Påfør COMPRESS = alternativet i "OUT =" mulighet for en SAS prosedyre ved å bruke følgende syntaks:

PROC SORT DATA = MyInitialSet OUT = MyTestSet (COMPRESS = YES); BY ID1; LØPE;

4 Utfør programlinjer. Sjekk SASLOG for resultatene av DATA eller SAS prosedyre trinn.

systemnivå

5 Åpne SAS program i SAS program editor.

6 Påfør COMPRESS = opsjon i den globale nivået på toppen av programmet i en "Options" statement, med følgende syntaks:

ALTERNATIVER komprimere = JA;

7 Utfør programlinjer. Sjekk SAS logg etter en DATA skritt for å kontrollere at komprimering har funnet sted.

Hint

  • Den COMPRESS = alternativet fungerer effektivt for store datasett og for tegntypedata. Les notatet i SASLOG utdatafilen å avgjøre om størrelsen reduksjoner rettferdiggjøre komprimering alternativer, og foreta justeringer i SAS-programmet deretter.
  • Tenk hvor ofte den komprimerte datasettet vil nås før påføring komprimering. Mens komprimering kan redusere filstørrelsen, kan det også kreve ekstra CPU tid å behandle, samt ekstra tid å kode inn i programmet.