Hvordan komprimere en sekvensiell datasett i SAS
SAS "komprimere =" alternativer "presse ut" og fjern tomme mellomrom fra datasett for å redusere observasjoner til to- eller tre-byte representasjoner og redusere den totale filstørrelsen for datasettet. To fremgangsmåter for sekvensiell datasettet kompresjon oppstår i SAS: innenfor en "DATA" og "UT =" prosedyre trinn eller på systemnivå. DATA skritt komprimering SAS vil komprimere tegndata i en individuell datatabellen. System komprimering vil redusere størrelsen på alle nyopprettede datasett.
Bruksanvisning
datasett nivå
1 Åpne SAS program i SAS program editor. Finn den enkelte datasett som å bruke kompresjon.
2 Påfør COMPRESS = alternativet innen utgangen DATA uttalelse, ved hjelp av følgende syntaks:
DATA MyTestSet (COMPRESS = YES);
SET MyInitialSet;
LØPE;
3 Påfør COMPRESS = alternativet i "OUT =" mulighet for en SAS prosedyre ved å bruke følgende syntaks:
PROC SORT DATA = MyInitialSet OUT = MyTestSet (COMPRESS = YES); BY ID1; LØPE;
4 Utfør programlinjer. Sjekk SASLOG for resultatene av DATA eller SAS prosedyre trinn.
systemnivå
5 Åpne SAS program i SAS program editor.
6 Påfør COMPRESS = opsjon i den globale nivået på toppen av programmet i en "Options" statement, med følgende syntaks:
ALTERNATIVER komprimere = JA;
7 Utfør programlinjer. Sjekk SAS logg etter en DATA skritt for å kontrollere at komprimering har funnet sted.
Hint
- Den COMPRESS = alternativet fungerer effektivt for store datasett og for tegntypedata. Les notatet i SASLOG utdatafilen å avgjøre om størrelsen reduksjoner rettferdiggjøre komprimering alternativer, og foreta justeringer i SAS-programmet deretter.
- Tenk hvor ofte den komprimerte datasettet vil nås før påføring komprimering. Mens komprimering kan redusere filstørrelsen, kan det også kreve ekstra CPU tid å behandle, samt ekstra tid å kode inn i programmet.