Teknikker for File Organization

Teknikker for File Organization


Fil organisasjon refererer til "logisk anordning" av poster, gjennom anvendelse av spesifikt korrelerte felt eller kolonner. En fil er egentlig en samling av poster som inneholder data, designet for å bli hentet en gang lagret. Hvor en fil er organisert avhenger av type og mengde av poster blir lagret; natur brukertilgang; så vel som hastigheten som det må hentes.

Heap File Organization

Heap (eller haug) fil organisasjon er en enkel teknikk, der postene er lagret etter ordre fra inngangen. Dette systemet har en "fast innsettingsoperasjon", som betyr at nye poster kan hurtig tilsatt til slutten av filen. Men å utføre et søk på en haug organisasjon har en tendens til å være tidkrevende siden det ofte innebærer å skanne en stor del av filen. En annen ulempe er at slettede poster ofte forlate hull i strukturen, noe som krever ekstra tid brukt på å eliminere plass.

Sekvensiell fil Organization

En vanlig teknikk for lagring av store filer, arrangerer en sekvensiell ordning poster i en strøm av sammenhengende blokker eller felter. Den sekvensielle rekkefølgen på postene bestemmes av input, som ikke kan endres når lagret. Størrelsen på et rekord er like fast og kan bare oppdateres ved å bli erstattet med en ny rekord på tilsvarende størrelse, som er lagt til på slutten av sekvensen. Ifølge IBM, er sekvensiell organisering nyttig for utskrift av rapporter og i tilfeller der rekkefølgen er ikke viktig. Men legge til og slette filer i dette systemet kan være en utfordring. En post kan bare nås når alle tidligere filer har blitt lest.

Hash File Organization

Beskrevet av Computer Science Department, University of Dublin, som en "black box", en hash organisasjon tilfeldig lagrer poster, men tildeler dem med en adresse slik at de kan hentes. Innenfor denne ordningen er det ingen "åpenbare" assosiasjon mellom nøkkelen og posten. Den største fordelen med en hash organisasjon er dens effektiv "gjenfinning ytelse." Men, det krever at indeksene holdes up-to-date, siden en korrupt indeks kan undergrave integriteten av dataene. En hash organisasjon krever også at en del av diskplass bli reservert til å beregne adresser.