Typer avgrenset filer

Typer avgrenset filer


Datafiler må ha en struktur for å tillate brukere å finne ut hva slags data de ser på. En måte å strukturere slike filer er å sette inn skilletegn mellom datafeltene og på slutten av oppføringer. Ulike typer filer har ulike skilletegn. Skilletegnet brukes, avhenger av hva slags data filen og datafeltene inneholder. Databaseprogrammer kan ofte gjenkjenne type avgrenset fil og konvertere den til standard skilletegn programmet bruker.

Grunnleggende filstruktur

Avgrenset filer inneholder data i felt og poster. Skilletegn angir hvilke data som hører sammen i et felt, og hvilke felt utgjør en rekord. Et felt er en individuell datapunkt mens en registrering er en samling av datapunkter som refererer til samme element. Et typisk eksempel er en kundeliste som har felt som viser navn, alder, adresse og telefonnummer. Disse feltene utgjør en registrering henviser til samme kunde. De fleste datafiler har én oppføring per linje, men separate felt med en rekke skilletegn.

Komma avgrenset filer

Den vanligste typen avgrenset fil er en fil med kommadelte-verdier eller CSV. Filene har en rekord per linje, og feltene har komma mellom dem. De fleste databaseprogrammer kan lese CSV-filer, konvertere dem til sin egen opprinnelige format og eksportere dem for bruk i andre programmer. Et sentralt problem for CSV-filer er inkludert data som inneholder komma. Databehandlere må enten fjerne de ekstra komma under datavalidering eller bruke ikke-standard work-arounds som omslutter banen i anførselstegn.

Tabulatordelt filer

Data med komplekse tekststruktur må ofte komma for å være forståelig. Av denne grunn, mange store databaser bruke andre enn komma skilletegn. Et populært alternativ er tabulatordelt eller tab-separert-verdi (TSV) fil. De fleste databaseprogrammer kan lese disse filene, og de har den fordelen at de genererer pene kolonner, med venstre side av dataene stilte opp, når du åpner dem i tekstbehandlere.

andre Skilletegn

De neste vanligste avgrenset filer er de som bruker kolon som skilletegn. Kolon lider av det samme problemet som komma hvis dataene inneholder kolon i sin tekst. Lignende andre alternative skilletegn er semikolon og mellomrom. Datafiler bruke disse skilletegn avhengig av om dataene inneholder skilletegn. Noen programmer lar deg velge hvilket som helst tegn som skilletegn for en bestemt fil, men disse filene er ikke kompatible med andre databaseprogrammer.