Hva er overflødig data?

Hva er overflødig data?


Redundant data er en kostnad problem for mange organisasjoner som skal lagre det, klarer det, og sikkerhetskopiere den. Kostnads ​​øker over tid som volumet av overflødige data vokser. Du kan finne overflødige data på flere steder, og ikke alle overflødige data er dårlig. Hvert selskap må finne måter å eliminere de dårlige overflødige data og minimere de gode overflødige data.

databaser

Overflødige data refererer vanligvis til data som er lagret i databaser. Prosessen med data normalisering skiller data i ulike tabeller, med hvert bord lagring av bare den informasjon som er relevant for en bestemt kategori av data. For eksempel kan du skille kundens grunnleggende informasjon som navn og fødselsdato fra annen informasjon som adresser. Selv om det ikke er praktisk å eliminere alle overflødige data, er det best å fjerne så mye som mulig. Ytelses implikasjoner og lagringskostnader har direkte betydning for å oppnå en realistisk balanse.

E-post

E-postserveren er ofte en oversett oppbevaringssted for overflødige data. Hvis en ansatt sender en e-post med et stort regneark vedlegg til en annen ansatt, er dataene der en gang. Hvis den andre arbeidstakeren deretter sender den samme e-post til fem andre ansatte, eksisterer data nå opptil sju ganger. For å løse dette problemet, har flere programvareleverandører utviklet e-de-duplisering programvare som lagrer bare en kopi av vedlegget og setter koblinger i e-posten.

sikkerhetskopier

Hvis du tar nattlige sikkerhetskopier av hele databasen, kan du være å kaste bort backup tid samt tape. Noen backup ta et øyeblikksbilde av alle bedriftens data hver dag. Dette er overkill og ikke forbedre selskapets sikkerhet eller gjenoppretting holdning.
En mer effektiv backup plan tar en full backup en gang i uken eller en gang i måneden, med inkrementell backup i mellom. Inkrementell backup bare sikkerhetskopiere filer som er endret siden siste backup. Dette reduserer tape bruk og sparer tid.

datareplikering

Noen selskaper bevisst lagre en full kopi av sine kritiske databaser på en ekstern gjenopprettingsstedet. Dataene blir replikert over en nettverkskobling i sann tid, slik at i tilfelle av en katastrofe i den primære datasenteret dataene er umiddelbart tilgjengelig ved utvinning midten. Slik rehabilitering sentre er vanligvis kalles "hot områder." Strategisk database replikering kan også forbedre ytelsen for eksterne brukere av en database.