Datadeduplisering: Den ultimate guiden

Datadeduplisering: Den ultimate guiden

Vi hører ofte om datadeduplisering når vi blar gjennom anmeldelsessamlingene om de beste leverandørene av skysikkerhetskopiering på internett.Men hva er egentlig deduplisering?Begrepet er nevnt gjentatte ganger i ulike artikler, men ingen ser ut til å kunne forklare deduplisering fullt ut.

Det er derfor vi bestemte oss for å lage en artikkel for å bedre forklare hva som erdedupliseringOg gi folk svar om årsakene til mulige fordeler.Vi vil også diskutere de forskjellige typene og formene for deduplisering som faktisk kan eksistere.   


Oversikt over datadeduplisering

Først bør viLær forskjellen mellom deduplisering og datakomprimering.Mens hovedformålet med begge prosessene er å redusere plassen en bestemt fil, dokument eller annen datatype kan ta opp, er det stor forskjell mellom de to tilnærmingene når det gjelder håndtering av datalagringsplass. 

Ved datakomprimering forsøker systemet åVed å fjerne dupliserte data på filer som forårsaker dupliseringsproblemerå reduserespesifikk filstørrelsen til.Jeg vet at dette høres forvirrende ut.Vi blir alle fortalt om hver filEller hvert dokument er et unikt sett med data.men,Hvis vi ser på komposisjonenspesifikk fildel av en enkelt databit, deretter den spesifikke forutsetningenvil ikke lenger etableres.

如果 您Bla gjennom alle dataene som utgjør en bestemt fil, og du vil finne noe sånt som detteFilen har repeterende mønstre, for eksempel mellomrom mellom ord.Vi alleVet det faktum at for å lage en tekstfiletter å ha blitt sett對人hjerneer forståelig,Mellomrommene mellom ordene eruunngåelig.mellom ordeneDisse ekstra plassene erdatakomprimeringslettes i prosessendatabiter.

Relaterte spørsmål  Beste NAS-sikkerhetskopieringsleverandører

Etter å ha redusert filstørrelsen betydelig gjennom datakomprimering, kan algoritmen faktisk konvertere de komprimerte dataene tilbake til det opprinnelige formatet under datainnhenting og datagjenoppretting.Teknisk sett kan vi endelig tenke på datakomprimering som en annen form for deduplisering.men,I dagens standarder har datakomprimering blitt behandlet som en separat prosess fra deduplisering.

Datadeduplisering og datakomprimering

på den andre siden, under dedupliseringsprosessen, blir en blokk eller blokker med data undersøkt for å utelukke redundansproblemer.Dedupliseringssystemet prøver å se om en bestemt blokk med data har endret seg.Hvis endret, daDatablokker med tilhørende endringer lagres igjen i datamaskinens datalagringssystem.På denne måten, siden den endrede datablokken vil bli lagret igjen, vil den ta opp ekstra lagringsplass.

Hvis en bestemt blokk med data ikke er endret, vil ikke den delen av filen bli lagret igjen og vil ikke ta opp mer lagringsplass.Så uansett hvor mange mellomrom det er mellom ordene i en bestemt tekstfil, vil det ikke ha noen betydning under dedupliseringsprosessen så lenge det ikke er noen endringer i dokumentet.Formålet med datadeduplisering er å fjerne redundans på kopier av spesifikke filer som er lagret i datalagringssystemer som skylagringssystemer eller skybaserte online backup-systemer.Ved hjelp av datadedupliseringsteknologi,så mye som muligBare én kopi av en bestemt fil finnes i skysikkerhetskopieringssystemet og alle datasentre som er knyttet til det.


4 Fordeler med datadeduplisering

Etter å ha forstått forskjellen mellom datakomprimering og deduplisering, er det best å utforske fordelene forbundet med den aktuelle prosessen.

Fire av de mest overbevisende grunnene til at deduplisering er så nyttig for de beste skylagringssystemene og de beste skybackupsystemene som folk vanligvis bruker.



Deduplisering fordel 1: Det kan redusere kraftigdatalagring på datamaskinenavforbruke.

Takket være deduplisering kan vi faktisk minimere lagringsplassen vi bruker i skylagringssystemer eller til og med online backup-systemer.Dette gjelder spesielt for ordbaserte dokumenter som tekstfiler, PDF-filer, Microsoft Word, Microsoft, Excel og Microsoft PowerPoint.Vi trenger ikke å lagre en ekstra kopi av filen hver gang vi redigerer eller endrer dokumentet.Hvis systemet ikke er utstyrt med deduplisering, vil skysikkerhetskopieringsplass eller skylagringsplass være bortkastet.

Det er alltid bare én fullstendig sikkerhetskopi av en bestemt fil.Resten vil være inkrementelle sikkerhetskopier på grunn av endringer i datablokker eller datablokker i spesifikke filer som støtter dedupliseringsprosessen.Derfor, hvis dokumentet eller filen er uredigert, vil det ikke være noen ekstra inkrementelle sikkerhetskopier som tar opp en liten mengde ekstra datalagringsplass på datamaskinen.

Deduplisering - SNIA

Lagringseffektivitet kan enkelt oppnås med deduplisering.Faktisk i2008 年Storage Networking Industry AssociationEn casestudie utførtorganisasjonen avslørte at,Hvis dedupliseringsprosessen brukes, vil lagringsplassen reduseres med ca. 80 %.Dette er hovedsakelig på grunn av det faktum at de fleste filer vil forbli uredigerte og uendret i lang tid.


Fordel 2 med deduplisering: Deduplisering kanenn komprimerte dataspare mer plass.

Selv om det høres mulig utUkonvensjonelt, men denne spesielle påstanden holder fortsatt, spesielt hvis viFra et bredere perspektiv.Dette er fordidedupliseringsprosessdesign er annerledes, såDet brukes faktisk ikke på forhåndskomprimertdata.Derfor, i det lange løp, hvisgjort mange endringer i en bestemt fil eller dokument, dafor data ennå ikkekompresjondokument,OppbevaringEffektivitetsforholdet vil være større.

Relaterte spørsmål  6 Fordeler med kontinuerlig databeskyttelse

Men i noen tilfeller kan vanlige filer eller dokumenter som har gjennomgått datadeduplisering, gjennomgå påfølgende datakomprimering.Datadedupliseringsprosessen bør skje først, etterfulgt av datakomprimering.Funnet blant de beste leverandørene av skysikkerhetskopieringdette spesielle tilfellet, kan leverandøren tillate at sikkerhetskopier av filer og data lastes ned og gjenopprettes som ZIP-filer (en form for komprimerte data).


Fordel 3 med deduplisering: Opplev raskere dataoverføring.

Datadeduplisering er viktig i geografiske områder som er langt fra eksisterende datasentre etablert av de beste leverandørene av online backup-tjenester.Hvis du har testet rundt 30 skylagringssystemer og rundt 20 sky backup-systemer, vil du definitivt se et mønster i dataoverføring.



Du vil kunne observere,Jo lengre datasenteret er geografisk fra der filene lastes opp og lastes ned, desto tregere vil dataoverføringen gå.Enten du har et internett som er raskere enn det globale gjennomsnittet eller ikke, kan dataoverføringshastighetene fortsatt være lavere enn de burde være.I tillegg,Det er også land med svært lave gjennomsnittlige internetthastigheter.I disse landene er det også et problem med rimelighet når folk ønsker å øke hastigheten på internett de får.

Disse spesielle omstendighetene gjørFolk kan virkelig sette pris på dedupliseringsprosessen.på grunn avi prosessdedupliseringSå hver gang en sikkerhetskopi opprettes, vil den lastes opp til skyenliten mengde data, så dataoverføringsprosessen vil gå raskere.Dettemenermed en bestemt filAlle påfølgende dataoverføringer knyttet til (inkrementelle sikkerhetskopier)vil bli sikkerhetskopiert til å begynne med(full backup)raskere etter.


 
gjentadataElimineringsfordel 4: Øk abonnementer på skysikkerhetskopieringplanlagtRimelig pris.

på grunn avData som må lagres for dedupliseringsprosessenmindre, så duVil kreve mindre plass for sikkerhetskopiering i skyen.Hvis dette er tilfelle, dakan velge å haMindre sikkerhetskopieringsplass i skyensin abonnementsplan.På lang sikt, som igjen gir folk størrefleksibilitet og forbedrefolksRimelig pris.

Relaterte spørsmål  Slik øker du enkelt lagringsplassen på den bærbare datamaskinen din ved å bruke Sync.com

4 typer deduplisering

De 4 typene er listet opp nedenforDedupliseringsprosess.

Deduplisering 2

Deduplisering Type 1: Kildededuplisering/klientsikkerhetskopieringdeduplisering

Kildededuplisering er enDatadedupliseringsmetode, der en spesifikk prosess skjer ilokal datamaskinskrivebordklientnivå.Dette sikrer dedupliseringprosessen har beståttfaktisk opprinnelseFilsystem av filer eliminerer redundans.


Deduplisering Type 2: Måldeduplisering

Måldeduplisering er en metode for datadeduplisering der en spesifikk prosess skjer i en spesiell maskinvare som faktisk fungerer som en bro for å koble den lokale datamaskinen (datakilden) til backupserveren.Hvis endringer i en bestemt fil ble gjort på en annen datamaskin, er det denne typen deduplisering som brukes.Dette er tilfellet med skylagringssystemer, som har muligheten til å synkronisere filer på tvers av flere datamaskiner og flere brukere.


Datadeduplisering type 3: Chunked (deduplisering på blokknivå)

Denne typen deduplisering fungerer ved å sammenligne datablokker eller endringer innenfor datablokker.Kun endrede blokker vil bli lagret igjen i sky backup-systemet.Filversjon er mulig med denne typen deduplisering.


Datadeduplisering type 4: Deduplisering på filnivå/enkeltforekomstlagring

Denne typen dedupliseringFungerer ved å lagre en nøyaktig kopi av en bestemt fil bare én gang.i tilfelleDokumentasjonDel aver endret, behandles det som et annet dokument.denne typenDeduplisering brukes til aldri å bli redigert ogav flere brukerefil brukt.

å hallo ????Hyggelig å møte deg.

Abonner på vårt nyhetsbrev, send veldig regelmessigflott teknologitil e-posten din.

Legg inn kommentar