Deduplicazione dei dati: la guida definitiva

Deduplicazione dei dati: la guida definitiva

Quando esaminiamo una raccolta di recensioni sui migliori fornitori di servizi di backup su cloud su Internet, sentiamo spesso parlare di deduplicazione.Ma cos'è esattamente la deduplicazione?Il termine viene ripetutamente citato in vari articoli, ma nessuno sembra essere in grado di spiegare appieno la deduplicazione dei dati.

Per questo abbiamo deciso di creare un articolo per spiegare meglio cos'èDeduplicaE fornire alle persone risposte alle ragioni dei possibili benefici.Discuteremo anche dei diversi tipi e forme di deduplicazione che possono effettivamente esistere.   


Panoramica della deduplicazione dei dati

Prima di tutto, dovremmoComprendi la differenza tra deduplicazione e compressione dei dati.Sebbene lo scopo principale di questi due processi sia ridurre lo spazio che un particolare file, documento o qualsiasi altro tipo di dati può occupare, c'è una grande differenza tra i due metodi quando si tratta di gestire lo spazio di archiviazione dei dati. 

Nella compressione dei dati, il sistema tentaEliminando i dati duplicati sui file che causano problemi di duplicazioneRidurreFile specificola dimensione di.So che questo suona confuso.Ci viene detto ogni fileOppure ogni documento è un insieme unico di dati.Tuttavia,Se osserviamo la composizioneFile specificoParte di un singolo bit di dati, Allora l'ipotesi specificaNon sarà più stabilito.

se tuSfoglia tutti i dati che compongono un particolare file e lo troveraiIl file ha schemi ripetitivi, come gli spazi tra le parole.Noi tuttiSappi che per creare un file di testoDopo essere stato visto da occhi umaniAlla gentePer il cervelloè comprensibile,Lo spazio tra le parole èinevitabile.tra le paroleQuesti spazi extra sonocompressione datiDa eliminare nel processoBit di dati.

domanda correlata  Il miglior provider di backup NAS

Dopo aver ridotto significativamente le dimensioni del file tramite la compressione dei dati, l'algoritmo può effettivamente convertire i dati compressi nel loro formato originale durante il recupero e il ripristino dei dati.Tecnicamente parlando, possiamo finalmente pensare alla compressione dei dati come un'altra forma di deduplicazione dei dati.Tuttavia,Negli standard odierni, la compressione dei dati è stata considerata come un processo indipendente dalla deduplicazione dei dati.

Deduplicazione e compressione dei dati

d'altra parte, Durante il processo di deduplicazione, i blocchi di dati oi blocchi di dati vengono controllati attentamente per eliminare i problemi di ridondanza.Il sistema di deduplicazione cerca di vedere se un particolare blocco di dati è cambiato.Se è stato modificato, alloraIl blocco dati con la modifica associata verrà nuovamente archiviato nel sistema di archiviazione dati del computer.In questo modo, poiché il blocco dati modificato verrà nuovamente archiviato, occuperà ulteriore spazio di archiviazione.

Se il blocco dati specifico non viene modificato, quella parte del file non verrà nuovamente archiviata e non occuperà più spazio di archiviazione.Pertanto, indipendentemente dal numero di spazi tra le parole in un particolare file di testo, durante il processo di deduplicazione, a condizione che non vengano apportate modifiche al documento, non avrà importanza.Lo scopo della deduplicazione dei dati è eliminare la ridondanza su copie di file specifiche archiviate in sistemi di archiviazione dati del computer (come sistemi di archiviazione cloud o sistemi di backup online basati su cloud).Con l'aiuto della tecnologia di deduplicazione dei dati,Per quanto possibileEsiste solo una copia di un file specifico nel sistema di backup su cloud e in tutti i data center ad esso associati.


4 vantaggi della deduplicazione

Dopo aver compreso la differenza tra la compressione dei dati e la deduplicazione dei dati, è meglio esplorare i vantaggi associati al processo in questione.

I quattro motivi più convincenti per cui la deduplicazione dei dati è molto utile per il miglior sistema di archiviazione cloud e il miglior sistema di backup su cloud che le persone usano solitamente.



Vantaggi della deduplicazione 1: può ridurre notevolmenteArchiviazione dei dati del computerConsumo.

Grazie alla deduplicazione dei dati, possiamo effettivamente ridurre al minimo lo spazio di archiviazione che consumiamo nei sistemi di archiviazione cloud e persino nei sistemi di backup online.Ciò è particolarmente vero per i documenti basati su parole come file di testo, file PDF, Microsoft Word, Microsoft, Excel e Microsoft PowerPoint.Ogni volta che modifichiamo o cambiamo un documento, non abbiamo bisogno di memorizzare una copia aggiuntiva del file.Se il sistema non è dotato di deduplicazione, sprecherà spazio di backup su cloud o spazio di archiviazione su cloud.

C'è sempre solo una copia di backup completa di un particolare file.Il resto saranno backup incrementali dovuti a blocchi di dati o modifiche ai blocchi di dati in file specifici che supportano il processo di deduplicazione.Pertanto, se il documento o il file non viene modificato, non ci saranno altri backup incrementali e questi backup incrementali occuperanno una piccola quantità di spazio di archiviazione dei dati del computer aggiuntivo.

Deduplicazione dati-SNIA

Attraverso la deduplicazione dei dati, è possibile ottenere facilmente l'efficienza dello storage.Infatti, in2008 年Associazione del settore delle reti di archiviazioneUn caso di studio condottoIn, l'organizzazione ha rivelato cheSe viene applicato il processo di deduplicazione, lo spazio di archiviazione verrà ridotto di circa l'80%.Ciò è dovuto principalmente al fatto che la maggior parte dei file rimarrà invariata e invariata per un lungo periodo di tempo.


Vantaggi della deduplicazione 2: la deduplicazione dei dati puòDati compressiRisparmia più spazio.

Anche se sembra possibileNon convenzionale, ma questa particolare affermazione è ancora valida, soprattutto seGuardalo da una prospettiva più ampia.Questo è perchéProcesso di deduplicazioneIl design è diverso, quindiIn realtà non è applicato al precompressodati.Pertanto, a lungo termine, seSono state apportate molte modifiche a un particolare file o documento, quindiPer dati non ancora condotticompressionedocumento,ProfittoIl rapporto di efficienza sarà maggiore.

domanda correlata  6 vantaggi della protezione continua dei dati

Tuttavia, in alcuni casi, file o documenti ordinari che hanno subito un trattamento di deduplicazione dei dati possono essere successivamente compressi.È necessario eseguire prima il processo di deduplicazione dei dati, quindi la compressione dei dati.Può essere trovato nei migliori fornitori di servizi di backup su cloudQuesto caso speciale, Il provider può consentire il download e il ripristino di file e backup dei dati in file ZIP (una forma di dati compressi).


Vantaggi della deduplica 3: sperimenta un trasferimento dei dati più veloce.

In aree geografiche lontane dai data center esistenti stabiliti dai migliori fornitori di servizi di backup online, la deduplica è molto importante.Se hai testato circa 30 sistemi di archiviazione cloud e circa 20 sistemi di backup su cloud, vedrai sicuramente uno schema in termini di trasferimento dei dati.



potrai osservare,Più lontano è il data center dalla posizione geografica di caricamento e scaricamento dei file, minore è la velocità di trasmissione dei dati.Indipendentemente dal fatto che la velocità di Internet di cui disponi sia superiore alla velocità media globale di Internet, la velocità di trasferimento dei dati potrebbe comunque essere più lenta di quanto dovrebbe essere.Inoltre,Ci sono anche paesi in cui la velocità media di Internet è molto bassa.In questi paesi, c'è anche un problema di accessibilità ogni volta che le persone vogliono aumentare la velocità di Internet che ottengono.

Queste circostanze speciali rendonoLe persone possono davvero apprezzare il processo di deduplicazione.a causa diIn corsoDeduplicaSuccessivamente, verrà caricato nel cloud ogni volta che viene creato un backupLa quantità di dati è piccola, Quindi il processo di trasferimento dei dati sarà più veloce.QuestosignificareCon file specificiTutti i successivi trasferimenti di dati associati (backup incrementale)Verrà eseguito il backup inizialmente(Backup completo)Più veloce dopo.


 
ripeteredatiVantaggio di eliminazione 4: miglioramento dell'abbonamento al backup su cloudpianificatoConvenienza.

a causa diDati che devono essere archiviati durante la deduplicazioneMeno importo, Quindi tuRichiederà meno spazio di backup nel cloud.Se questo è il caso, alloraPuò scegliere di avereMeno spazio di backup nel cloudPiano di abbonamento.A lungo termine, Che a sua volta ha dato alle persone più grandiFlessibilità e miglioramentodella genteConvenienza.

domanda correlata  Come utilizzare Sync.com per aumentare facilmente lo spazio di archiviazione sul laptop

4 tipi di deduplica

4 tipi diProcesso di deduplica.

Deduplicazione 2

Tipo di deduplicazione 1: deduplicazione di origine/backup del clientDeduplica

La deduplicazione all'origine è unaMetodo di deduplicazione dei dati, in cui si verifica un processo specifico inComputer localeDesktopLivello cliente.Ciò garantisce la deduplicazioneIl processo è passatoorigine effettivaIl file system per i file elimina la ridondanza.


Tipo di deduplicazione 2: deduplicazione di destinazione

La deduplicazione di destinazione è un metodo di deduplicazione dei dati in cui un processo specifico ha luogo in un componente hardware speciale che funge effettivamente da bridge per connettere il computer locale (origine dati) al server di backup.Se le modifiche a un determinato file sono state apportate su un altro computer, questo è il tipo di deduplicazione utilizzato.Questo è il caso dei sistemi di archiviazione cloud, che hanno la capacità di sincronizzare i file su più computer e più utenti.


Deduplicazione dati di tipo 3: blocco (deduplica a livello di blocco)

Questo tipo di deduplicazione funziona confrontando blocchi di dati o modifiche nei blocchi di dati.Solo i blocchi modificati verranno nuovamente archiviati nel sistema di backup cloud.Utilizzare questo tipo di deduplicazione dei dati per il controllo della versione dei file.


Tipo di deduplicazione dati 4: deduplicazione a livello di file/archiviazione a istanza singola

Questo tipo di deduplicazioneLavora memorizzando una copia esatta di un file specifico solo una volta.如果DocumentoParte diSe viene modificato, verrà trattato come un altro documento.questo tipoLa deduplicazione viene utilizzata per non essere mai modificata eDa più utentiFile utilizzati.

Oh, ciao ????Lieto di conoscerti.

Iscriviti alla nostra Newsletter, Invia molto regolarmenteGrande tecnologiaAl tuo post.

Invia commento