Eliminação de duplicação de dados: o guia definitivo

Eliminação de duplicação de dados: o guia definitivo

Quando navegamos em uma coleção de análises sobre os melhores provedores de serviços de backup em nuvem na Internet, frequentemente ouvimos sobre a desduplicação.Mas o que exatamente é desduplicação?O termo é mencionado repetidamente em vários artigos, mas ninguém parece ser capaz de explicar totalmente a desduplicação de dados.

É por isso que decidimos criar um artigo para explicar melhor o que éDeduplicaçãoE fornecer às pessoas respostas sobre as razões dos possíveis benefícios.Também discutiremos os diferentes tipos e formas de desduplicação que podem realmente existir.   


Visão geral da desduplicação de dados

Em primeiro lugar, devemosEntenda a diferença entre desduplicação e compactação de dados.Embora o objetivo principal desses dois processos seja reduzir o espaço que um determinado arquivo, documento ou qualquer outro tipo de dados pode ocupar, há uma grande diferença entre os dois métodos quando se trata de lidar com o espaço de armazenamento de dados. 

Na compressão de dados, o sistema tentaExcluindo dados duplicados em arquivos que causam problemas de duplicaçãoReduzirArquivo específicoo tamanho de.Eu sei que isso parece confuso.Todos nós somos informados de cada arquivoOu cada documento é um conjunto único de dados.mas,Se olharmos para a composiçãoArquivo específicoParte de um único bit de dados, Então a hipótese específicaNão será mais estabelecido.

如果 您Navegue por todos os dados que compõem um arquivo específico e você encontrará taisO arquivo possui padrões repetitivos, como espaços entre palavras.Nós todosSaiba o fato de que para fazer um arquivo de textoDepois de ser visto por olhos humanosPara pessoasPara o cérebroÉ compreensível,O espaço entre as palavras éinevitável.Entre palavrasEsses espaços extras sãocompressão de dadosPara ser excluído no processoBits de dados.

questão relacionada  O melhor provedor de backup NAS

Depois de reduzir significativamente o tamanho do arquivo por meio da compactação de dados, o algoritmo pode realmente converter os dados compactados de volta ao seu formato original durante a recuperação e recuperação de dados.Tecnicamente falando, podemos finalmente pensar na compactação de dados como outra forma de desduplicação de dados.mas,Nos padrões atuais, a compactação de dados é considerada um processo independente, independente da desduplicação de dados.

Desduplicação e compressão de dados

por outro lado, Durante o processo de desduplicação, os blocos de dados ou blocos de dados são verificados cuidadosamente para eliminar problemas de redundância.O sistema de desduplicação tenta ver se um determinado bloco de dados foi alterado.Se foi alterado, entãoO bloco de dados com a alteração associada será armazenado no sistema de armazenamento de dados do computador novamente.Desta forma, uma vez que o bloco de dados alterado será armazenado novamente, ele ocupará espaço de armazenamento adicional.

Se o bloco de dados específico não for alterado, essa parte do arquivo não será armazenada novamente e não ocupará mais espaço de armazenamento.Portanto, não importa quantos espaços haja entre as palavras em um arquivo de texto específico, durante o processo de desduplicação, desde que não haja alterações no documento, isso não importa.O objetivo da desduplicação de dados é eliminar a redundância em cópias de arquivos específicos armazenados em sistemas de armazenamento de dados de computador (como sistemas de armazenamento em nuvem ou sistemas de backup online baseados em nuvem).Com a ajuda da tecnologia de desduplicação de dados,Tanto quanto possívelExiste apenas uma cópia de um arquivo específico no sistema de backup em nuvem e todos os centros de dados associados a ele.


4 benefícios da desduplicação

Depois de entender a diferença entre compactação de dados e desduplicação de dados, é melhor explorar os benefícios associados ao processo em questão.

Os quatro motivos mais convincentes pelos quais a desduplicação de dados é muito útil para o melhor sistema de armazenamento em nuvem e o melhor sistema de backup em nuvem que as pessoas costumam usar.



Benefícios da desduplicação 1: pode reduzir muitoArmazenamento de dados de computadorConsumo.

Devido à desduplicação de dados, podemos minimizar o espaço de armazenamento que consumimos em sistemas de armazenamento em nuvem e até mesmo em sistemas de backup online.Isso é especialmente verdadeiro para documentos baseados em palavras, como arquivos de texto, arquivos PDF, Microsoft Word, Microsoft, Excel e Microsoft PowerPoint.Cada vez que editamos ou alteramos um documento, não precisamos armazenar uma cópia extra do arquivo.Se o sistema não estiver equipado com desduplicação, ele desperdiçará espaço de backup em nuvem ou espaço de armazenamento em nuvem.

Sempre há apenas uma cópia de backup completa de um arquivo específico.O resto serão backups incrementais devido a blocos de dados ou alterações em blocos de dados em arquivos específicos que suportam o processo de desduplicação.Portanto, se o documento ou arquivo não for editado, não haverá outros backups incrementais e esses backups incrementais ocuparão uma pequena quantidade de espaço adicional de armazenamento de dados do computador.

Desduplicação de dados - SNIA

Por meio da desduplicação de dados, a eficiência do armazenamento pode ser facilmente alcançada.Na verdade, em2008 年Storage Network Industry AssociationUm estudo de caso realizadoEm, a organização revelou queSe o processo de desduplicação for aplicado, o espaço de armazenamento será reduzido em aproximadamente 80%.Isso se deve principalmente ao fato de que a maioria dos arquivos permanecerá sem edição e inalterada por um longo período de tempo.


Benefícios da desduplicação 2: a desduplicação de dados podeDados comprimidosEconomize mais espaço.

Embora pareça possívelNão convencional, mas esta afirmação particular ainda é válida, especialmente se nósOlhe para isso de uma perspectiva mais ampla.Isto é porqueProcesso de desduplicaçãoO design é diferente, entãoNão é realmente aplicado a pré-compactadodados.Portanto, a longo prazo, seMuitas mudanças foram feitas em um determinado arquivo ou documento, entãoPara dados ainda não conduzidoscompressãodocumento,LucroÍndice de eficiência será maior.

questão relacionada  6 benefícios da proteção contínua de dados

No entanto, em alguns casos, arquivos ou documentos comuns que passaram por processamento de desduplicação de dados podem ser compactados posteriormente.O processo de desduplicação de dados deve ser executado primeiro e, em seguida, a compactação de dados.Pode ser encontrado nos melhores provedores de serviços de backup em nuvemEste caso especial, O provedor pode permitir que arquivos e backups de dados sejam baixados e restaurados em arquivos ZIP (uma forma de dados compactados).


Benefícios da desduplicação 3: Experimente uma transferência de dados mais rápida.

A desduplicação é muito importante em áreas geográficas distantes dos data centers existentes, estabelecidos pelos melhores provedores de serviços de backup online.Se você testou cerca de 30 sistemas de armazenamento em nuvem e cerca de 20 sistemas de backup em nuvem, certamente verá um padrão em termos de transferência de dados.



Você será capaz de observar,Quanto mais longe o data center estiver da localização geográfica de upload e download de arquivos, mais lenta será a velocidade de transmissão de dados.Independentemente de saber se a velocidade da Internet que você tem é mais rápida do que a velocidade média global da Internet, a velocidade de transferência de dados ainda pode ser mais lenta do que deveria.Além do que, além do mais,Existem também países onde a velocidade média da Internet é muito baixa.Nesses países, também existe o problema de acessibilidade sempre que as pessoas desejam aumentar a velocidade da Internet que obtêm.

Estas circunstâncias especiais fazemAs pessoas podem realmente apreciar o processo de desduplicação.devido aEm andamentoDeduplicaçãoDepois disso, ele será enviado para a nuvem sempre que um backup for criadoA quantidade de dados é pequena, Assim, o processo de transferência de dados será mais rápido.estesignificarCom arquivos específicosTodas as transferências de dados subsequentes associadas (backup incremental)Será feito backup inicialmente(Backup completo)Mais rápido depois.


 
Repita數據Benefício de eliminação 4: Melhore a assinatura de backup na nuvemplanejadoAcessibilidade.

devido aDados que precisam ser armazenados durante a desduplicaçãoMenos quantidade, Então vocêExigirá menos espaço de backup na nuvem.Se for esse o caso, entãoPode escolher terMenos espaço de backup na nuvemPlano de assinatura.A longo prazo, Que por sua vez deu às pessoas maiorFlexibilidade e melhoriaPovosAcessibilidade.

questão relacionada  Como usar Sync.com para aumentar facilmente o espaço de armazenamento em seu laptop

4 tipos de desduplicação

4 tipos deProcesso de desduplicação.

Deduplicação 2

Desduplicação tipo 1: desduplicação na origem / backup do clienteDeduplicação

A desduplicação na fonte é umMétodo de desduplicação de dados, em que um processo específico ocorre emComputador localÁrea de TrabalhoNível do cliente.Isso garante a desduplicaçãoProcesso passouOrigem realSistema de arquivos para arquivos elimina redundância.


Desduplicação tipo 2: Desduplicação de destino

A desduplicação de destino é um método de desduplicação de dados em que um processo específico ocorre em uma peça especial de hardware que realmente atua como uma ponte para conectar o computador local (fonte de dados) ao servidor de backup.Se as alterações em um arquivo específico foram feitas em outro computador, esse é o tipo de desduplicação usado.Esse é o caso dos sistemas de armazenamento em nuvem, que têm a capacidade de sincronizar arquivos em vários computadores e vários usuários.


Desduplicação de dados tipo 3: bloqueio (desduplicação no nível do bloco)

Esse tipo de desduplicação funciona comparando blocos de dados ou alterações nos blocos de dados.Apenas os blocos alterados serão armazenados no sistema de backup em nuvem novamente.Use este tipo de deduplicação de dados para controle de versão de arquivo.


Desduplicação de dados tipo 4: desduplicação no nível do arquivo / armazenamento de instância única

Este tipo de desduplicaçãoTrabalhe armazenando uma cópia exata de um arquivo específico apenas uma vez.如果DocumentoParte deSe for alterado, será tratado como outro documento.esse tipoA desduplicação é usada para nunca ser editada ePor múltiplos usuáriosArquivos usados.

Oi olá ????Prazer em conhecê-la.

Assine a nossa newsletter, Envie muito regularmenteÓtima tecnologiaPara sua postagem.

Postar Comentário