Deduplicación de datos: la guía definitiva

Deduplicación de datos: la guía definitiva

Cuando examinamos una colección de reseñas sobre los mejores proveedores de servicios de copia de seguridad en la nube en Internet, a menudo escuchamos hablar de la deduplicación.Pero, ¿qué es exactamente la deduplicación?El término se menciona repetidamente en varios artículos, pero nadie parece ser capaz de explicar completamente la deduplicación de datos.

Por eso decidimos crear un artículo para explicar mejor qué esDeduplicaciónY proporcione a las personas respuestas sobre las razones de los posibles beneficios.También discutiremos los diferentes tipos y formas de deduplicación que realmente pueden existir.   


Descripción general de la deduplicación de datos

En primer lugar, deberíamosComprenda la diferencia entre la deduplicación y la compresión de datos.Aunque el propósito principal de estos dos procesos es reducir el espacio que puede ocupar un archivo, documento o cualquier otro tipo de datos en particular, existe una gran diferencia entre los dos métodos cuando se trata de manejar el espacio de almacenamiento de datos. 

En la compresión de datos, el sistema intentaEliminando datos duplicados en archivos que causan problemas de duplicaciónPara reducirArchivo específicola talla de.Sé que esto suena confuso.Todos nos dicen cada archivoO cada documento es un conjunto de datos único.pero,Si miramos la composiciónArchivo específicoParte de un solo bit de datos, Entonces la hipótesis específicaYa no se establecerá.

如果 您Examine todos los datos que componen un archivo en particular y encontrará talesEl archivo tiene patrones repetitivos, como espacios entre palabras.TodosSepa el hecho de que para hacer un archivo de textoDespués de ser visto por ojos humanosA la gentePara el cerebroEs entendible,El espacio entre palabras esinevitable.Entre palabrasEstos espacios adicionales soncompresión de datosPara ser eliminado en el procesoBits de datos.

pregunta relacionada  El mejor proveedor de copias de seguridad de NAS

Después de reducir significativamente el tamaño del archivo mediante la compresión de datos, el algoritmo puede convertir los datos comprimidos a su formato original durante la recuperación y recuperación de datos.Técnicamente hablando, finalmente podemos pensar en la compresión de datos como otra forma de deduplicación de datos.pero,En los estándares actuales, la compresión de datos se ha considerado un proceso independiente independiente de la deduplicación de datos.

Deduplicación de datos y compresión de datos

por otra parte, Durante el proceso de deduplicación, los bloques de datos o los bloques de datos se revisan cuidadosamente para eliminar los problemas de redundancia.El sistema de deduplicación intenta ver si un bloque de datos en particular ha cambiado.Si se ha cambiado, entoncesEl bloque de datos con el cambio asociado se almacenará nuevamente en el sistema de almacenamiento de datos de la computadora.De esta forma, dado que el bloque de datos modificado se volverá a almacenar, ocupará espacio de almacenamiento adicional.

Si no se cambia el bloque de datos específico, esa parte del archivo no se almacenará nuevamente y no ocupará más espacio de almacenamiento.Por lo tanto, no importa cuántos espacios haya entre palabras en un archivo de texto en particular, durante el proceso de deduplicación, siempre que no haya cambios en el documento, no importará.El propósito de la deduplicación de datos es eliminar la redundancia en copias de archivos específicas almacenadas en sistemas de almacenamiento de datos informáticos (como sistemas de almacenamiento en la nube o sistemas de respaldo en línea basados ​​en la nube).Con la ayuda de la tecnología de deduplicación de datos,Cuanto más se puedaSolo hay una copia de un archivo específico en el sistema de respaldo en la nube y todos los centros de datos asociados con él.


4 beneficios de la deduplicación

Después de comprender la diferencia entre la compresión de datos y la deduplicación de datos, es mejor explorar los beneficios asociados con el proceso en cuestión.

Las cuatro razones más convincentes por las que la deduplicación de datos es muy útil para el mejor sistema de almacenamiento en la nube y el mejor sistema de respaldo en la nube que la gente suele usar.



Beneficios de la deduplicación 1: puede reducir en gran medidaAlmacenamiento de datos informáticosConsumo.

Debido a la deduplicación de datos, podemos minimizar el espacio de almacenamiento que consumimos en los sistemas de almacenamiento en la nube e incluso en los sistemas de respaldo en línea.Esto es especialmente cierto para documentos basados ​​en Word, como archivos de texto, archivos PDF, Microsoft Word, Microsoft, Excel y Microsoft PowerPoint.Cada vez que editamos o cambiamos un documento, no necesitamos almacenar una copia adicional del archivo.Si el sistema no está equipado con deduplicación, desperdiciará espacio de respaldo en la nube o espacio de almacenamiento en la nube.

Siempre hay una sola copia de seguridad completa de un archivo en particular.El resto serán copias de seguridad incrementales debido a bloques de datos o cambios en bloques de datos en archivos específicos que apoyan el proceso de deduplicación.Por lo tanto, si el documento o archivo no se edita, no habrá otras copias de seguridad incrementales, y estas copias de seguridad incrementales ocuparán una pequeña cantidad de espacio adicional de almacenamiento de datos en la computadora.

Deduplicación de datos-SNIA

Mediante la deduplicación de datos, se puede lograr fácilmente la eficiencia del almacenamiento.De hecho, en2008 añosAsociación de la industria de redes de almacenamientoUn estudio de caso realizadoEn, la organización reveló queSi se aplica el proceso de deduplicación, el espacio de almacenamiento se reducirá aproximadamente en un 80%.Esto se debe principalmente al hecho de que la mayoría de los archivos permanecerán sin editar y sin cambios durante un largo período de tiempo.


Beneficios de la deduplicación 2: la deduplicación de datos puedeDatos comprimidosAhorra mas espacio.

Aunque suene posiblePoco convencional, pero esta afirmación en particular todavía se mantiene, especialmente siMíralo desde una perspectiva más amplia.Esto es porqueProceso de deduplicaciónEl diseño es diferente, entoncesEn realidad, no se aplica a precomprimidosdatos.Por tanto, a la larga, siSe han realizado muchos cambios en un archivo o documento en particular, luegoPara datos aún no realizadosContraccióndocumento,LucroEl índice de eficiencia será mayor.

pregunta relacionada  6 beneficios de la protección continua de datos

Sin embargo, en algunos casos, los archivos o documentos ordinarios que se han sometido a un procesamiento de deduplicación de datos pueden comprimirse posteriormente.El proceso de deduplicación de datos debe realizarse primero y luego la compresión de datos.Se puede encontrar en los mejores proveedores de servicios de copia de seguridad en la nube.Este caso especial, El proveedor puede permitir que los archivos y las copias de seguridad de los datos se descarguen y restauren en archivos ZIP (una forma de datos comprimidos).


Beneficios de la deduplicación 3: Experimente una transferencia de datos más rápida.

La deduplicación es muy importante en áreas geográficas alejadas de los centros de datos existentes establecidos por los mejores proveedores de servicios de respaldo en línea.Si ha probado unos 30 sistemas de almacenamiento en la nube y unos 20 sistemas de copia de seguridad en la nube, definitivamente verá un patrón en términos de transmisión de datos.



Podrás observar,Cuanto más lejos esté el centro de datos de la ubicación geográfica de carga y descarga de archivos, más lenta será la velocidad de transmisión de datos.Independientemente de si la velocidad de Internet que tiene es más rápida que la velocidad de Internet promedio global, la velocidad de transferencia de datos puede ser aún más lenta de lo que debería ser.Adicionalmente,También hay países donde la velocidad media de Internet es muy baja.En estos países, también existe el problema de la asequibilidad cada vez que las personas desean aumentar la velocidad de Internet que obtienen.

Estas circunstancias especiales hacenLa gente realmente puede apreciar el proceso de deduplicación.debido aEn cursoDeduplicaciónDespués de eso, se cargará en la nube cada vez que se cree una copia de seguridad.La cantidad de datos es pequeña, Por lo que el proceso de transferencia de datos será más rápido.EstasignificarCon archivos específicosTodas las transferencias de datos posteriores asociadas (copia de seguridad incremental)Se hará una copia de seguridad inicialmente(Copia de seguridad completa)Mas rapido despues.


 
RepetirdatosBeneficio de eliminación 4: Mejorar la suscripción a la copia de seguridad en la nubeplanificadoAsequibilidad.

debido aDatos que deben almacenarse durante la deduplicaciónMenor cantidad, Vos tambienRequerirá menos espacio de respaldo en la nube.Si este es el caso, entoncesPuede elegir tenerMenos espacio de respaldo en la nubePlan de suscripción.A largo plazo, Lo que a su vez le dio a la gente una mayorFlexibilidad y mejoraDe la genteAsequibilidad.

pregunta relacionada  Cómo usar Sync.com para aumentar fácilmente el espacio de almacenamiento en su computadora portátil

4 tipos de deduplicación

Los 4 tipos deProceso de deduplicación.

Deduplicación 2

Tipo de deduplicación 1: deduplicación de origen / copia de seguridad del clienteDeduplicación

La deduplicación de origen es unaMétodo de deduplicación de datos, en el que se produce un proceso específico enComputadora localEscritorioNivel de cliente.Esto asegura la deduplicaciónEl proceso ha pasadoOrigen realEl sistema de archivos para archivos elimina la redundancia.


Deduplicación tipo 2: deduplicación de destino

La deduplicación de destino es un método de deduplicación de datos en el que se lleva a cabo un proceso específico en una pieza especial de hardware que en realidad actúa como un puente para conectar la computadora local (fuente de datos) al servidor de respaldo.Si los cambios a un archivo en particular se realizaron en otra computadora, este es el tipo de deduplicación que se usa.Este es el caso de los sistemas de almacenamiento en la nube, que tienen la capacidad de sincronizar archivos entre múltiples computadoras y múltiples usuarios.


Tipo de deduplicación de datos 3: bloqueo (deduplicación a nivel de bloque)

Este tipo de deduplicación funciona comparando bloques de datos o cambios en bloques de datos.Solo los bloques modificados se almacenarán nuevamente en el sistema de respaldo en la nube.Utilice este tipo de deduplicación de datos para el control de versiones de archivos.


Tipo de deduplicación de datos 4: deduplicación a nivel de archivo / almacenamiento de instancia única

Este tipo de deduplicaciónTrabaje almacenando una copia exacta de un archivo específico solo una vez.如果DocumentoParteSi se cambia, se tratará como otro documento.este tipoLa deduplicación se utiliza para que nunca se edite yPor múltiples usuariosArchivos usados.

Oh hola 👋Un placer conocerte.

Suscríbete a nuestro boletín, Envía con mucha regularidadGran tecnologiaA tu publicacióncaja.

Enviar comentario