Data Deduplication: The Ultimate Guide

Data Deduplication: The Ultimate Guide

Όταν περιηγούμαστε σε μια συλλογή κριτικών σχετικά με τους καλύτερους παρόχους υπηρεσιών δημιουργίας αντιγράφων ασφαλείας cloud στο Διαδίκτυο, ακούμε συχνά για deduplication.Τι είναι όμως ακριβώς η αποδιπλοποίηση;Ο όρος αναφέρεται επανειλημμένα σε διάφορα άρθρα, αλλά κανείς δεν φαίνεται να μπορεί να εξηγήσει πλήρως την αφαίρεση των δεδομένων.

Γι' αυτό αποφασίσαμε να δημιουργήσουμε ένα άρθρο για να εξηγήσουμε καλύτερα τι είναιΑποδιπλασιασμόςΚαι δώστε στους ανθρώπους απαντήσεις για τους λόγους για τα πιθανά οφέλη.Θα συζητήσουμε επίσης τους διαφορετικούς τύπους και μορφές αφαίρεσης που μπορεί να υπάρχουν στην πραγματικότητα.   


Περιεχόμενα

Επισκόπηση της αντιγραφής δεδομένων

Πρώτα από όλα, θα πρέπειΚατανοήστε τη διαφορά μεταξύ αντιγραφής και συμπίεσης δεδομένων.Αν και ο κύριος σκοπός αυτών των δύο διαδικασιών είναι να μειωθεί ο χώρος που μπορεί να καταλάβει ένα συγκεκριμένο αρχείο, έγγραφο ή οποιοσδήποτε άλλος τύπος δεδομένων, υπάρχει μεγάλη διαφορά μεταξύ των δύο μεθόδων όσον αφορά τον χειρισμό του χώρου αποθήκευσης δεδομένων. 

Στη συμπίεση δεδομένων, το σύστημα προσπαθείΔιαγράφοντας διπλότυπα δεδομένα σε αρχεία που προκαλούν προβλήματα αντιγραφήςΝα μειώσειΣυγκεκριμένο αρχείοτο μέγεθος του.Ξέρω ότι αυτό ακούγεται μπερδεμένο.Όλοι μας λένε κάθε αρχείοΉ κάθε έγγραφο είναι ένα μοναδικό σύνολο δεδομένων.αλλά,Αν δούμε τη σύνθεσηΣυγκεκριμένο αρχείοΜέρος ενός μόνο bit δεδομένων, Στη συνέχεια η συγκεκριμένη υπόθεσηΔεν θα καθιερωθεί πλέον.

αν εσύΠεριηγηθείτε σε όλα τα δεδομένα που συνθέτουν ένα συγκεκριμένο αρχείο και θα βρείτε τέτοιαΤο αρχείο έχει επαναλαμβανόμενα μοτίβα, όπως κενά μεταξύ των λέξεων.Ολοι εμείςΓνωρίστε το γεγονός ότι για να δημιουργήσετε ένα αρχείο κειμένουΜετά από ανθρώπινα μάτια對人Για τον εγκέφαλοΕίναι κατανοητό,Ο χώρος ανάμεσα στις λέξεις είναιαναπόφευκτος.Ανάμεσα στις λέξειςΑυτοί οι επιπλέον χώροι είναισεσυμπίεση δεδομένωνΝα διαγραφεί στη διαδικασίαBits δεδομένων.

Σχετικές ερωτήσεις  Ο καλύτερος πάροχος αντιγράφων ασφαλείας NAS

Μετά τη σημαντική μείωση του μεγέθους του αρχείου μέσω της συμπίεσης δεδομένων, ο αλγόριθμος μπορεί πραγματικά να μετατρέψει τα συμπιεσμένα δεδομένα πίσω στην αρχική τους μορφή κατά την ανάκτηση δεδομένων και την ανάκτηση δεδομένων.Από τεχνικής άποψης, μπορούμε τελικά να σκεφτούμε τη συμπίεση δεδομένων ως μια άλλη μορφή αφαίρεσης δεδομένων.αλλά,Στα σημερινά πρότυπα, η συμπίεση δεδομένων έχει θεωρηθεί ως μια ανεξάρτητη διαδικασία ανεξάρτητη από την αφαίρεση των αντιγράφων δεδομένων.

Αντιγραφή δεδομένων και συμπίεση δεδομένων

αφ 'ετέρου, Κατά τη διαδικασία κατάργησης διπλότυπων, τα μπλοκ δεδομένων ή τα μπλοκ δεδομένων ελέγχονται προσεκτικά για την εξάλειψη προβλημάτων πλεονασμού.Το σύστημα κατάργησης διπλότυπων προσπαθεί να δει εάν έχει αλλάξει ένα συγκεκριμένο μπλοκ δεδομένων.Αν έχει αλλάξει, τότεΤο μπλοκ δεδομένων με τη σχετική αλλαγή θα αποθηκευτεί ξανά στο σύστημα αποθήκευσης δεδομένων του υπολογιστή.Με αυτόν τον τρόπο, καθώς το τροποποιημένο μπλοκ δεδομένων θα αποθηκευτεί ξανά, θα καταλαμβάνει επιπλέον χώρο αποθήκευσης.

Εάν το συγκεκριμένο μπλοκ δεδομένων δεν αλλάξει, αυτό το τμήμα του αρχείου δεν θα αποθηκευτεί ξανά και δεν θα καταλαμβάνει περισσότερο χώρο αποθήκευσης.Επομένως, ανεξάρτητα από το πόσα κενά υπάρχουν μεταξύ των λέξεων σε ένα συγκεκριμένο αρχείο κειμένου, κατά τη διάρκεια της διαδικασίας κατάργησης διπλότυπων, εφόσον δεν υπάρχουν αλλαγές στο έγγραφο, δεν θα έχει σημασία.Ο σκοπός της αφαίρεσης διπλών δεδομένων είναι να εξαλειφθεί ο πλεονασμός σε συγκεκριμένα αντίγραφα αρχείων που είναι αποθηκευμένα σε συστήματα αποθήκευσης δεδομένων υπολογιστών (όπως συστήματα αποθήκευσης cloud ή ηλεκτρονικά συστήματα δημιουργίας αντιγράφων ασφαλείας που βασίζονται σε σύννεφο).Με τη βοήθεια της τεχνολογίας αντιγραφής δεδομένων,Οσο το δυνατόνΥπάρχει μόνο ένα αντίγραφο ενός συγκεκριμένου αρχείου στο σύστημα δημιουργίας αντιγράφων ασφαλείας cloud και σε όλα τα κέντρα δεδομένων που σχετίζονται με αυτό.


4 πλεονεκτήματα της αφαίρεσης αντιγράφων

Αφού κατανοήσετε τη διαφορά μεταξύ της συμπίεσης δεδομένων και της αφαίρεσης των αντιγράφων δεδομένων, είναι καλύτερο να διερευνήσετε τα οφέλη που σχετίζονται με την εν λόγω διαδικασία.

Οι τέσσερις πιο επιτακτικοί λόγοι για τους οποίους η κατάργηση διπλότυπων δεδομένων είναι πολύ χρήσιμη για το καλύτερο σύστημα αποθήκευσης cloud και το καλύτερο σύστημα δημιουργίας αντιγράφων ασφαλείας cloud που χρησιμοποιούν συνήθως οι άνθρωποι.



Οφέλη της αφαίρεσης 1: Μπορεί να μειώσει σημαντικάΑποθήκευση δεδομένων υπολογιστήΚατανάλωση.

Λόγω της αφαίρεσης των δεδομένων, μπορούμε στην πραγματικότητα να ελαχιστοποιήσουμε τον αποθηκευτικό χώρο που καταναλώνουμε σε συστήματα αποθήκευσης cloud και ακόμη και σε διαδικτυακά συστήματα δημιουργίας αντιγράφων ασφαλείας.Αυτό ισχύει ιδιαίτερα για έγγραφα που βασίζονται σε λέξεις, όπως αρχεία κειμένου, αρχεία PDF, Microsoft Word, Microsoft, Excel και Microsoft PowerPoint.Κάθε φορά που επεξεργαζόμαστε ή αλλάζουμε ένα έγγραφο, δεν χρειάζεται να αποθηκεύουμε ένα επιπλέον αντίγραφο του αρχείου.Εάν το σύστημα δεν είναι εξοπλισμένο με deduplication, θα σπαταλήσει εφεδρικό χώρο cloud ή χώρο αποθήκευσης cloud.

Υπάρχει πάντα μόνο ένα πλήρες αντίγραφο ασφαλείας ενός συγκεκριμένου αρχείου.Τα υπόλοιπα θα είναι σταδιακά αντίγραφα ασφαλείας λόγω μπλοκ δεδομένων ή αλλαγών σε μπλοκ δεδομένων σε συγκεκριμένα αρχεία που υποστηρίζουν τη διαδικασία κατάργησης διπλότυπων.Επομένως, εάν το έγγραφο ή το αρχείο δεν υποβληθεί σε επεξεργασία, δεν θα υπάρχουν άλλα πρόσθετα αντίγραφα ασφαλείας και αυτά τα σταδιακά αντίγραφα ασφαλείας θα καταλαμβάνουν ένα μικρό ποσό πρόσθετου χώρου αποθήκευσης δεδομένων υπολογιστή.

Data Deduplication-SNIA

Μέσω της αφαίρεσης αντιγράφων δεδομένων, μπορεί εύκολα να επιτευχθεί αποτελεσματικότητα αποθήκευσης.Στην πραγματικότητα, σε2008 年Storage Network Industry AssociationΠραγματοποιήθηκε μελέτη περίπτωσηςΣτο, η οργάνωση αποκάλυψε ότιΕάν εφαρμοστεί η διαδικασία αφαίρεσης διπλότυπων, ο αποθηκευτικός χώρος θα μειωθεί κατά περίπου 80%.Αυτό οφείλεται κυρίως στο γεγονός ότι τα περισσότερα αρχεία θα παραμείνουν αμετάβλητα και αμετάβλητα για μεγάλο χρονικό διάστημα.


Πλεονεκτήματα της αφαίρεσης αντιγράφων 2: Η αφαίρεση των αντιγράφων δεδομένων μπορείΣυμπιεσμένα δεδομέναΕξοικονομήστε περισσότερο χώρο.

Αν και ακούγεται πιθανόΑντισυμβατικό, αλλά ο συγκεκριμένος ισχυρισμός εξακολουθεί να ισχύει, ειδικά αν εμείςΔείτε το από μια ευρύτερη οπτική γωνία.Αυτό είναι επειδήΔιαδικασία αποδιπλασιασμούΟ σχεδιασμός είναι διαφορετικός, λοιπόνΣτην πραγματικότητα δεν εφαρμόζεται σε προσυμπιεσμέναδεδομένα.Επομένως, μακροπρόθεσμα, ανΤότε έχουν γίνει πολλές αλλαγές σε ένα συγκεκριμένο αρχείο ή έγγραφοΓια δεδομένα που δεν έχουν γίνει ακόμησυμπίεσηέγγραφο,αποθήκευσηΟ λόγος απόδοσης θα είναι μεγαλύτερος.

Σχετικές ερωτήσεις  6 οφέλη της συνεχούς προστασίας δεδομένων

Ωστόσο, σε ορισμένες περιπτώσεις, επιτρέπεται στη συνέχεια η συμπίεση των συνηθισμένων αρχείων ή εγγράφων που έχουν υποστεί επεξεργασία κατάργησης διπλότυπων δεδομένων.Πρώτα θα πρέπει να εκτελεστεί η διαδικασία αφαίρεσης διπλών δεδομένων και μετά η συμπίεση δεδομένων.Μπορεί να βρεθεί στους καλύτερους παρόχους υπηρεσιών δημιουργίας αντιγράφων ασφαλείας cloudΑυτή η ειδική περίπτωση, Ο πάροχος μπορεί να επιτρέψει τη λήψη αρχείων και αντιγράφων ασφαλείας δεδομένων και την επαναφορά σε αρχεία ZIP (μια μορφή συμπιεσμένων δεδομένων).


Πλεονεκτήματα της αφαίρεσης αντιγράφων 3: Απολαύστε ταχύτερη μεταφορά δεδομένων.

Η κατάργηση διπλότυπων είναι πολύ σημαντική σε γεωγραφικές περιοχές μακριά από τα υπάρχοντα κέντρα δεδομένων που έχουν δημιουργηθεί από τους καλύτερους παρόχους υπηρεσιών ηλεκτρονικής δημιουργίας αντιγράφων ασφαλείας.Εάν έχετε δοκιμάσει περίπου 30 συστήματα αποθήκευσης cloud και περίπου 20 συστήματα δημιουργίας αντιγράφων ασφαλείας cloud, σίγουρα θα δείτε ένα μοτίβο όσον αφορά τη μετάδοση δεδομένων.



Θα μπορείτε να παρατηρήσετε,Όσο πιο μακριά βρίσκεται το κέντρο δεδομένων από τη γεωγραφική θέση φόρτωσης και λήψης αρχείων, τόσο πιο αργή είναι η ταχύτητα μετάδοσης δεδομένων.Ανεξάρτητα από το αν η ταχύτητα Διαδικτύου που έχετε είναι μεγαλύτερη από την παγκόσμια μέση ταχύτητα Διαδικτύου, η ταχύτητα μεταφοράς δεδομένων μπορεί να είναι ακόμα πιο αργή από ό,τι θα έπρεπε.Επιπλέον,Υπάρχουν επίσης χώρες όπου η μέση ταχύτητα internet είναι πολύ χαμηλή.Σε αυτές τις χώρες, υπάρχει επίσης ζήτημα οικονομικής προσιτότητας κάθε φορά που οι άνθρωποι θέλουν να αυξήσουν την ταχύτητα του Διαδικτύου που αποκτούν.

Αυτές οι ειδικές συνθήκες κάνουνΟι άνθρωποι μπορούν πραγματικά να εκτιμήσουν τη διαδικασία αφαίρεσης αντιγράφων.εξαιτίαςΣε εξέλιξηΑποδιπλασιασμόςΜετά από αυτό, θα μεταφορτώνεται στο cloud κάθε φορά που δημιουργείται ένα αντίγραφο ασφαλείαςΟ όγκος των δεδομένων είναι μικρός, Έτσι η διαδικασία μεταφοράς δεδομένων θα είναι πιο γρήγορη.ΑυτόσημαίνωΜε συγκεκριμένα αρχείαΌλες οι επόμενες μεταφορές δεδομένων που σχετίζονται (αυξητικό αντίγραφο ασφαλείας)Αρχικά θα δημιουργηθεί αντίγραφο ασφαλείας(Πλήρης δημιουργία αντιγράφων ασφαλείας)Πιο γρήγορα αργότερα.


 
επαναλαμβάνωδεδομέναΟφέλη εξάλειψης 4: Βελτίωση της συνδρομής δημιουργίας αντιγράφων ασφαλείας στο cloudσχεδιασμένοςΠροσιτότητα.

εξαιτίαςΔεδομένα που πρέπει να αποθηκευτούν κατά την κατάργηση διπλότυπωνΛιγότερο ποσό, Αρα εσύΘα απαιτήσει λιγότερο χώρο δημιουργίας αντιγράφων ασφαλείας στο cloud.Αν ισχύει αυτό, τότεΜπορεί να επιλέξει να έχειΛιγότερος χώρος δημιουργίας αντιγράφων ασφαλείας cloudΠρόγραμμα συνδρομής.Μακροπρόθεσμα, Το οποίο με τη σειρά του έδωσε στους ανθρώπους μεγαλύτερηΕυελιξία και βελτίωσηΤου λαούΠροσιτότητα.

Σχετικές ερωτήσεις  Πώς να χρησιμοποιήσετε το Sync.com για να αυξήσετε εύκολα τον αποθηκευτικό χώρο στον φορητό υπολογιστή σας

4 τύποι αποδιπλασιασμού

4 είδηΔιαδικασία αποδιπλασιασμού.

Αποδιπλασιασμός 2

Τύπος κατάργησης διπλότυπων 1: Κατάργηση αντιγράφων προέλευσης/αντίγραφο ασφαλείας πελάτηΑποδιπλασιασμός

Η αφαίρεση της πηγής είναι αΜέθοδος διαγραφής δεδομένων, στην οποία λαμβάνει χώρα μια συγκεκριμένη διαδικασίαΤοπικός υπολογιστήςΕπιφάνεια εργασίαςεπίπεδο πελάτη.Αυτό εξασφαλίζει την αφαίρεση των αντιγράφωνΗ διαδικασία έχει περάσειΠραγματική προέλευσηΣύστημα αρχείων για αρχεία εξαλείφει τον πλεονασμό.


Τύπος κατάργησης διπλότυπων 2: Αντιγραφή στόχου

Το Target deduplication είναι μια μέθοδος κατάργησης διπλότυπων δεδομένων κατά την οποία λαμβάνει χώρα μια συγκεκριμένη διαδικασία σε ένα ειδικό κομμάτι υλικού που στην πραγματικότητα λειτουργεί ως γέφυρα για τη σύνδεση του τοπικού υπολογιστή (πηγή δεδομένων) με τον διακομιστή αντιγράφων ασφαλείας.Εάν οι αλλαγές σε ένα συγκεκριμένο αρχείο έγιναν σε άλλον υπολογιστή, αυτός είναι ο τύπος κατάργησης διπλότυπων που χρησιμοποιείται.Αυτό συμβαίνει με τα συστήματα αποθήκευσης cloud, τα οποία έχουν τη δυνατότητα να συγχρονίζουν αρχεία σε πολλούς υπολογιστές και πολλούς χρήστες.


Τύπος κατάργησης διπλότυπων δεδομένων 3: Αποκλεισμός (απαλοιφή σε επίπεδο μπλοκ)

Αυτός ο τύπος αντιγραφής λειτουργεί συγκρίνοντας μπλοκ δεδομένων ή αλλαγές σε μπλοκ δεδομένων.Μόνο τα αλλαγμένα μπλοκ θα αποθηκευτούν ξανά στο σύστημα δημιουργίας αντιγράφων ασφαλείας cloud.Χρησιμοποιήστε αυτόν τον τύπο αντιγραφής δεδομένων για έλεγχο έκδοσης αρχείου.


Τύπος κατάργησης διπλότυπων δεδομένων 4: Κατάργηση διπλότυπων σε επίπεδο αρχείου/αποθήκευση μίας παρουσίας

Αυτός ο τύπος αποδιπλασιασμούΕργαστείτε αποθηκεύοντας ένα ακριβές αντίγραφο ενός συγκεκριμένου αρχείου μόνο μία φορά.如果ΕγγραφοΜέρος τουΕάν αλλάξει, θα αντιμετωπιστεί ως άλλο έγγραφο.αυτός ο τύποςΤο Deduplication χρησιμοποιείται για να μην γίνει ποτέ επεξεργασία καιΑπό πολλούς χρήστεςΑρχεία που χρησιμοποιούνται.

Γεια σου 👋Χαίρομαι που σε γνωρίζω.

Εγγραφείτε στο ενημερωτικό μας δελτίο, Αποστολή πολύ τακτικάΜεγάλη τεχνολογίαΣτην ανάρτησή σου.

Δημοσίευση σχολίου