La sauvegarde des données permet de se prémunir de tout risque informatique lié à des événements divers et variés. Elle n’est pas nécessaire pour qu’une entreprise puisse produire, en revanche, il est nécessaire de pouvoir en disposer pour tout incident de parcours. N’attachons-nous pas la ceinture dans notre voiture ?
La sauvegarde est une affaire de responsabilité des utilisateurs et des services informatiques.
Protégez vos données : les concepts de la sauvegarde
Tout d’abord, il convient de qualifier le type de données dont l’entreprise dispose et le poids de la criticité de chacune de celles-ci.
On peut distinguer plusieurs catégories comme la messagerie, les données utilisateurs texte ou tableur, les bases de données, les données applicatives, les données des services internet, etc… Toutes les données n’ont pas la même degré de criticité en fonction des spécificités de chaque entreprise. La perte de données du serveur web pour une entreprise qui fabrique des denrées alimentaires et moins critique que pour une entreprise de e-commerce ; de la même façon, la messagerie d’un stagiaire est moins critique que celle d’un PDG. Il faut donc se demander ce qu’il est acceptable de perdre et ce qui l’est moins. Certaines données ne peuvent pas être perdues sous peine de mettre l’activité même de l’entreprise en péril.
Ensuite vient la question de la fraicheur des données que l’on conserve et du nombre de versions dont il est nécessaire de disposer. Un fichier subit au cours du temps des changements qui peuvent rendre une sauvegarde complément obsolète sur une certaine durée.
En fonction de la forme des sauvegardes, on introduit une notion fondamental : l’effort à fournir pour retrouver les données et les restaurer.
Selon la granularité des données, on distingue trois types de niveaux de sauvegarde et restauration :
- Niveau image ou machine complètes : consiste à sauvegarder l’ensemble des données d’un serveur en une forme d’archive consolidée dans un même fichier de sortie : systèmes d’exploitation, applications et données.
- Niveau fichiers : consiste à sauvegarder uniquement les données essentielles à la création de valeur d’une entreprise. Ce sont des fichiers de types messagerie, base de données, données utilisateurs, …
- Niveau données : consiste à sauvegarder les données du point de vue de l’application qui y accède (par exemple : la boite au lettre d’un utilisateur dans une base de messagerie d’entreprise). On parle aussi de données au niveau de l’objet.
Un des axes de base de la sauvegarde de données est donc de définir une stratégie de sauvegarde liée au métier de l’entreprise, avec une solution qui permette dans les meilleurs délais de se prémunir d’un nombre de risques identifiés.
La sauvegarde « classique »
Dans la sauvegarde dite « classique » on introduit un agent ou client sur un système d’exploitation d’un serveur. A partir de celui-ci, on orchestre la sauvegarde globalement depuis une console pilotant ses données vers des points de stockage gérés par le serveur de sauvegarde. Généralement, ces sauvegardes transitent par le réseau Ethernet en place dans une entreprise et partage la bande passante utilisée par les serveurs et les postes de travail. La sauvegarde ne devant pas pénaliser la communication clients - serveurs, on intègre dans la stratégie de sauvegarde des plages horaires sur lesquelles les sauvegardes peuvent s’opérer sans gêner le flux quotidien des données.
Néanmoins dans des structures informatiques de type « Enterprise », ces fenêtres de sauvegarde sont fréquemment dépassées car la quantité des données à copier d’un serveur source est devenue trop volumineuse par rapport à la bande passante des réseaux de travail.
Pour palier à cela, plusieurs techniques peuvent être employées.
Le premier principe consiste à réduire la quantité de données à la source en utilisant plusieurs méthodes de sauvegarde:
- incrémentielle (on ne copie que les données modifiées entre l’état actuel et la dernière sauvegarde opérée),
- compression de données à la source,
- copier des données seulement vue par les OS et ignorer les données « fantômes »
- déduplication à la source
Il y a plusieurs techniques existantes, certaines sont plus risquées que d’autres car elles modifient l’ensemble des données pour chaque opération de sauvegarde (par exemple dans le cadre d’utilisation de sauvegarde synthétique basé sur agglomération des données incrémentielles uniquement).
Le second principe est de faire transiter le flux de données par un réseau de sauvegarde dédié. On peut utiliser les réseaux de stockage des données (SAN : Storage Area Network). On peut également dédier un réseau Ethernet à la sauvegarde en utilisant sur chaque serveur une carte réseau et un équipement de commutateur d’entreprise à la sauvegarde. Ces techniques offrent la particularité d’avoir une large ou très large bande passante (jusqu'à 500Mo/s) qui permet d’opérer des sauvegardes sur les périodes journalières sans gêner le flux de communication client – serveur.
Quelle est la tendance dans les Datacenters actuels qui se projettent vers le cloud computing ?
On tend à rationnaliser l’ensemble des éléments actifs vers des socles virtuels : réseaux, serveurs, stockages, applicatifs, postes de travails. Cette dématérialisation des infrastructures permet aux entreprises de mieux gérer les coûts, de faciliter les projets de reprise d’activité (complexes à mettre en œuvre et à maintenir) et de réaliser des déménagements de datacenters.Tout cela facilite également la fusion et l’intégration du système d’information des entreprises suite à des rachats, ou encore de passer d’une infrastructure d’internalisation (insourcing) vers une infrastructure d’externalisation (outsourcing).
Dans ces environnements virtualisés une prolifération de machines virtuelles (VM) à vu le jour. Ces VM sont des serveurs dématérialises qui reposent sur des socles d’hyperviseurs.
Nous avons vu plus haut qu’il est possible d’agir sur un nombre de paramètres importants pour réaliser une sauvegarde. La sauvegarde peut donc très vite devenir une équation très complexe à résoudre. C’est pour cela qu’on se doit de trouver et d’appliquer une stratégie simple de sauvegarde qui répondre aux accords sur qualité de service des entreprises (SLA – Service Level Agreement).
Pour optimiser un système, il faut optimiser son ensemble. Une sauvegarde réussie s’inscrira donc dans la globalité et non de le « cas par cas ».
Vizioncore a developpé sur ces principes le " backup 2.0 "
Dans l’esprit d’une politique de sauvegarde globale, une stratégie optimisée pour les datacenter Il ne doit en effet y avoir qu’un seul effort de sauvegarde à la source (machine physique ou virtuelle) avec une sauvegarde de type « image ».
Il faut concentrer ses efforts à la source de la sauvegarde pour en réduire l’espace occupé. Le transport de données, pour être rapide, doit être opéré en parallèle par des liens existants ou dédiés. Enfin, les archives de sauvegardes doivent être « restaurables » rapidement afin de répondre aux différents besoins des entreprises : recouvrement après sinistre avec des restaurations d’images complètes, restauration simple de données au niveau des fichiers, restauration à la granularité applicative…
La simplicité associée à ce systèmes induit également des économies sur les couts d’acquisition logiciels 1€ investi pour 15€ d’économisé.
La virtualisation des datacenters tend à simplifier et à rationaliser l’infrastructure informatique des entreprises. Pour un tirer un réel bénéfice, il convient d’avoir une approche pluridisciplinaire et globale de ces projets. La sauvegarde en est une brique fondamentale. Il faut la traiter avec des méthodes et outils qui ont été développé pour cela.
Les commentaires récents