Que signifie ETL et comment ça marche ?
Entreprendre une migration ponctuelle des données entre un matériel traditionnel et une nouvelle infrastructure n’est pas le seul moyen de déplacer les données autour de l’infrastructure IT d’une entreprise moderne.
ETL (Extract, Transform, Load) désigne un processus d’analytique du Big Data qui permet d’établir des pipelines ETL pour le traitement de routine du Big Data destiné à être utilisé dans des applications. Principes de fonctionnement :
- Extraire : les données sont d’abord extraites de la source, qui peut être composée d’une ou plusieurs bases de données.
- Transformer : les données sont compilées et transformées dans un langage de requête structuré (SQL) et lisible pour la base de données cible.
- Charger : une fois transformées, les données sont chargées sur la nouvelle source, où elles remplacent les anciennes données ou s’intègrent dans le système cible.
ETL n’est qu’un exemple de la façon dont les entreprises peuvent déplacer de grands volumes de données d’un emplacement à un autre pour soutenir leurs opérations et leurs charges applicatives au quotidien. Pour rester agiles et hautement disponibles pour leurs clients, les entreprises doivent impérativement investir dans des solutions on-premises et cloud qui favorisent une mobilité des données parfaitement transparente dans tous les environnements.
La migration des données et ses défis
De la première phase d’extraction jusqu’au déploiement final sur la source cible, vous devez garantir la sécurité de vos données. Une extraction incorrecte ou un transfert mal géré peut corrompre les données d’un système. De la même manière, toute défaillance survenant sur votre infrastructure IT ou toute forme de sinistre (panne générale ou cyberattaque, par exemple) peut également menacer votre base de données. C’est pourquoi il est essentiel de mettre en place un plan de reprise après sinistre avant de se lancer dans un projet de migration des données.
La compatibilité entre les deux sources soulève également des complications. Le contenu SQL de la source d’origine peut être différent de celui de la source cible. Ce problème de compatibilité est tout particulièrement fréquent dans les migrations d’applications où deux applications sont exécutées sur deux systèmes différents. Dans ce cas de figure, il est nécessaire de traduire les données dans un langage compatible avant d’effectuer le processus de migration proprement dit.
Le processus de migration des données peut aussi entraîner un arrêt du site web d’une entreprise. On parle « d’arrêt » lorsque le datacenter devient inaccessible en ligne. Dans une migration des données au cours de laquelle de nouvelles données sont téléchargées sur la source cible, le système peut devenir inaccessible pendant le processus de téléchargement. Et qui dit perte d’accès, dit généralement perte de clients et de chiffre d’affaires.
Contourner les obstacles liés à la migration des données
Avant d’entreprendre une migration des données, il est important de bien se préparer. Pour réussir votre projet, vous devez avant tout vous familiariser avec les bases de données sources et avec la technologie de migration. En vérifiant par deux fois que les données pourront être correctement transférées, vous assurerez une transition parfaitement fluide entre l’ancienne source et la nouvelle. Il est par ailleurs important de contacter vos clients et partenaires commerciaux en amont, afin de les préparer aux éventuels arrêts susceptibles de survenir.
Il existe plusieurs façons d’éviter les arrêts et de maintenir votre site web totalement opérationnel pendant une migration des données. Par exemple, un déploiement sans temps d’arrêt permet d’accéder à la base de données d’origine tant que la migration n’a pas été complètement déployée. Certaines techniques comme la migration de schémas (où les mises à niveau sont téléchargées de façon incrémentielle pour éviter les temps d’arrêt) ou le cloud hybride (un stockage cloud qui autorise l’accès aux données à partir de deux entités différentes) peuvent également aider les clients à continuer d’accéder aux données pendant la migration.
Une fois les données transférées et les informations déployées, il est essentiel de confirmer, par une validation, que la migration a bien été effectuée. Cela suppose de vérifier que la base de données est opérationnelle avant de modifier ou d’effacer la source d’origine. En cas de complications ou de corruption d’informations au cours du transfert, il vous faudra revenir en arrière et corriger les problèmes avant de poursuivre le processus.
Simplifier les migrations de données avec Pure Storage
Pure Storage simplifie le processus de migration des données grâce à des mises à niveau sans interruption vers les derniers contrôleurs, la connectivité aux hôtes externes et aux baies internes, les disques flash (SSD) et d’autres composants. Pure facilite la conversion et la protection de vos données en mettant à votre disposition un cloud hybride afin de minimiser les temps d’arrêt. De la préparation jusqu’à la validation, Pure vous accompagne tout au long du processus.