Che cos'è il processo ETL e come funziona?
Dopo la migrazione iniziale dall'hardware legacy alla nuova infrastruttura, in un'azienda moderna i dati devono spostarsi all'interno dell'infrastruttura.
L'acronimo ETL (Extract, Transform, and Load - Estrazione, trasformazione e caricamento) si riferisce a un processo Big Data Analytics che consente di definire pipeline ETL automatizzate per l'elaborazione ordinaria dei Big Data da utilizzare nelle applicazioni. Ecco come funziona:
- Estrazione: i dati vengono innanzitutto estratti dalla relativa origine, che può essere costituita da uno o più database.
- Trasformazione: i dati vengono compilati e convertiti in codice SQL (Structured Query Language) leggibile dal database di destinazione.
- Caricamento: dopo la conversione, i dati vengono caricati nella nuova origine, dove sostituiscono o si integrano con il sistema di destinazione.
Il processo ETL costituisce solo un esempio dei vari metodi a disposizione delle aziende per spostare velocemente grandi volumi di dati da una posizione all'altra, per supportare le operazioni e i workload applicativi quotidiani. Per mantenersi agili e sempre a disposizione dei propri clienti, le aziende devono investire in soluzioni on-premise e cloud che garantiscano una mobilità continuativa dei dati fra i diversi ambienti.
Problematiche tipiche della migrazione dei dati
La sicurezza dei dati deve essere garantita dal momento dell'estrazione iniziale al deployment finale nell'origine dati di destinazione. Metodi inappropriati di estrazione o trasferimento rischiano di danneggiare i dati di sistema. Allo stesso modo, un guasto dell'infrastruttura IT o un incidente, come un blackout o un attacco informatico, costituisce una grave minaccia per il database. Di conseguenza, prima di eseguire una migrazione dei dati è fondamentale predisporre un piano di disaster recovery.
Anche la compatibilità fra le due origini può costituire un problema. Il codice SQL dell'origine dati di provenienza può essere diverso da quello dell'origine dati di destinazione. Questo accade solitamente durante la migrazione di due applicazioni eseguite da due sistemi diversi e, prima di effettuare il processo di migrazione, è necessario convertire i dati in un linguaggio compatibile.
Il sito web di un'azienda può anche subire un downtime durante il processo di migrazione dei dati. Per downtime si intende un problema che impedisce di accedere al data center da Internet. Nel caso di una migrazione dei dati, durante il caricamento dei dati nell'origine dati di destinazione il sistema potrebbe risultare inaccessibile, ma questa inaccessibilità spesso si traduce in una perdita di clienti o di opportunità di business.
Evitare gli ostacoli della migrazione dei dati
Prima di eseguire una migrazione dei dati occorre prepararsi adeguatamente. Per garantire il successo dell'operazione, è importante studiare a fondo i database di origine e la tecnologia di migrazione. Verificando una seconda volta la possibilità di trasferire correttamente i dati, è possibile garantire una transizione continuativa dalla vecchia origine dati a quella nuova. È importante anche contattare i clienti e i partner commerciali per informarli della possibilità di un downtime.
Esistono diversi metodi che puoi utilizzare per prevenire i downtime e mantenere in funzione il sito web durante la migrazione dei dati. Ad esempio, un deployment zero downtime permette di continuare ad accedere al database originale fino al completamento della migrazione. Anche le tecniche di migrazione dello schema (in cui gli aggiornamenti vengono caricati in modo incrementale per evitare i downtime) e l'hybrid cloud (storage cloud accessibile da due entità diverse) possono garantire l'accesso continuo dei clienti durante la migrazione dei dati.
Dopo il trasferimento dei dati e il deployment delle informazioni, è essenziale verificare che la migrazione sia stata completata correttamente. Occorre pertanto assicurarsi che il database sia perfettamente operativo, prima di modificare o cancellare l'origine dati iniziale. In caso di complicazioni o danneggiamento delle informazioni è necessario tornare indietro e risolvere i problemi prima di procedere.
Semplificare la migrazione dei dati con Pure Storage
Pure Storage semplifica il processo di migrazione dei dati con un aggiornamento non disruptive ai nuovi controller, host esterni, connessioni agli array interni, dischi a stato solido (SSD, Solid-State Disk) e altri componenti. Pure offre una soluzione hybrid cloud che riduce al minimo i downtime, per semplificare la conversione e proteggere i dati. Dalla preparazione alla convalida, in ogni singolo passo del percorso Pure rimane completamente a disposizione della tua azienda e dei suoi dati.