Wat is ETL en hoe werkt het?
Eenmalige datamigraties van verouderde hardware naar nieuwe infrastructuur zijn niet de enige manier waarop data in de IT-infrastructuur van een modern bedrijf moeten worden verplaatst.
Extraheren, transformeren en laden (ETL) is een big data analytics-proces waarbij geautomatiseerde ETL-pijplijnen kunnen worden opgezet voor de routinematige verwerking van big data voor gebruik in toepassingen. Dit is hoe het werkt:
- Extraheren: Eerst worden de data uit de bron gehaald, die uit één of meerdere databanken kan bestaan.
- Transformeren: De data worden gecompileerd en omgezet in een leesbare gestructureerde querytaal (SQL) voor de doeldatabase.
- Laden: Na transformatie worden de data in de nieuwe bron geladen, waar ze ofwel het doelsysteem vervangen of er zich in integreren.
ETL is slechts één voorbeeld van hoe bedrijven snel grote hoeveelheden data van de ene naar de andere locatie kunnen verplaatsen ter ondersteuning van de dagelijkse activiteiten en de workload van toepassingen. Investeren in on-premises- en cloud-oplossingen die naadloze datamobiliteit tussen omgevingen mogelijk maken, is voor bedrijven van cruciaal belang om wendbaar en in hoge mate beschikbaar te blijven voor hun klanten.
Algemene uitdagingen bij datamigratie
Vanaf het eerste moment van extractie tot de uiteindelijke implementatie in de doelbron moet u de veiligheid van uw data waarborgen. Een onjuiste extractie of overdracht kan de data van een systeem beschadigen. Ook een storing in uw IT-infrastructuur of een ramp zoals een stroomstoring of een cyberaanval kan uw database bedreigen. Het is van cruciaal belang om een rampherstelplan te hebben voordat u een datamigratie uitvoert.
De compatibiliteit tussen de twee bronnen levert nog een complicatie op. De SQL van de oorspronkelijke bron kan verschillen van de doelbron. Dit komt vooral voor bij toepassingsmigraties waarbij twee toepassingen via twee verschillende systemen lopen. Het wordt noodzakelijk de data in een compatibele taal te vertalen alvorens het migratieproces af te ronden.
De website van een organisatie kan ook downtime ondervinden tijdens het datamigratieproces. Downtime is wanneer het datacenter niet online toegankelijk is. Wanneer bij datamigratie nieuwe data worden geüpload naar de doelbron, kan het zijn dat het systeem niet toegankelijk is terwijl de upload bezig is. En een verlies van toegang betekent meestal een verlies van klanten en zaken.
De obstakels van datamigratie vermijden
Voordat u een datamigratie uitvoert, is het belangrijk om u voor te bereiden. Vertrouwd raken met de brondatabases en de migratietechnologie is belangrijk voor succes. Dubbelchecken of de data goed worden overgezet helpt om een naadloze overgang tussen de oude en de nieuwe bron te creëren. Contact opnemen met uw klanten en zakenpartners is ook belangrijk om hen voor te bereiden op eventuele uitval.
Er zijn meerdere methoden die u kunt gebruiken om downtime te voorkomen en uw website draaiende te houden tijdens de datamigratie. Bij een zero downtime-implementatie heeft u bijvoorbeeld toegang tot de oorspronkelijke database totdat de migratie volledig is uitgevoerd. Technieken zoals schema-migratie (waarbij upgrades in stappen worden geüpload om downtime te voorkomen) of de hybride cloud (cloudopslag die toegang mogelijk maakt vanuit twee verschillende entiteiten) kunnen ook zorgen voor continue toegang voor klanten tijdens de datamigratie.
Nadat de data zijn overgebracht en de informatie is ingezet, is het van vitaal belang te valideren dat de migratie naar behoren is voltooid. Dit betekent dat de database in werking moet zijn voordat de oorspronkelijke bron wordt gewijzigd of gewist. Als er complicaties waren of informatie beschadigd raakte tijdens de overdracht, moet u teruggaan en de problemen oplossen voordat u verder gaat.
Maak datamigraties gemakkelijker met Pure Storage
Pure Storage vereenvoudigt het datamigratieproces met non-disruptieve upgrades naar de nieuwste controllers, externe host en interne arrayconnectiviteit, solid-state disks (SSD's) en andere componenten. Pure helpt uw data om te zetten en te beschermen en biedt een hybride cloud om de downtime te minimaliseren. Van voorbereiding tot validatie is Pure er voor uw bedrijf en uw data bij elke stap.