Lago de datos frente a Hub de datos
Los lagos de datos y los hubs de datos son muy diferentes en su núcleo. Un lago de datos está diseñado para almacenar los datos de la manera más eficiente posible y diseñado con tecnologías tradicionales como el almacenamiento basado en DAS. El reto de un lago de datos es que crea silos de datos que inhiben la capacidad de combinar los conjuntos de datos necesarios para los análisis en un conjunto cohesionado.
Un concentrador de datos es una arquitectura moderna y centrada en los datos para el almacenamiento, que impulsa las analíticas y la IA , al permitir que las empresas consoliden y compartan los datos en el mundo actual que prioriza los datos. A diferencia de los lagos de datos y las arquitecturas DAS heredadas diseñadas principalmente para almacenar datos, un concentrador de datos está diseñado para compartir y proporcionar datos en tiempo real y de manera multidimensional.
Por qué están muriendo los lagos de datos
Los lagos de datos están muriendo porque se construyeron con la premisa obsoleta de que todos los datos no estructurados deben almacenarse. Algunos de ellos se almacenan en almacenes de datos, mientras que otros se pierden en lagos de datos. La unificación de los datos se rompe y la velocidad de los datos se paraliza. Entonces, ¿por qué es tan difícil para los sistemas de almacenamiento tradicionales unificar los datos en una única plataforma? El problema es que cada aplicación tiene diferentes requisitos para sus datos, por lo que la proliferación de silos de datos. Ha llegado el momento de replantearse el almacenamiento.
Los datos son el combustible para la empresa moderna. Sin embargo, la mayoría de los datos se almacenan en silos, fuera del alcance de las analíticas y las aplicaciones de IA. La inteligencia moderna requiere una arquitectura diseñada no solo para almacenar datos, sino también para compartir y proporcionar datos.