Conjunto de datos versus hub de datos
Los conjuntos de datos y los hubs de datos son muy diferentes en esencia. El conjunto de datos está diseñado para almacenar datos de la manera más eficiente posible y cuenta con tecnologías heredadas como almacenamiento basado en DAS. El desafío de un conjunto de datos es que crea silos de datos que inhiben la capacidad de combinar los conjuntos de datos necesarios para el análisis en un todo cohesivo.
Un hub de datos es una arquitectura moderna y centrada en los datos para almacenamiento, que impulsa las técnicas de análisis y AI permitiendo que las empresas consoliden y compartan datos en el mundo actual de priorización de datos. A diferencia de los conjuntos de datos y las arquitecturas DAS heredadas, un hub de datos se diseña para principalmente para compartir y brindar datos en tiempo real y en una forma multidimensional.
¿Por qué los conjuntos de datos están muriendo?
Los conjuntos de datos están muriendo porque están basados en la premisa obsoleta de que se deben almacenar todos los datos sin estructurar. Algunos datos se almacenan en almacenamiento de datos, mientras que otros se pierden en conjuntos de datos. La unificación de datos se quiebra y la velocidad de los datos se daña. Entonces, ¿por qué es tan difícil para los sistemas de almacenamiento heredados unificar los datos en una sola plataforma? El problema es que cada aplicación tiene diferentes requisitos para sus datos, esta es la razón por la que proliferan componentes aislados de datos. Es momento de repensar el tema del almacenamiento.
Los datos son el combustible para la empresa moderna. Aun así, la mayoría de los datos están almacenados en silos y fuera del alcance de las aplicaciones de análisis y de IA. La inteligencia moderna exige una arquitectura diseñada no solo para almacenar datos, sino también para compartirlos y entregarlos.