Data Lake vs Data Hub
Il data lake e il data hub sono essenzialmente molto diversi. Un data lake è concepito per memorizzare i dati nel modo più efficiente possibile, oltre a essere progettato con tecnologie legacy come lo storage basato su DAS. Il data lake, tuttavia, presenta il problema di creare silos di dati che impediscono di combinare i set di dati necessari per gli analytics in un insieme coeso.
Un data hub iè un'architettura di storage moderna, incentrata sui dati, che potenzia gli analytics e l'AI consentendo alle aziende di consolidare e condividere i dati nel mondo data-first di oggi. A differenza delle architetture DAS legacy e di data lake progettate principalmente per immagazzinare i dati, un data hub è progettato per condividere e fornire dati in tempo reale e in modo multidimensionale.
Perché i data lake sono destinati all'estinzione
I data lake sono destinati all'estinzione perché creati sulla base della premessa ormai obsoleta che tutti i dati non strutturati devono essere memorizzati. Alcuni di essi sono memorizzati nei data warehouse, altri persi nei data lake. L'unificazione dei dati è intermittente e la velocità dei dati è compromessa. Perché è così difficile per i sistemi di storage legacy unificare i dati in un'unica piattaforma? Il problema risiede nel fatto che ogni applicazione presenta requisiti specifici per i propri dati e questo determina la proliferazione di silos. È giunto il momento di ridefinire il concetto di storage.
I dati sono la linfa vitale dell'impresa moderna. Tuttavia, la maggior parte dei dati è archiviata in silos, non disponibile per gli analytics e le applicazioni di AI moderne. L’intelligenza moderna richiede un'architettura progettata non solo per archiviare i dati, ma anche per condividerli e distribuirli.