Che cos'è un data fabric?
Una data fabric è un'architettura unificata che acquisisce l'integrazione e la gestione end-to-end di tutti i dati all'interno di un sistema, tra cui fonti, storage, pipeline, analytics e applicazioni.
Il termine metaforico “fabric” in "data fabric" si riferisce all'idea di visualizzare i dati della tua organizzazione come un unico livello di rete integrato rispetto a una raccolta in silos di connessioni point-to-point. L'approccio ai dati come un fabric può aiutarti a ottimizzare le performance, migliorarne la mobilità e semplificarne le operations.
In pratica, un data fabric viene creato adottando un approccio incentrato sui dati all'architettura IT e utilizzando software di integrazione e gestione dei dati per definire nuove architetture.
Perché il data fabric è importante ora?
Circa dieci anni dopo che i Big Data sono stati nominati la prossima grande novità, le organizzazioni si stanno rendendo conto che la raccolta e l'archiviazione dei dati sono solo l'inizio per cogliere i vantaggi dei dati. Per mantenere la promessa dei Big Data, ovvero informazioni approfondite rivoluzionarie, esperienze all'avanguardia, nuovi modelli di business e intelligenza artificiale ovunque, è necessario un nuovo approccio alla gestione dei dati. Questo approccio integra le informazioni provenienti da tutte le fonti e rende i dati disponibili quando e dove sono necessari, indipendentemente dall'utente o dall'endpoint, il tutto mantenendo i dati al sicuro ovunque si trovino o quando sono in transito.
Denominando i data fabric uno dei principali trend tecnologici per il 2022, Gartner ha affermato che i data fabric possono semplificare l'infrastruttura di integrazione dei dati di un'organizzazione e creare un'architettura scalabile che riduce le sfide di integrazione. Un data fabric può anche ridurre le attività di gestione dei dati fino al 70%, accelerando così il time-to-value.
Perché utilizzare un data fabric?
Una data fabric può liberare il potenziale nascosto dei Big Data all'interno dell'ambiente hybrid cloud rendendo i dati accessibili negli ambienti on-premise, public cloud, private cloud ed edge.
Ecco alcune sfide comuni di gestione dei dati che un data fabric può affrontare:
- La necessità di archiviare i dati in modo efficiente, rendendoli accessibili agli utenti, ai clienti e alle automazioni che ne hanno bisogno
- Flussi di dati, soluzioni di storage e utenti finali distribuiti geograficamente
- Dati incompatibili: strutturati e non strutturati, dati per applicazioni specifiche, dati in silos e dati legacy
- Assistenza per una nuova generazione di applicazioni data-intensive che si basano su intelligenza artificiale e machine learning, analytics in tempo reale ed esperienze contestuali per i clienti
- Ottimizzazione dei flussi di dati da e verso i dispositivi IoT e i deployment di edge computing
- Protezione dei dati e conformità
Come funziona un data fabric?
I software per la gestione dei dati integrano flussi di dati, utenti, endpoint, storage e architettura di rete in un livello di gestione dei dati che fornisce visibilità e un'interfaccia per il controllo e la gestione. Il software apprende l'intero patrimonio di dati di un'organizzazione, segnala i colli di bottiglia e fornisce raccomandazioni per migliorare le performance e l'accesso.
Con il software, i data engineer possono vedere una vista di alto livello o approfondire le informazioni per migliorare le performance per i singoli casi d'uso. Il software stabilisce inoltre un panorama di dati comune e un insieme di API da integrare con applicazioni, flussi di dati e casi d'uso.
Quali sono gli elementi di un data fabric?
Un data fabric in genere include i seguenti livelli:
- Gestione dei dati: Aiuta a monitorare lo stato del sistema, la sicurezza dei dati e l'ottimizzazione della rete.
- Acquisizione dei dati: Definisce percorsi e processi per i dati appena introdotti.
- Elaborazione dei dati: Pulisce, perfeziona e trasforma i dati, rendendoli pronti per usi specifici.
- Orchestrazione dei dati: Aiuta il sistema a funzionare in modo più efficiente, assicurando che solo i dati rilevanti siano forniti agli utenti.
- Scoperta dei dati: Aiuta a far emergere nuove connessioni tra diverse origini dati, sbloccando valore e indicando nuove informazioni approfondite.
- Accesso ai dati: Consente a una varietà di utenti, applicazioni, automazioni, team all'interno dell'organizzazione o dispositivi, di accedere ai dati in modo che possano essere utilizzati senza problemi.
- Sicurezza dei dati: Monitora e protegge i dati in tutta l'organizzazione, garantendo al contempo la conformità alle normative di sicurezza.
Vantaggi di un data fabric
Oltre a risolvere molte sfide di data engineering, una data fabric offre i seguenti vantaggi a livello di organizzazione:
- Più valore dai dati: Una data fabric è progettata per aiutare un'organizzazione a utilizzare maggiormente i propri dati, ad esempio per offrire esperienze migliori ai clienti, trovare efficienze operative e abilitare nuovi modelli di business.
- Migliore utilizzo delle risorse: Fornendo una visione di alto livello dei dati all'interno di un'organizzazione e utilizzando l'AI per formulare raccomandazioni, un data fabric può informare il processo decisionale dell'IT mostrando come i costi e i carichi di risorse maturano in vari casi d'uso.
- Agilità e resilienza migliorate: Un data fabric può aiutare un'organizzazione a scalare o cambiare in base alle condizioni mutevoli o alle nuove realtà modellando i cambiamenti in anticipo e fornendo una base coerente su cui costruire architetture di dati.
Un data fabric è simile a un data lake?
Molte organizzazioni scelgono i data lake per risolvere i problemi di accesso ai dati, ma un data lake è un approccio top-down ed è definito come un repository master di dati. I data lake possono creare ulteriore lavoro in termini di streaming e caricamento e rendere i dati più difficili da consultare e gestire. Inoltre, alcuni dati potrebbero essere necessari a una distanza sufficiente dal data lake per introdurre un'alta latenza. In pratica, un data fabric può aiutare le organizzazioni a ottenere di più da un data lake.
Un data fabric è simile alla virtualizzazione dei dati?
Questi due concetti sono più complementari che opposti. La virtualizzazione dei dati crea un'interfaccia per la gestione, lo spostamento e l'utilizzo dei dati. Una data fabric, invece, è un metodo onnicomprensivo per ottimizzare ogni parte delle operazioni di gestione dei dati: performance, costi, efficienza delle risorse, sicurezza, crescita e gestione dei cambiamenti.
Casi d'uso del data fabric
Ecco alcuni esempi di come le organizzazioni possono sfruttare un data fabric per migliorare l'accessibilità dei dati:
- I grandi retailer possono integrare dati complessi di inventario e supply chain per prendere decisioni informate su produzione e pianificazione.
- Le società di consulenza IT possono consolidare i dati delle richieste di assistenza clienti e riorganizzare le strategie di vendita in base alle informazioni approfondite sulle lacune nelle soluzioni disponibili.
- Gli agricoltori possono integrare diversi flussi di dati, come previsioni meteorologiche, condizioni di mercato e condizioni del suolo, nel processo decisionale critico.
Semplifica il tuo data fabric con Pure Storage
La configurazione di un data fabric che copra completamente l'intero ambiente hybrid cloud non è un'impresa da poco. Devi integrare i dati in fonti diverse in ambienti on-premise, public cloud, private cloud ed edge, il tutto mantenendo la governance e la sicurezza dei dati.
Hai colto le lacune nel tuo data fabric o stai cercando di crearne uno tuo? Pure Storage offre le soluzioni necessarie per creare e supportare un data fabric moderno:
- Pure1®: Una soluzione di gestione del data storage basata sull'AI che offre storage self-driving nell'intero stack tecnologico.
- Ambiente operativo Purity: Una piattaforma unificata che gestisce in modo intelligente i dati su Pure Storage ® FlashArray ™, nei data center, all'edge o nel cloud, e consente di semplificare la gestione dei dati ed eliminare i silos di storage.
- Pure Fusion ™: Una piattaforma Storage-as-Code ™ che porta il modello operativo cloud on-premise. Fornisci, gestisci e utilizza facilmente lo storage enterprise.
- Portworx®: Una soluzione completa di data services Kubernetes per potenziare le applicazioni cloud-native.
- Pure Cloud Block Store™: Una soluzione multi-cloud che offre mobilità dei dati, resilienza e un'esperienza utente coerente in tutti gli ambienti cloud.
Semplificando il modo in cui le persone utilizzano e interagiscono con i dati, Pure consente agli innovatori di liberare il potenziale nascosto all'interno dei dati aziendali.