¿Qué es un tejido de datos?
Un tejido de datos es una arquitectura unificada que captura la integración y la gestión de extremo a extremo de todos los datos dentro de un sistema, incluidas las fuentes, el almacenamiento, las canalizaciones, los análisis y las aplicaciones.
El “tejido” metafórico de un “tejido de datos” se refiere a la idea de ver los datos de su organización como una única capa de red integrada frente a un conjunto en silos de conexiones punto a punto. Abordar sus datos como tejido puede ayudarle a optimizar mejor el rendimiento, mejorar la movilidad de los datos y optimizar las operaciones de los datos.
En la práctica, un tejido de datos se crea adoptando un enfoque centrado en los datos de la arquitectura de TI y utilizando software de integración y gestión de datos para definir nuevas arquitecturas.
¿Por qué es importante ahora el tejido de datos?
Aproximadamente una década después de que los macrodatos fueran nombrados el siguiente gran avance, las organizaciones se están dando cuenta de que la recogida y el almacenamiento de los datos es solo el comienzo de los beneficios de los datos. Para cumplir la promesa de los macrodatos —conocimientos revolucionarios, experiencias de vanguardia, nuevos modelos de negocio e inteligencia artificial en todas partes— se necesita un nuevo enfoque de la gestión de los datos. Este enfoque integra la información de todas las fuentes y hace que los datos estén disponibles cuando y donde se necesiten, sin importar el usuario o el punto de conexión, manteniendo los datos seguros dondequiera que residan o cuando estén en tránsito.
Gartner ha indicado que los tejidos de datos son una de las principales tendencias tecnológicas de 2022 y que pueden simplificar la infraestructura de integración de datos de una organización y crear una arquitectura escalable que reduzca los problemas de integración. Un tejido de datos también puede reducir los esfuerzos de gestión de los datos hasta en un 70%, lo que acelera el tiempo de obtención de valor.
¿Por qué usar un tejido de datos?
Un tejido de datos puede liberar el potencial oculto de los macrodatos dentro de su entorno de nube híbrida, al hacer que los datos sean accesibles en sus entornos locales, de nube pública, de nube privada y perimetral.
Estos son algunos de los retos habituales de la gestión de los datos que un tejido de datos puede abordar:
- La necesidad de almacenar los datos de un modo eficiente, al tiempo que los hace accesibles para los usuarios, los clientes y las automatizaciones que los necesitan.
- Flujos de datos geográficamente dispersos, soluciones de almacenamiento y usuarios finales
- Datos incompatibles: estructurados y no estructurados, datos para aplicaciones específicas, en silos y datos heredados
- Prestar servicio a una nueva generación de aplicaciones intensivas en datos que dependen de la inteligencia artificial y el aprendizaje automático, los análisis en tiempo real y las experiencias contextuales de los clientes.
- Optimización de los flujos de datos hacia y desde los dispositivos de IoT y las implementaciones de computación perimetral
- Mantener la seguridad de los datos y el cumplimiento normativo
¿Cómo funciona un tejido de datos?
El software de gestión de datos integra flujos de datos, usuarios, terminales, almacenamiento y arquitectura de red en una capa de gestión de datos que proporciona visibilidad y una interfaz para el control y la gestión. El software aprende toda la propiedad de datos de una organización, marca cuellos de botella y hace recomendaciones para mejorar el rendimiento y el acceso.
Con el software, los ingenieros de datos pueden ver una vista de alto nivel o profundizar más para mejorar el rendimiento de los casos de uso individuales. El software también establece un panorama de datos común y un conjunto de API para integrarse con aplicaciones, flujos de datos y casos de uso.
¿Cuáles son los elementos de un tejido de datos?
Un tejido de datos normalmente incluirá las siguientes capas:
- Gestión de datos: Ayuda a supervisar el estado del sistema, la seguridad de los datos y la optimización de la red.
- Ingestión de datos: Establece vías y procesos para los datos recién introducidos.
- Procesamiento de datos: Limpia, refina y transforma los datos, lo que hace que estén listos para usos específicos.
- Orquestación de datos: Ayuda al sistema a funcionar de manera más eficiente, al garantizar que solo se proporcionen los datos relevantes a los usuarios.
- Descubrimiento de datos: Ayuda a detectar nuevas conexiones entre diferentes fuentes de datos, liberando valor y señalando nuevos conocimientos.
- Acceso a los datos: Permite que una variedad de usuarios —aplicaciones, automatizaciones, equipos dentro de la organización o dispositivos— accedan a los datos de manera preparada para que puedan usarse sin fricciones.
- Seguridad de los datos: Supervisa y protege sus datos en toda su organización, garantizando al mismo tiempo el cumplimiento de las normativas de seguridad.
Ventajas de un tejido de datos
Además de resolver muchos retos relacionados con la ingeniería de datos, un tejido de datos ayuda a proporcionar los siguientes beneficios a toda la organización:
- Más valor de los datos: Un tejido de datos está diseñado para ayudar a una organización a utilizar más sus datos —por ejemplo, para proporcionar una mejor experiencia a los clientes, encontrar eficiencias operativas y permitir nuevos modelos de negocio—.
- Un mejor uso de los recursos: Al proporcionar una visión de alto nivel de los datos en una organización y usar la IA para hacer recomendaciones, un tejido de datos puede fundamentar la toma de decisiones de TI al mostrar cómo los costes y las cargas de recursos se acumulan en varios casos de uso.
- Agilidad y resiliencia mejoradas: Un tejido de datos puede ayudar a una organización a escalar o cambiar de acuerdo con las condiciones cambiantes o las nuevas realidades, modelando los cambios con antelación y proporcionando una base coherente sobre la que construir arquitecturas de datos.
¿Es un tejido de datos similar a un lago de datos?
Muchas organizaciones eligen los lagos de datos para resolver los problemas de acceso a los datos, pero un lago de datos es un enfoque descendente y se define como tener un repositorio maestro de datos. Los lagos de datos pueden crear un trabajo adicional en términos de transmisión y carga y hacer que los datos sean más difíciles de acceder y gestionar. Además, algunos datos pueden ser necesarios lo suficientemente lejos del lago de datos para introducir una latencia alta. En la práctica, un tejido de datos puede ayudar a las organizaciones a sacar más partido de un lago de datos.
¿Es un tejido de datos similar a la virtualización de datos?
Estos dos conceptos son más complementarios que opuestos. La virtualización de datos crea una interfaz para administrar, mover y trabajar con los datos. Un tejido de datos, por otro lado, es un método integral para optimizar cada parte de las operaciones de datos: rendimiento, costes, eficiencia de recursos, seguridad, crecimiento y gestión del cambio.
Casos de uso de Data Fabric
Estos son algunos ejemplos de cómo las organizaciones pueden aprovechar un tejido de datos para mejorar la accesibilidad a los datos:
- Las grandes empresas minoristas pueden integrar complejos datos de inventario y cadena de suministro para tomar decisiones fundamentadas sobre la producción y la planificación.
- Las empresas de consultoría informática pueden consolidar los datos de las solicitudes de asistencia al cliente y readaptar las estrategias de venta basándose en la información sobre las brechas en las soluciones disponibles.
- Los agricultores pueden incorporar flujos de datos dispares, como previsiones meteorológicas, condiciones del mercado y condiciones del suelo, en la toma de decisiones críticas.
Simplifique su estructura de datos con Pure Storage
La configuración de un tejido de datos que cubra totalmente todo su entorno de nube híbrida no es una pequeña hazaña. Tiene que integrar los datos en diferentes fuentes en sus entornos locales, de nube pública, de nube privada y perimetrales, manteniendo al mismo tiempo la gobernanza y la seguridad de los datos.
¿Tiene brechas en su estructura de datos o quiere configurar una propia? Pure Storage tiene las soluciones que necesita para crear y soportar un tejido de datos moderno:
- Pure1®: Una solución de gestión y supervisión del almacenamiento de datos impulsada por la IA que proporciona almacenamiento autónomo en toda su pila tecnológica.
- Entorno operativo Purity: Una plataforma unificada que gestiona de manera inteligente sus datos en Pure Storage ®FlashArray ™ —en centros de datos, en el borde o en la nube— y que le permite simplificar la gestión de los datos y eliminar los silos de almacenamiento.
- Pure Fusion ™: Una plataforma Almacenamiento-como-Código lleva el modelo operativo de la nube localmente. Aprovisione, gestione y consuma el almacenamiento empresarial con facilidad.
- Portworx®: Una solución completa de servicios de datos de Kubernetes para impulsar sus aplicaciones nativas de la nube.
- Pure Cloud Block Store™: Una solución multinube que proporciona una movilidad de datos fluida, resiliencia y una experiencia de usuario homogénea en todos sus entornos de nube.
Al simplificar el modo en que las personas consumen e interactúan con los datos, Pure permite que los innovadores aprovechen el potencial oculto de sus datos empresariales.