Skip to Content

¿Qué es la gestión del almacenamiento jerárquico?

Hay problemas relacionados con el manejo, el traslado, el almacenamiento o el procesamiento de grandes volúmenes de cualquier cosa y en todos los dominios totalmente no relacionados, esos problemas pueden parecer muy similares. Considere el servicio postal: Se necesita una compleja red de aviones, barcos, semicamiones, máquinas, vehículos de reparto y personas para conseguir cartas y paquetes donde pertenezcan. Y en cada paso del proceso, hay unos riesgos enormes relacionados con la eficiencia, el coste, el retraso y los errores.

Por ejemplo, imagínese usar un semicamión para entregar correo puerta a puerta y cuánto espacio desperdiciaría en el camión. O imagine una flota de pequeños vehículos eléctricos de entrega de correo que conducen el correo desde Alaska a Florida en lugar de usar un avión.

Estos son ejemplos simplistas, pero ayudan a explicar por qué existe la gestión jerárquica del almacenamiento (HSM). Las organizaciones con una gran huella de datos se enfrentan a problemas constantes de eficiencia y se dedica mucho esfuerzo a planificar cómo almacenar, mover y procesar toda esa información. La gestión del almacenamiento jerárquico (HSM) es el método histórico para garantizar que las organizaciones esencialmente no utilicen los semicamiones como vehículos de entrega para sus datos digitales.

En este artículo, exploraremos el HSM, los problemas que tiene como objetivo resolver y algunas de las alternativas modernas a él.

¿Qué es la gestión del almacenamiento jerárquico?

La gestión del almacenamiento jerárquico, o HSM, es un proceso de gestión de los datos digitales que tiene como objetivo utilizar los medios de almacenamiento de la manera más económica posible, minimizando al mismo tiempo las ineficiencias en el uso de los datos.

Dos hechos clave que subyacen al HSM: En primer lugar, los diferentes métodos de almacenamiento de los medios digitales tienen diferentes características. En segundo lugar, no todos los datos se tratan por igual. En primer lugar, la diferencia más evidente entre los distintos medios de almacenamiento digital es el coste. Los medios de almacenamiento más rápidos, más disponibles y más versátiles suelen ser los más caros. Y en el segundo punto, algunos datos se usan a diario, mientras que otros se usan con mucha menos frecuencia.

Los resultados de muchas empresas dependen del acceso rápido a sus datos más esenciales. Pero sería muy ineficiente pagar tanto por almacenar y acceder a los datos que usan una fracción del tiempo con el mismo nivel de velocidad y disponibilidad.

Diferentes organizaciones implementan HSM de manera diferente —no hay un solo libro de reglas para hacer HSM—. Pero cada vez que una organización divide su almacenamiento de datos en al menos dos niveles, el HSM es el proceso de establecer las reglas para lo que se almacena donde y cómo se mueve.

Ventajas de la gestión del almacenamiento jerárquico

Las organizaciones pueden ver una serie de ventajas de implementar la gestión del almacenamiento jerárquico. El ahorro de costes es el beneficio más evidente de HSM: Al pasar los datos menos urgentes a unos medios de almacenamiento más baratos, las empresas pueden sacrificar la disponibilidad por el coste. El rendimiento también suele mejorarse con los principios de HSM. Cuando las aplicaciones que necesitan acceder a los datos no tienen que perder tiempo cribando datos antiguos, obsoletos o irrelevantes, pueden proporcionar mejores resultados, más rápidamente.

Y aunque el HSM puede sonar complicado, unas buenas reglas de dónde pertenecen las diferentes categorías de datos y su aplicación automática, simplifican la gestión de los datos. El HSM también optimiza el uso del almacenamiento porque migra automáticamente los datos al nivel de almacenamiento adecuado, basándose en las reglas establecidas por los profesionales informáticos.

¿Cómo funciona la gestión del almacenamiento jerárquico?

El HSM puede consistir en muchas capas de medio de almacenamiento, pero su núcleo es que en un extremo es un nivel de alto rendimiento y en el otro es un nivel más lento y menos caro. Históricamente, el nivel de alto rendimiento se ha formado por memoria de clase de almacenamiento, unidades de estado sólido (SSD) flash de nivel empresarial y unidades de disco duro de alto rendimiento. En el extremo inferior hay dispositivos como los discos ópticos e incluso el almacenamiento en cinta.

La implementación real de las políticas de HSM es bastante complicada, pero HSM funciona básicamente identificando la frecuencia con la que se accede a un archivo y, a medida que pasa el tiempo, el sistema mueve automáticamente los archivos usados con poca frecuencia a un almacenamiento más lento y menos caro. Los equipos informáticos escriben reglas para los parámetros que definen cuándo se mueven los datos, qué datos están exentos de estas reglas y otras aclaraciones. Pero el HSM suele ser un proceso automatizado que optimiza el acceso a los datos y los costes del almacenamiento de datos.

¿Cuáles son los niveles de HSM?

La clave para entender el HSM y el uso de medios de almacenamiento como las unidades de cinta es que hubo un momento en el que las diferencias entre el coste, el rendimiento y la velocidad eran extremas. Si bien esas brechas se han reducido y se están reduciendo continuamente, hubo un momento en el que la diferencia de costes entre los discos ópticos y las unidades de estado sólido era lo suficientemente importante como para justificar los métodos complicados de clasificación de los datos, para que nunca se desperdiciara dinero.

El nivel de HSM de menor volumen y mayor rendimiento suele denominarse Nivel 0. Se trata de datos de misión crítica que no pueden permitirse retrasos o interrupciones en el servicio. El Nivel 1 suele denominarse "datos calientes", datos que se utilizan continuamente para las operaciones comerciales diarias y cuya inmediatez puede equilibrarse con los costes del almacenamiento. El nivel 2 son los "datos calientes", en los que las consideraciones de costes tienen una prioridad sustancial y en los que los datos a los que no se accede con frecuencia se ponen. Por último, el Nivel 3 suele referirse a los "datos fríos" o a los datos a los que rara vez se accede o se actualizan, si es que lo hacen.

Alternativas All-flash a los Niveles HSM

En un mundo perfecto, una empresa puede tener un almacenamiento rápido y muy disponible en todos los niveles, con unas sutiles demarcaciones entre ellos. Durante décadas, el sueño ha sido el almacenamiento de datos totalmente flash a nivel empresarial. Pero hasta hace poco, simplemente no era factible. Sin embargo, en las últimas décadas, el coste del almacenamiento all-flash a nivel empresarial no solo es posible, sino que lo hacen regularmente empresas de tamaño tan grande como Meta.

Pure Storage es un destacado campeón del almacenamiento empresarial totalmente flash y, ya en 2012, desarrolló soluciones de almacenamiento flash que podrían cubrir las necesidades de Nivel 0 de una red empresarial. Cuando se lanzó FlashArray//C™, Pure Storage podía prometer una latencia constante de un solo milisegundo para las cargas de trabajo y los datos críticos para el negocio de las redes empresariales, con una disponibilidad del 99,9999% y actualizaciones no disruptivas.

Eso fue revolucionario por derecho propio y luego FlashArray//X™ y FlashArray//XL™ permitieron ejecutar todo, desde bases de datos masivas hasta aplicaciones nativas de la nube en la memoria flash. Incluso con esos avances, la sabiduría popular sigue creyendo que los niveles 2 y 3 nunca llegarían a la memoria flash debido al coste.

Pero en 2023, Pure Storage lanzó FlashArray//E™ y FlashBlade//E™, lo que supone un reto para los discos giratorios y las cintas de gama baja. Diseñado para la conservación a largo plazo, FlashArray//E proporciona 1PB-4PB de capacidad de almacenamiento de datos de bloques y archivos sin procesar y unificados. FlashBlade//E puede ahorrar mucho dinero a las empresas cuando almacenan cargas de trabajo no estructuradas y de objetos.

Pure Storage es el ejemplo de las alternativas totalmente flash a los niveles HSM en organizaciones de cualquier tamaño. Si bien no estamos eliminando HSM per se, estamos remodelando radicalmente las líneas que separan los niveles de HSM.

Conclusión

La gestión del almacenamiento jerárquico surgió como una respuesta necesaria a las enormes diferencias de costes que existían entre las formas más rápidas, más caras y más lentas y más asequibles de almacenamiento de datos. Las limitaciones tecnológicas han dado lugar a un campo profesional completo dedicado a categorizar, mover y optimizar automáticamente las soluciones de almacenamiento de datos.

El HSM sigue siendo un proceso importante de ahorro de costes, pero las soluciones all-flash de escala empresarial, como las que ofrece Pure Storage, acaban rápidamente con las estrictas delimitaciones entre ellas y proporcionan grandes volúmenes de datos rápidos a fracciones del coste que solían necesitar.

09/2024
FlashBlade//S Data Sheet
Unlock new levels of power, space, and performance efficiency for your unstructured data workloads with Pure Storage® FlashBlade//S.
Hoja de datos
4 páginas
CONTACTAR CON NOSOTROS
¿Preguntas, comentarios?

¿Tiene alguna pregunta o comentario sobre los productos o las certificaciones de Pure?  Estamos aquí para ayudarle.

Programe una Demostración

Programe una demostración en vivo y vea personalmente cómo Pure puede ayudarle a convertir sus datos en unos resultados potentes. 

Llámenos al: +34 51 889 8963

Medios de comunicaciónpr@purestorage.com

 

Castellana 81

28046 Madrid

Oficinas Pure: 1415 y 1417 (planta 14)

info@purestorage.com

CERRAR
Your Browser Is No Longer Supported!

Older browsers often represent security risks. In order to deliver the best possible experience when using our site, please update to any of these latest browsers.