Pero, debido a que ahora está escribiendo nuevas versiones de datos en diferentes páginas flash, eventualmente acumula datos en esos bloques que podrían considerarse “basura” porque los datos han sido sobrescritos o eliminados lógicamente.
Cómo funciona la recolección de basura en SSD
Para recuperar esta capacidad física, un proceso de “recopilador de basura” en el firmware de la unidad toma los datos que aún son válidos y los mueve a una nueva ubicación para que luego pueda borrar todo el bloque que contiene los datos “detonados”. Para que este colector de basura funcione, cada unidad necesita memoria flash adicional, lo que se conoce como “espacio sobreaprovisionado”, y cada evento de recolección de basura consume uno de los números finitos de ciclos de borrado/programa flash. La cantidad de escrituras físicas en la unidad que consume cada escritura lógica se conoce como “amplificación de la escritura”.
El sobreaprovisionamiento y la amplificación de la escritura provocan un desgaste prematuro y una vida útil más corta del SSD. También hay impactos en el rendimiento de este diseño porque cada vez que uno de estos troqueles flash realiza la recolección de basura, las lecturas o escrituras no estarán disponibles a partir de ese troquel. Por lo tanto, el rendimiento de la SSD fluctúa de manera impredecible a medida que el recopilador de basura se vuelve más o menos activo.
Lo que hace que esto sea aún más desafiante es que las SSD no tienen forma de comunicar esta actividad de recolección de basura al sistema al que acceden. Más bien, el SSD tiene que mantener la ilusión de que es como un disco duro. A medida que aumenta la cantidad de bits por celda en flash NAND, estas inconsistencias de rendimiento solo empeoran, ya que los ciclos de programa/borrado tardan cada vez más, lo que lleva a períodos más largos de inaccesibilidad de datos.
Las ventajas de usar DirectFlash
DirectFlash adopta un enfoque diferente para la administración de medios flash. En lugar de desaprovisionar cada SSD para que realice su propio nivelación de desgaste, recolección de basura y sobreaprovisionamiento, el sistema operativo Purity realiza estas funciones en software a nivel de matriz. Esto significa que cada módulo DirectFlash es más simple que un disco de estado sólido tradicional, ya que solo tiene que proporcionar acceso a los medios en sí y manejar tareas de señalización y datos de bajo nivel.
Obtenga más información sobre cómo DirectFlash pone fin a las unidades de disco duro (HDD).
Los beneficios que esto ofrece son numerosos:
- Densidad y eficiencia mejoradas. Nuestros módulos DirectFlash (DFM) ofrecen una densidad de almacenamiento de dos a tres veces mejor y consumen de un 39 % a un 54 % menos de vatios por terabyte que nuestros competidores más cercanos en la actualidad. Los DFM de Pure Storage no emulan los HDD mecánicos, lo que permite que los medios flash basados en silicio se administren de manera óptima de una manera que mejora significativamente el rendimiento, la densidad de almacenamiento, la capacidad efectiva, la resistencia de los medios y el costo por TB utilizable en relación con los SSD COTS. Pure Storage está enviando DFM de 48TB hoy, agregará DFM de 75TB más adelante este año, agregará DFM de 150TB en un plazo de 18 meses y está planificando DFM de 300TB para 2026. Más información.
- Colocación inteligente de datos. En lugar de que cada SSD tome decisiones sobre la colocación de datos y la administración de medios en un vacío, Purity conoce todas las tareas del sistema programadas y en curso, como la actividad de E/S actual, las operaciones de reducción de datos, los ciclos de recolección de basura pendientes y la carga de trabajo y el estado generales de la matriz. Esto permite que Purity tome decisiones de ubicación y programación mucho más inteligentes de lo que podría hacer una sola unidad por sí sola.
- Al tomar decisiones de ubicación de datos más inteligentes, los datos de períodos de vida esperados similares pueden ubicarse conjuntamente en los mismos bloques para minimizar las instancias en las que algunos datos en bloques están “marcados con tormentas”, mientras que otras páginas siguen siendo válidas. Purity sabe si ciertas páginas forman parte del mismo archivo u objeto o provienen del mismo sistema host, por lo que al agrupar esas páginas en bloques similares cuando se elimina ese archivo u objeto, se puede liberar todo el bloque a la vez, sin volver a escribir otros datos en vivo y sin causar amplificación de la escritura.
- Superan y duran más. Al no realizar recolección de basura y no causar amplificación de la escritura, los módulos DirectFlash superan y superan a sus contrapartes de productos básicos. Menos escrituras significa menos desgaste y, por lo tanto, una vida útil más prolongada. Menos escrituras también significa que hay más ciclos de E/S disponibles para prestar servicio a la E/S del cliente “real”. Y como Purity conoce la actividad actual de E/S y tiene visibilidad de todo el sistema, nunca se sorprende con uno de estos ciclos de programa/borrado que bloquea el acceso a los datos. En el peor de los casos, Purity puede simplemente reconstruir esos datos a partir de la paridad en lugar de esperar a que finalice un ciclo de programa/borrado. Esto reduce significativamente la latencia del peor caso de nuestros sistemas, incluso cuando se usa flash QLC.
- Mejoran con el tiempo. Debido a que realizamos todas estas tareas de administración de medios en software, podemos mejorar este software con el tiempo. Todos los sistemas de Pure Storage conectados a Internet llaman de forma segura a los datos de telemetría doméstica y, dado que tenemos un conocimiento profundo sobre la salud y la actividad de la memoria flash subyacente, agregamos y analizamos estos datos para mejorar la forma en que funciona nuestro software en el mundo real. Esto significa que, con el tiempo, la confiabilidad y el rendimiento de nuestros sistemas pueden mejorar con actualizaciones de software regulares.
- Son más simples y confiables. Debido a que realizamos todas estas actividades a nivel de matriz en software, nuestros módulos DirectFlash no necesitan controladores complejos y grandes cantidades de RAM para hacer todo este trabajo por su cuenta. Por lo tanto, nuestros módulos son más simples y, por lo tanto, más confiables, además de ser más eficientes. También podemos escalar el tamaño de nuestras unidades con avances en la tecnología de fabricación flash NAND, sin necesidad de aumentar la complejidad o el costo de las unidades.
Esto significa para los clientes sistemas que tienen más rendimiento, de manera más consistente y más confiabilidad y longevidad que otros sistemas híbridos o basados íntegramente en tecnología flash diseñados en torno a SSD.
Pure Storage se fundó en torno a la creencia de que el futuro del centro de datos era flash, y hemos desarrollado nuestra tecnología DirectFlash para hacer realidad esta visión. Creemos que la mejor manera de crear sistemas basados íntegramente en tecnología flash es construir el sistema desde cero para los sistemas basados íntegramente en tecnología flash. Eso significa eliminar las partes del sistema diseñadas en torno a interfaces y paradigmas heredados y permitir que la tecnología realmente brille.
¿Quiere aprovechar la tecnología DirectFlash en su centro de datos? Consulte nuestro paquete de soluciones de almacenamiento basado íntegramente en tecnología flash hoy mismo.