Mas, como agora você está gravando novas versões de dados em diferentes páginas flash, acaba acumulando dados nesses blocos que poderiam ser considerados “lixo” porque os dados foram substituídos ou excluídos logicamente.
Como a coleta de lixo funciona em SSDs
Para recuperar essa capacidade física, um processo de “coletor de lixo” no firmware da unidade pega os dados que ainda são válidos e os move para um novo local para que ele possa apagar todo o bloco contendo os dados “tombstoned”. Para que esse coletor de lixo funcione, cada unidade precisa de memória flash extra, o que é conhecido como “espaço superprovisionado” e cada evento de coleta de lixo consome um dos números finitos de ciclos de exclusão/programa flash. A quantidade de gravações físicas na unidade que cada gravação lógica consome é conhecida como "ampliação de gravação".
O provisionamento excessivo e a ampliação de gravação levam a desgaste prematuro e a uma vida útil reduzida da SSD. Também há impactos no desempenho desse design, pois sempre que um desses flash morre, a coleta de lixo, as leituras ou gravações não estarão disponíveis nesse dado. Portanto, o desempenho da SSD flutua de forma imprevisível conforme o coletor de lixo se torna mais ou menos ativo.
O que torna isso ainda mais desafiador é que as SSDs não têm como comunicar essa atividade de coleta de lixo ao sistema que a acessa. Em vez disso, a SSD precisa manter a ilusão de que é como um disco rígido. À medida que o número de bits por célula no flash NAND aumenta, essas inconsistências de desempenho só pioram, pois os ciclos de programa/exclusão demoram cada vez mais, levando a períodos mais longos de inacessibilidade de dados.
Os benefícios de usar o DirectFlash
O DirectFlash adota uma abordagem diferente para o gerenciamento de mídia flash. Em vez de deputar cada SSD para executar seu próprio nivelamento de desgaste, coleta de lixo e provisionamento excessivo, o sistema operacional Purity executa essas funções em software no nível do array. Isso significa que cada módulo DirectFlash é mais simples do que um disco de estado sólido tradicional, pois só precisa fornecer acesso à mídia em si e lidar com tarefas de sinalização e dados de baixo nível.
Saiba mais sobre como o DirectFlash está acabando com as unidades de disco rígido (HDDs).
Os benefícios que isso oferece são inúmeros:
- Densidade e eficiência aprimoradas. Nossos módulos DirectFlash (DFMs, DirectFlash Modules) oferecem uma densidade de armazenamento duas a três vezes melhor e consomem de 39% a 54% menos watts por terabyte do que nossos concorrentes mais próximos hoje. Os DFMs da Pure Storage não simulam HDDs mecânicos, permitindo que a mídia flash baseada em silício seja gerenciada de maneira otimizada de uma maneira que melhore significativamente o desempenho, a densidade do armazenamento, a capacidade efetiva, a durabilidade da mídia e o custo por TB utilizável em relação aos SSDs COTS. A Pure Storage está enviando DFMs de 48TB hoje, adicionando DFMs de 75TB no final deste ano, adicionando DFMs de 150TB em 18 meses e planejando DFMs de 300TB até 2026. Saiba mais.
- Colocação inteligente de dados. Em vez de cada SSD tomar decisões sobre colocação de dados e gerenciamento de mídia em um vácuo, o Purity sabe sobre todas as tarefas do sistema em andamento e programadas, como atividade atual de E/S, operações de redução de dados, ciclos pendentes de coleta de lixo e carga de trabalho e integridade gerais do array. Isso permite que o Purity tome decisões de posicionamento e agendamento muito mais inteligentes do que uma única unidade poderia fazer sozinha.
- Ao tomar decisões mais inteligentes sobre o posicionamento de dados, os dados com expectativa de vida útil semelhante podem ser colocalizados nos mesmos blocos para minimizar casos em que alguns dados nos blocos são “calculados”, enquanto outras páginas ainda são válidas. O Purity sabe se certas páginas fazem parte do mesmo arquivo ou objeto ou vêm do mesmo sistema host. Assim, ao agrupar essas páginas em blocos semelhantes quando esse arquivo ou objeto é excluído, todo o bloco pode ser liberado de uma só vez, sem regravar outros dados ativos e causar ampliação de gravação.
- Elas superam e duram. Ao não realizar a coleta de lixo e não causar ampliação de gravação, os módulos DirectFlash superam e duram mais do que seus equivalentes de mercadoria. Menos gravações significam menos desgaste e, assim, maior vida útil. Menos gravações também significa que mais ciclos de E/S estão disponíveis para atender E/S de cliente “real”. E como o Purity sabe sobre a atividade atual de E/S e tem visibilidade de todo o sistema, nunca se surpreende com um desses ciclos de programa/exclusão bloqueando o acesso aos dados. No pior caso, o Purity pode apenas reconstruir esses dados da paridade em vez de esperar que um ciclo de programa/exclusão termine. Isso reduz significativamente a latência de pior caso de nossos sistemas, mesmo ao usar o flash QLC.
- Elas melhoram com o tempo. Como executamos todas essas tarefas de gerenciamento de mídia no software, podemos melhorar esse software ao longo do tempo. Todos os sistemas da Pure Storage conectados à Internet conectam com segurança os dados de telemetria doméstica e, como temos insights profundos sobre a integridade e a atividade da memória flash subjacente, agregamos e analisamos esses dados para melhorar a forma como nosso software funciona no mundo real. Isso significa que, com o tempo, a confiabilidade e o desempenho dos nossos sistemas podem melhorar com atualizações regulares de software.
- São mais simples e confiáveis. Como realizamos todas essas atividades no nível do array em software, nossos módulos DirectFlash não precisam de controladores complexos e grandes quantidades de RAM para fazer todo esse trabalho sozinhos. Assim, nossos módulos são mais simples e, portanto, mais confiáveis, além de serem mais eficientes. Também podemos dimensionar o tamanho de nossas unidades com avanços na tecnologia de fabricação flash NAND, sem a necessidade de aumentar a complexidade ou o custo da unidade.
Isso significa para os clientes sistemas que têm mais desempenho, mais consistência e mais confiabilidade e longevidade do que outros sistemas totalmente flash ou híbridos desenvolvidos em torno de SSDs.
A Pure Storage foi fundada com base na crença de que o futuro do datacenter era totalmente flash, e desenvolvemos nossa tecnologia DirectFlash para tornar essa visão uma realidade. Acreditamos que a melhor maneira de criar sistemas totalmente flash é criar o sistema desde o início para totalmente flash. Isso significa eliminar as partes do sistema desenvolvidas em torno de interfaces e paradigmas legados e deixar a tecnologia realmente brilhar.
Quer aproveitar a tecnologia DirectFlash em seu datacenter? Confira nosso pacote de soluções de armazenamento totalmente flash hoje mesmo.