Para garantir que os usuários sempre tenham acesso às suas informações, os computadores usam recursos de armazenamento para manter os dados persistentes e disponíveis mesmo depois de serem desligados. Os dados persistentes não desaparecem quando um computador perde energia. Os usuários podem recuperar seus arquivos e dados mesmo após uma queda de energia usando armazenamento persistente, como um dispositivo de armazenamento local ou armazenamento em rede.
O que são dados persistentes?
Dados persistentes são quaisquer dados armazenados em um meio de armazenamento não volátil que permanecem acessíveis para uso de longo prazo até que sejam excluídos ou substituídos propositadamente. Os dados persistentes permanecerão mesmo depois que a energia do dispositivo for desligada.
Os computadores têm armazenamento primário na forma de memória de acesso aleatório (RAM, random access memory). A RAM é rápida e armazena gigabytes de dados para aplicativos recuperarem e para a unidade de processamento central (CPU, Central Processing Unit) realizar cálculos. Quando o computador é desligado, a RAM não pode mais armazenar dados. A memória RAM em um computador precisa de atualizações de energia uniformes para que os dados não persistentes armazenados no armazenamento primário sejam perdidos quando um computador é desligado.
Para garantir que os usuários possam retornar aos dados após uma queda de energia, os computadores usam discos de armazenamento secundários para manter os dados persistentes e disponíveis. Dados persistentes incluem os arquivos e aplicativos armazenados em um dispositivo de armazenamento secundário que continua disponível mesmo após uma queda de energia. O dispositivo de armazenamento secundário que mantém os dados persistentes pode ser um disco interno, uma unidade flash externa ou uma matriz de dispositivos de armazenamento em uma rede (por exemplo, armazenamento anexado à rede).
Como funcionam os dados persistentes?
A maioria dos computadores tem um dos dois tipos de unidades para armazenar dados persistentes: uma unidade de estado sólido (SSD, Solid-State Drive) ou uma unidade de disco rígido (HDD, Hard-Disk Drive). Alguns computadores têm um sistema de armazenamento híbrido com SSD e HDD. Um SSD é um tipo de armazenamento flash que armazena dados mesmo depois que o computador é desligado. Um HDD é uma série de pratos mecânicos que persistem nos dados usando magnetismo. Ambas as unidades são opções viáveis para dados persistentes, mas uma SSD é frequentemente preferida para desempenho de aplicativos. Os HDDs são preferidos para backups e recuperação.
O armazenamento na nuvem também oferece recursos para dados persistentes. As empresas podem optar por armazenar todos os seus dados na nuvem ou podem usar um modelo híbrido e armazenar apenas alguns de seus dados na nuvem. A vantagem da nuvem para dados persistentes é que ela é mais segura, disponível e exige menos manutenção da equipe.
Exemplos de dados persistentes
Os dados persistentes vêm de várias formas. Por exemplo, um banco de dados armazena dados em unidades de disco para recuperá-los para consultas de aplicativos e usuários. Os bancos de dados relacionais e os bancos de dados NoSQL usam dados persistentes para processamento e consulta de back-end. Os aplicativos de análise usados para impulsionar o marketing e as vendas podem usar um banco de dados NoSQL e aprendizado de máquina para previsões futuras. Uma loja básica de e-commerce pode usar um banco de dados relacional para armazenar informações de produtos e pedidos de clientes.
Cada arquivo salvo armazenado em um disco é uma forma de dados persistentes. Quando os usuários armazenam um arquivo em seu disco local ou na nuvem, os arquivos são armazenados em um disco onde podem ser acessados e recuperados no futuro. A maioria do armazenamento em nuvem tem backup e segurança integrados em recursos, para que qualquer falha de hardware não destrua os dados permanentemente.
Dados não estruturados são conhecidos como armazenamento de objetos e persistem usando bancos de dados NoSQL. As empresas podem armazenar documentos e coletar dados sem formato ou estrutura específica e armazená-los em data warehouses com bancos de dados NoSQL usados para consulta e recuperação. O armazenamento de objetos requer grandes quantidades de espaço em disco, por isso, muitas vezes é descarregado para recursos de nuvem para economizar dinheiro e aproveitar as opções de escalabilidade.
Dados persistentes x dados voláteis
O armazenamento primário mantém dados voláteis. Os dados voláteis não persistem após uma queda de energia, portanto, os computadores precisam de um disco secundário para manter os dados viáveis depois que a energia é desligada. Os computadores usam RAM dinâmica (DRAM) e RAM estática (SRAM) para armazenar dados voláteis e informações em cache. A DRAM e a SRAM são mais rápidas do que o armazenamento persistente, mas sua volatilidade requer um dispositivo de armazenamento secundário.
Os provedores de nuvem geralmente oferecem bancos de dados na memória como uma maneira de oferecer desempenho rápido de aplicativos para consultas e entrega de dados em tempo real. Os bancos de dados na memória usam memória volátil para armazenar dados de aplicativos, o que os torna rápidos, mas cria o risco de dados perdidos após uma falha de hardware. Uma combinação de processamento na memória com armazenamento de dados persistente é a melhor solução para a maioria dos aplicativos de negócios.
Um exemplo de caso de uso para bancos de dados na memória é a licitação em tempo real. Os usuários fazem lances em um produto específico e outro usuário pode fazer lances em milissegundos. Essas propostas devem estar disponíveis quase instantaneamente para que outros licitantes obtenham informações precisas. O sistema de licitação usa bancos de dados na memória para manter os valores da proposta atualizados, mas as informações da proposta ainda são armazenadas em discos de armazenamento de dados persistentes.
Dados persistentes x dados dinâmicos
A maioria dos dados deve ser alterada com frequência ou com pouca frequência. Por exemplo, seu número de previdência social pode mudar ao longo da vida, mas seu endereço residencial provavelmente mudará com mais frequência. Dados dinâmicos são dados que são atualizados ou alterados ocasionalmente, e as empresas precisam de uma maneira de atualizar os dados armazenados conforme necessário. A maioria dos bancos de dados padrão permite que as empresas e seus aplicativos atualizem dados dinâmicos.
As empresas podem comprar dados dinâmicos para garantir que tenham as informações mais atualizadas para serviços e suporte ao cliente. Por exemplo, uma empresa imobiliária precisa de dados atualizados continuamente para monitorar novas casas no mercado e mudanças nos preços das moradias. A importação de dados dinâmicos de terceiros mantém os dados armazenados de uma empresa imobiliária atualizados para que eles possam oferecer serviços eficazes aos clientes.
Dados persistentes são uma forma de dados dinâmicos, mas também podem ser dados estáticos. Os dados estáticos não mudam, mas persistem em um dispositivo de armazenamento. Os dados dinâmicos também persistem em um disco, mas os aplicativos e usuários podem alterar os dados quantas vezes quiserem. As alterações nos dados dinâmicos também são armazenadas no disco para que as informações atualizadas estejam disponíveis aos usuários.
Benefícios e desvantagens dos dados persistentes
Toda empresa precisa de dados persistentes, mas o desafio é preservar a integridade e a disponibilidade dos dados após as alterações. A maioria dos bancos de dados tem tecnologia avançada para reduzir “leituras sujas”, fazendo com que dados incorretos sejam devolvidos e potencialmente armazenados no disco. Os arquivos de log acompanham as transações do banco de dados para evitar a perda da integridade dos dados.
As empresas devem ter um plano de armazenamento de dados para manter os dados consistentes e seguros. Os dados devem ser normalizados para que permaneçam uniformes em todos os aplicativos e não sejam atualizados em vários locais, levando a possíveis imprecisões. Todos os dados devem ser protegidos usando regras de autenticação e autorização, e sistemas de monitoramento devem estar em vigor para detectar qualquer atividade suspeita.
O armazenamento na nuvem oferece uma opção flexível para as empresas manterem os orçamentos de TI baixos enquanto reduzem a sobrecarga de manutenção. Os administradores têm recursos integrados para proteger backups de banco de dados e dados de produção, e não precisam manter o hardware. As empresas devem sempre ter backups de seus dados persistentes, e a nuvem oferece a escalabilidade para aumentar a capacidade conforme mais dados são coletados e armazenados.
Conclusão
Para todos os negócios, são necessários armazenamento primário e secundário. O armazenamento secundário mantém os dados disponíveis mesmo após uma queda de energia. Como os dados não são perdidos em um disco, eles são considerados dados persistentes. Dados persistentes são um componente essencial na produtividade dos negócios, e a opção mais flexível e escalável é o armazenamento em nuvem. Procurando a melhor solução de armazenamento persistente para cargas de trabalho de contêineres? Confira a Portworx ® hoje mesmo.