Skip to Content

Por que os sistemas de armazenamento tradicionais não oferecem suporte ao Big Data

Três desafios do Big Data (e como superá-los)

O Big Data tem muitas qualidades: não estruturado, dinâmico e complexo. Mas, talvez o mais importante: O Big Data é grande. Os sensores humanos e IoT estão produzindo trilhões de gigabytes de dados todos os anos. Mas esses não são os dados de ontem: são dados modernos, em uma gama cada vez mais diversificada de formatos e de uma variedade cada vez maior de fontes. 

Isso está levando a um abismo entre os dados atuais e os sistemas de ontem. O grande tamanho e a escala, juntamente com sua velocidade e complexidade, estão colocando um novo tipo de estresse nos sistemas tradicionais de armazenamento de dados. Muitos são simplesmente mal equipados, e as organizações que querem usar essa mina de ouro de dados estão enfrentando obstáculos. 

Por que isso está acontecendo? Quais são os principais desafios do Big Data a serem conhecidos? Se você quiser aproveitar o poder do Big Data, suas soluções de armazenamento serão suficientes para superá-las?

1. O Big Data é muito grande para o armazenamento tradicional

Talvez o mais óbvio dos desafios do Big Data seja sua enorme escala. Normalmente, medimos em petabytes (ou seja, 1.024 terabytes ou 1.048.576 gigabytes).

Para dar uma ideia de como o Big Big Data pode ser, veja um exemplo: usuários do Facebook carregam pelo menos 14,58 milhões de fotos por hora. Cada foto reúne interações armazenadas com ela, como curtidas e comentários. Os usuários “curtiram” pelo menos um trilhão de publicações, comentários e outros pontos de dados. 

Mas não são apenas gigantes da tecnologia como o Facebook que estão armazenando e analisando grandes quantidades de dados. Até mesmo uma pequena empresa que recebe uma parte das informações de mídia social, por exemplo, para ver o que as pessoas estão dizendo sobre sua marca, exige uma arquitetura de armazenamento de dados de alta capacidade.

Os sistemas tradicionais de armazenamento de dados podem, em teoria, lidar com grandes quantidades de dados. Mas quando temos a tarefa de oferecer a eficiência e os insights necessários, muitos simplesmente não conseguem acompanhar as demandas dos dados modernos.

O enigma do banco de dados relacional

Bancos de dados SQL relacionais são métodos confiáveis e demorados para armazenar, ler e gravar dados. Mas esses bancos de dados podem ter dificuldade para operar com eficiência, mesmo antes de atingirem a capacidade máxima. Um banco de dados relacional contendo grandes quantidades de dados pode se tornar lento por muitos motivos. Por exemplo, cada vez que você insere um registro em um banco de dados relacional, o índice deve ser atualizado automaticamente. Essa operação leva mais tempo cada vez que o número de registros aumenta. Inserir, atualizar, excluir e executar outras operações pode demorar mais, dependendo do número de relacionamentos com outras tabelas. 

Resumindo: Quanto mais dados estiverem em um banco de dados relacional, mais tempo cada operação levará.

Expansão horizontal x expansão horizontal

Também é possível expandir os sistemas tradicionais de armazenamento de dados para melhorar o desempenho. Mas como os sistemas tradicionais de armazenamento de dados são centralizados, você é forçado a expandir “aumentar” em vez de “desativar”.

Expandir é menos eficiente em recursos do que expandir horizontalmente, pois exige que você adicione novos sistemas, migre dados e gerencie a carga em vários sistemas. A arquitetura de armazenamento de dados logo se torna muito ampla e difícil de gerenciar corretamente.

Tentar usar a arquitetura de armazenamento tradicional para Big Data está condenado a falhar em parte porque a quantidade de dados torna não realista expandir suficientemente. Isso torna a expansão horizontal a única opção realista. Usando uma arquitetura de armazenamento distribuído, você pode adicionar novos nós a um cluster assim que atingir uma determinada capacidade, e pode fazer isso indefinidamente.

2. O Big Data é muito complexo para o armazenamento tradicional

Outro grande desafio para o armazenamento tradicional quando se trata de Big Data? A complexidade dos estilos de dados. Os dados tradicionais são “estruturados”. Você pode organizá-lo em tabelas com linhas e colunas que têm uma relação direta entre si.

Um banco de dados relacional, o tipo de banco de dados que armazena dados tradicionais, consiste em registros contendo campos claramente definidos. Você pode acessar esse tipo de banco de dados usando um sistema de gerenciamento de banco de dados relacional (RDBMS ), como MySQL , Oracle DB ou SQL Server.

Um banco de dados relacional pode ser relativamente grande e complexo: Ela pode consistir em milhares de linhas e colunas. Mas, crucialmente, com um banco de dados relacional, você pode acessar um dado por referência à sua relação com outro dado.

O Big Data nem sempre se encaixa perfeitamente nas linhas e colunas relacionais de um sistema de armazenamento de dados tradicional. Ela é em grande parte não estruturada, consistindo em uma infinidade de tipos de arquivos e, muitas vezes, incluindo imagens, vídeos, áudio e conteúdo de mídia social. É por isso que as soluções de armazenamento tradicionais não são adequadas para trabalhar com Big Data: Eles não conseguem categorizá-la adequadamente.

Aplicativos avançados em contêiner também criam novos desafios de armazenamento. Por exemplo, os aplicativos Kubernetes são mais complexos do que os aplicativos tradicionais. Esses aplicativos contêm muitas partes, como pods, volumes e configmaps, e exigem atualizações frequentes. O armazenamento tradicional não pode oferecer a funcionalidade necessária para executar o Kubernetes com eficiência.

O uso de um banco de dados não relacional (NoSQL), como MongoDB, Cassandra ou Redis, pode permitir que você obtenha insights valiosos sobre conjuntos complexos e variados de dados não estruturados.

3. O Big Data é rápido demais para o armazenamento tradicional

Os sistemas tradicionais de armazenamento de dados são para retenção constante de dados. Você pode adicionar mais dados regularmente e realizar análises no novo conjunto de dados. Mas o Big Data cresce quase instantaneamente, e a análise muitas vezes precisa ocorrer em tempo real. Um RDBMS não foi desenvolvido para flutuações rápidas.

Veja os dados do sensor, por exemplo. Os dispositivos de Internet das coisas (IoT) precisam processar grandes quantidades de dados de sensores com latência mínima. Os sensores transmitem dados do “mundo real” a uma taxa quase constante. Os sistemas de armazenamento tradicionais lutam para armazenar e analisar dados que chegam a essa velocidade.

Ou outro exemplo: cibersegurança. Os departamentos de TI devem inspecionar cada pacote de dados que chega pelo firewall de uma empresa para verificar se ele contém código suspeito. Muitos gigabytes podem estar passando pela rede todos os dias. Para evitar ser vítima de um cibercrime, a análise deve ocorrer instantaneamente, armazenando todos os dados em uma tabela até o final do dia não é uma opção.

A natureza de alta velocidade do Big Data não é gentil com os sistemas de armazenamento tradicionais, que podem ser a causa raiz da falha do projeto ou do ROI não realizado.

4. Desafios do Big Data exigem soluções avançadas de armazenamento

As arquiteturas de armazenamento tradicionais são adequadas para trabalhar com dados estruturados. Mas quando se trata da natureza vasta, complexa e de alta velocidade do Big Data não estruturado, as empresas precisam encontrar soluções alternativas para começar a obter os resultados que estão procurando.

Sistemas de armazenamento distribuídos, escaláveis e não relacionais podem processar grandes quantidades de dados complexos em tempo real. Essa abordagem pode ajudar as organizações a superar os desafios do Big Data com facilidade e começar a obter insights inovadores.

Se sua arquitetura de armazenamento estiver com dificuldades para acompanhar as necessidades da sua empresa, ou se você quiser obter a vantagem competitiva de uma empresa madura em dados, fazer upgrade para uma solução de armazenamento moderna capaz de aproveitar o poder do Big Data pode fazer sentido. 

A Pure oferece uma série de soluções simples e confiáveis de armazenamento como serviço (STaaS, Storage-as-a-Service) que são escaláveis para qualquer tamanho de operação e adequadas para todos os casos de uso. Saiba mais ou comece hoje mesmo.

11/2020
VMware Hybrid Cloud Solution Brief | Solution Brief
Hybrid cloud and container adoption are growing rapidly. Advance to an effortless, optimized VMware environment.
Resumo da solução
3 páginas
ENTRE EM CONTATO
Dúvidas ou comentários?

Tem dúvidas ou comentários sobre produtos ou certificações da Pure?  Estamos aqui para ajudar.

Agende uma demonstração

Agende uma demonstração ao vivo e veja você mesmo como a Pure pode ajudar a transformar seus dados em resultados poderosos. 

Telefone: 55-11-2844-8366

Imprensa: pr@purestorage.com

 

Sede da Pure Storage

Av. Juscelino Kubitschek, 2041

Torre B, 5º andar - Vila Olímpia

São Paulo, SP

04543-011 Brasil

info@purestorage.com

FECHAR
Seu navegador não é mais compatível.

Navegadores antigos normalmente representam riscos de segurança. Para oferecer a melhor experiência possível ao usar nosso site, atualize para qualquer um destes navegadores mais atualizados.