데이터 스프롤이란 무엇이며 어떻게 관리할 수 있을까요?
데이터 스프롤은 조직이 어떤 데이터가 있는지 또는 해당 데이터로 어떤 일이 일어나고 있는지 더 이상 알지 못하는 지점까지 방대한 양의 데이터를 축적하는 것입니다. 데이터 스프롤은 관리 오버헤드 증가(즉, 덜 영향력 있는 관리 업무와 기술 인재를 연결), 숨겨진 보안 위험, 고객 데이터의 차선적인 사용 또는 올바른 데이터를 올바른 업무에 사용하지 않는 형태의 기회 상실 등 많은 명백한 단점을 수반합니다. SaaS(SaaS-as-a-Service) 애플리케이션이 급증함에 따라, 데이터 확산은 더욱 보편화되고 다루기 어려워질 뿐입니다.
데이터 확산의 원인은 무엇일까요?
엔터프라이즈 애플리케이션과 운영 체제는 다양한 엔드포인트에 저장된 다양한 정형 및 비정형 데이터를 사용합니다. 데이터는 온프레미스 또는 서로 다른 지리적 영역에 위치한 하나 이상의 클라우드 플랫폼에 로컬로 저장될 수 있습니다.
그렇기 때문에 데이터 스프롤이 SaaS 스프롤과 동의어로 인식되는 이유가 있습니다. 왜냐하면 주로 SaaS 애플리케이션에 의해 발생하기 때문입니다. CRM, 화상 회의 시스템, 프로젝트 관리 도구 및 파일 스토리지 애플리케이션과 같은 SaaS 앱은 이를 사용하는 조직 내에서 방대한 양의 데이터를 생성합니다. 또한, 직원들이 회사 관련 데이터를 자신의 노트북에 저장하여 무분별한 확산을 촉진합니다.
수백 개의 SaaS 애플리케이션과 데이터 스토리지를 다양한 장소와 다양한 디바이스에 통합하면 데이터 확산을 위한 완벽한 레시피를 얻을 수 있습니다.
데이터 스프롤의 위험
기술 분야에서 오랜 시간 동안 데이터 스프롤과 같은 데이터가 급증했습니다. 즉, 무엇을 해야 할지 아는 것보다 더 많은 데이터를 보유하고 있고, 많은 데이터가 어디에 있는지도 모를 정도로 많은 데이터가 급증했습니다. 오일을 너무 많이 소유하는 것이 어떻게 나쁘겠습니까? 하지만 시대는 바뀌었습니다. 데이터 스프롤의 보안, 데이터 관리 및 데이터 스토리지의 영향은 너무 넓어 문제가 되어 좋은 것으로 볼 수 없습니다.
다음은 데이터 확산의 주요 과제입니다.
규정 미준수
GDPR과 같은 엄격한 데이터 개인정보 보호법이 등장함에 따라 기업들은 민감한 데이터의 위치를 정확히 파악하고 필요할 경우 적시에 데이터를 검색할 수 있어야 합니다. GDPR은 개인들에게 자신을 대신하여 수집된 모든 개인 데이터에 접근, 수정 및 제거할 수 있는 권리를 부여하며, 조직은 1개월 이내에 시험대상자 접근 요청(SAR)에 대응해야 합니다. 그렇지 않으면 비용이 많이 드는 벌금이나 소송에 직면할 위험이 있습니다. 따라서, 규정 미준수 및 관련 요금과 벌금은 데이터 스프롤로 인해 발생하는 주요 과제 중 하나입니다.
지식 상실
데이터 스프롤로 인해 데이터가 어디에 있고 누가 소유하는지 알기가 매우 어렵습니다. 따라서 데이터가 손실되면 영구적으로 손실되고 지식 격차가 발생합니다. 지식 격차는 기업의 발전을 크게 저해하고 경쟁업체와의 협력을 어렵게 할 수 있습니다.
보안 침해
데이터가 급증하면 중요하고 가치 있는 회사 데이터가 사이버 범죄자에게 훨씬 더 많이 노출됩니다. 조직의 사이버 보안 시스템 및 툴을 보호하지 않으면 회사가 알지 못하는 데이터가 훨씬 더 쉽게 악용되거나 도난당할 수 있습니다. 사이버 보안 소프트웨어로 보호되는 장소에 상주할 수 있지만, 이 소프트웨어가 회사의 소프트웨어만큼 철저하거나 보호적이지 않을 것이라는 보장은 거의 없습니다.
관리 오버헤드
데이터 확산의 가장 큰 영향 중 하나는 관리 오버헤드입니다. 데이터 스프롤로 인해 스토리지 팀은 포트폴리오처럼 자동화하거나 관리할 수 없는 여러 데이터 소스와 사일로를 관리하는 데 대부분의 시간을 소비합니다. 따라서, 스마트한 사람들이 영향력 있는 일을 하지 못하도록 하고 관리자로 전환합니다.
데이터 스프롤 관리 방법
데이터 스프롤 또는 최소한 이와 관련된 위험을 관리하고 잠재적으로 크게 줄이는 데 사용할 수 있는 다양한 도구와 전략이 있습니다.
- 직원들에게 필요한 모든 도구를 제공합니다.
말 그대로, 가장 좋은 치료법은 예방입니다. 데이터 확산의 주요 원인이 직원들이 SaaS 애플리케이션을 사용하는 것이 아니라는 점을 감안할 때, 데이터 확산과 싸우는 가장 좋은 방법은 직원들이 업무를 잘 수행하는 데 필요한 도구가 전혀 부족하지 않도록 하여 처음부터 이러한 일이 발생하지 않도록 하는 것입니다. 동일한 팀이 동일한 도구나 도구를 요청하는 것을 발견하면, 스스로 요구하지 않도록 준비하는 것을 고려하십시오.
- 데이터 거버넌스 및 액세스를 위한 정책 및 모범 사례 수립
데이터 확산을 막을 수 없다고 생각되면, 다음으로 해야 할 가장 좋은 일은 데이터가 어디에서 왔는지, 어디에 상주하고 있는지 파악하여 데이터를 제어하는 것입니다. 모든 소스의 데이터가 수집, 저장, 관리 및 액세스되는 방법을 안내하는 엄격한 정책이 있어야 하며, 직원들이 온보딩의 일환으로 이러한 정책을 검토하도록 요구하여 이러한 정책을 숙지하도록 해야 합니다. 이를 데이터 수명주기 관리라고도 합니다.
- 데이터 스토리지 관리 통합
데이터 스프롤의 가장 큰 타격적인 측면 중 하나는 데이터가 어디에 저장되고 있는지 모른다는 것입니다. 온-프레미스, 하이브리드 및 클라우드 데이터 스토리지 관리 통합하는 것이 핵심입니다. 하지만 이를 위해 클라우드 데이터 보안의 도전과제와 위험을 고려해야 합니다.
- 중복 데이터 제거
데이터 스프롤의 큰 측면은 데이터의 양이 많다는 것입니다. 중복되거나 중복되기 때문에 대부분의 데이터는 유용하지 않습니다. 데이터 중복제거 툴은 다양합니다. 이 툴은 무관하거나 중복된 데이터를 제거하여 데이터 스프롤을 줄이는 데 도움이 됩니다.
퓨어스토리지가 데이터 스프롤을 지원하는 방법
디바이스와 정형 및 비정형 데이터의 양이 증가함에 따라, 데이터 스프롤은 더 큰 도전 과제가 될 것입니다. 데이터의 적절한 저장, 관리 및 활용은 데이터의 확산과 위험을 방지하고 처리하는 핵심입니다.
퓨어스토리지 ®는 관리가 어려운 데이터를 수익 창출 결과로 전환하는 데 도움이 되는 솔루션을 제공합니다. 퓨어스토리지는 모든 비정형 데이터를 최대한 활용할 수 있는 빠르고 통합된 비정형 스토리지 플랫폼으로 스토리지를 현대화합니다.
퓨어스토리지는 최근 어레이를 통합하고 스토리지 풀을 즉시 최적화하는 거의 무한한 스케일-아웃 스토리지 모델인 Pure Fusion 출시했습니다. 온디맨드 방식의 소비 및 백엔드 프로비저닝을 통해 어디서나 클라우드 운영 모델의 간소성을 누릴 수 있습니다.
Pure Fusion 대한 자세한 내용은 여기에서 확인하세요.