Skip to Content

従来のストレージ・システムがビッグデータをサポートできない理由

※このページの内容が日本語である場合は、機械翻訳システムで翻訳したものです。

ビッグデータに関する 3 つの課題(およびその克服方法)

ビッグデータには、非構造化、動的、複雑な性質があります。しかし、おそらく最も重要な点は、ビッグデータは「膨大」であるということです。人間や IoT センサーは、毎年何兆ギガバイトものデータを生成しています。しかし、これは昨日のデータではありません。多様化するフォーマットで、より幅広いソースから収集された最新のデータです。

これにより、今日のデータと昨日のシステムの間に混乱が生じています。規模やスピード、複雑さが、従来のデータ・ストレージ・システムに新たなストレスを与えています。多くの企業は、単に設備が整っておらず、この膨大なデータを活用したいと考えている組織は、障害に陥っています。

なぜこのようなことが起こっているのでしょうか? ビッグデータに関する重要な課題 ビッグデータのパワーを活用したいとお考えなら、ストレージ・ソリューションはそれを克服するのに十分でしょうか。

1. ビッグデータは従来のストレージには大きすぎる

ビッグデータの課題の中でも最も明白なのは、その膨大な規模です。通常はペタバイト単位で測定します(1,024テラバイトまたは1,048,576ギガバイト)。

ビッグデータがどれほど膨大なものになり得るか、その一例を挙げましょう。Facebook ユーザーは 1 時間あたり少なくとも 1458 万枚の写真をアップロードしています。各写真には、いいねやコメントなど、それと一緒に保存されているインタラクションも保存されます。ユーザーは少なくとも1兆件の投稿、コメント、その他のデータに「いいね」をしています。 

しかし、膨大な量のデータを保存・分析しているのは、Facebookのような大手テクノロジー企業だけではありません。ソーシャルメディアから情報を収集する小規模なビジネスでも、例えば自社のブランドについて人々が何を言っているかを確認するなど、大容量のデータストレージアーキテクチャが必要です。

従来のデータ・ストレージ・システムは、理論的には大量のデータを処理できます。しかし、効率性と洞察力の提供を任されていると、現代のデータの要求に追いつくことはできません。

リレーショナル・データベースの現状

リレーショナル SQL データベースは、データの格納、読み取り、書き込みを行うための、信頼性が高く、古くなった方法です。しかし、これらのデータベースは、最大容量に達する前であっても、効率的な運用に苦労する可能性があります。大量のデータを含むリレーショナル・データベースは、さまざまな理由で低速になることがあります。例えば、リレーショナル・データベースにレコードを挿入するたびに、インデックス自体を更新する必要があります。この操作は、レコード数が増えるたびに時間がかかります。他のテーブルとの関係の数によっては、他の操作の挿入、更新、削除、実行に時間がかかる場合があります。 

簡単に言えば、リレーショナル・データベース内のデータが多いほど、各操作にかかる時間が長くなります。

スケールアップとスケールアウト

また、従来のデータ・ストレージ・システムを拡張して性能を向上させることも可能です。しかし、従来のデータ・ストレージ・システムは一元管理されているため、スケールアップではなくスケールアップを余儀なくされます。

スケールアップは、スケールアウトよりもリソース効率が劣ります。新しいシステムの追加、データの移行、複数のシステム間の負荷管理が必要になるためです。従来のデータ・ストレージ・アーキテクチャは、すぐに広すぎて、適切に管理できない状態になります。

ビッグデータに従来のストレージ・アーキテクチャを使用しようとすると、データ量が多いため、十分にスケールアップすることが現実的ではないため、一部失敗する恐れがあります。これにより、現実的な唯一のオプションがスケールアウトされます。分散型ストレージ・アーキテクチャを使用することで、所定の容量に達するとクラスタに新しいノードを追加することができ、ほぼ無期限にノードを追加することができます。

2. ビッグデータは従来のストレージには複雑すぎる

ビッグデータに関しては、従来のストレージにとってもう 1 つの大きな課題があります。データ・スタイルの複雑さ。従来のデータは構造化データです。テーブルに、互いに単純な関係を持つ行と列で整理できます。

リレーショナル・データベースは、従来のデータを保存するデータベースの一種で、明確に定義されたフィールドを含むレコードで構成されます。このタイプのデータベースには、MySQL、Oracle DB、SQL Server などのリレーショナル・データベース管理システム(RDBMS)を使用してアクセスできます。

リレーショナル・データベースは比較的大規模で複雑です。何千もの行と列で構成される場合があります。しかし、リレーショナル・データベースでは、あるデータに別のデータとの関係を参照してアクセスできます。

ビッグデータは、従来のデータ・ストレージ・システムのリレーショナルな行や列に必ずしもうまく収まるとは限りません。無数のファイルタイプで構成されており、画像、動画、音声、ソーシャルメディアのコンテンツを含むことがよくあります。そのため、従来のストレージ・ソリューションは、ビッグデータの処理には適していません。適切に分類できない。

また、最新のコンテナ化されたアプリケーションは、ストレージに新たな課題をもたらします。例えば、Kubernetesアプリケーションは従来のアプリケーションよりも複雑です。これらのアプリケーションには、ポッド、ボリューム、構成マップなどの多くの部分が含まれており、頻繁に更新する必要があります。従来のストレージでは、Kubernetesを効果的に実行するために必要な機能を提供することはできません。

MongoDB、Cassandra、Redis などの非リレーショナル(NoSQL)データベースを使用することで、複雑で多様な非構造化データのセットに関する貴重な洞察を得ることができます。

3. ビッグデータは従来のストレージでは高速すぎる

従来のデータ・ストレージ・システムは、安定したデータ保持を可能にします。定期的にデータを追加し、新しいデータセットの分析を実行できます。しかし、ビッグデータはほぼ瞬時に成長し、分析はしばしばリアルタイムで行う必要があります。RDBMS は、急激な変動を想定した設計ではありません。

例えば、センサー・データです。モノのインターネット(IoT)デバイスは、低遅延で大量のセンサー・データを処理する必要があります。センサーは、「現実世界」からのデータをほぼ一定の割合で送信します。従来のストレージ・システムは、このような速度で到達するデータの保存と分析に苦労しています。

もう1つの例が、サイバーセキュリティです。IT 部門は、企業のファイアウォール経由で到着する各データ・パケットを検査し、疑わしいコードが含まれているかどうかを確認する必要があります。多くのギガバイトが毎日ネットワークを通過している可能性があります。サイバー犯罪の被害に遭わないためには、分析を即座に実行する必要があります。1 日の終わりまで全てのデータをテーブルに格納することは不可能です。

ビッグデータの高速性は、従来のストレージ・システムとは異なり、プロジェクト障害や未実現の ROI の根本原因となる可能性があります。

4. ビッグデータの課題にはモダン・ストレージ・ソリューションが必要

従来のストレージ・アーキテクチャは、構造化データの処理に適しています。しかし、非構造化ビッグデータの広大で複雑、かつ高速な性質に関しては、企業が求める成果を得るための代替ソリューションを見つける必要があります。

分散型、スケーラブル、非リレーショナル・ストレージ・システムは、大量の複雑なデータをリアルタイムで処理できます。このアプローチは、ビッグデータの課題を簡単に克服し、画期的な洞察を得るのに役立ちます。

ストレージ・アーキテクチャがビジネス・ニーズに追いつくのに苦労している場合や、データ成熟企業の競争力を獲得したい場合、ビッグデータのパワーを活用できる最新のストレージ・ソリューションにアップグレードすることは理にかなっています。 

ピュア・ストレージは、シンプルで信頼性の高いサービスとしてのストレージ(STaaS)ソリューションを幅広く提供しています。STaaSは、あらゆる規模の運用にスケーラブルで、あらゆるユースケースに適しています。 詳細を見るか、今すぐ始めましょう

こちらの資料もご覧ください!

11/2020
VMware Hybrid Cloud Solution Brief | Solution Brief
Hybrid cloud and container adoption are growing rapidly. Advance to an effortless, optimized VMware environment.
ソリューションの概要
3 pages

リソースとイベントを検索

テックトーク
API でストレージの可能性を最大化

API が可能にするシームレスな性能管理。ピュア・ストレージの API は、自動化と最適化を容易にします。是非詳しくご覧ください!

Web セミナーを視聴する
シンプルさでお客さまにパワーを

業界で最も包括的で一貫性があり、直感的で使いやすいデータ・ストレージ・プラットフォームが、あらゆるワークロードをサポート。IT 部門の運用管理負荷とコストを削減し、重要なプロジェクトへの注力を可能にします。

NAND Research のレポートを読む
関連リソース
ストレージの未来形 AI 時代の新原則

AI をはじめとする新潮流がデータ・ストレージのニーズを変えています。成功のための考え方と最新の対策を解説します。

eBook をダウンロード
リソース
ストレージの購入から、プラットフォームの導入へのシフト

エンタープライズ・ストレージ・プラットフォームの選び方を、要件、構成要素とともに解説しています。

レポートを読む
ご相談・お問い合わせ
ご相談・お問い合わせ情報アイコン
チャットのアイコン
ご質問・ご相談

ピュア・ストレージ製品および認定についてのご質問・ご相談を承っております。ご連絡をお待ちしております。

カギのアイコン
デモのご用命

ライブデモのご用命を承っております。ピュアがいかにしてデータを成果に変えるお手伝いができるかをご説明します。 

ピュア・ストレージ・ジャパン株式会社

〒100-0014 東京都千代田区永田町 2 丁目 10-3 東急キャピトルタワー 12 階

 

一般: info-japan@purestorage.com

メディア: pr-japan@purestorage.com

03-4563-7443(総合案内)

閉じる
このブラウザは現在サポートされていません。

古いブラウザには、セキュリティ・リスクが存在する場合があります。ピュア・ストレージの Web サイトをより快適にご利用いただけるよう、最新のブラウザにアップデートしてください。