大量にあるものの取り扱い、移動、保存、処理には問題が発生します。完全に無関係な分野においても、これらの問題は非常に似たものになることがあります。郵便サービスについて考えてみてください。手紙や荷物をあるべき場所に届けるには、飛行機、船、セミトラック、機械、配達車、人の複雑なネットワークが必要です。また、効率、コスト、遅延、エラーに関連する大きなリスクがあります。
例えば、セミトラックを使用して郵便物を戸別に配達する際、トラックにどれだけの無駄なスペースがあるかを想像してみてください。あるいは、飛行機を使用するのではなく、アラスカからフロリダに郵便を運ぶ小型の電気郵便配達車を想像してみてください。
これらはシンプルな例ですが、階層型ストレージ管理(HSM)が存在する理由を説明するのに役立ちます。データフットプリントが大きい組織は、常に効率性の問題に直面しており、その情報の保存、移動、処理の計画に多大な労力が費やされています。階層型ストレージ管理(HSM)は、組織がデジタル・データの配信手段としてセミトラックを本質的に使用しないようにする歴史的な方法です。
この記事では、HSM と HSM が解決しようとしている問題、HSM に代わる近代的な選択肢について解説します。
階層型ストレージ管理とは?
階層型ストレージ管理(HSM:Hierarchical Storage Management)は、データ使用の非効率性を最小限に抑えながら、ストレージ媒体を可能な限り経済的な方法で使用することを目的とするデジタル・データを管理するプロセスです。
HSM の根底には、2 つの重要な事実があります。第一に、デジタル・メディアを保存する方法が異なれば、その特性も異なることです。第二に、全てのデータが平等に扱われるわけではないことです。第一の点については、デジタル・ストレージ媒体間の最も明白な違いはコストです。最も高速で、最も利用可能で、最も汎用性の高いストレージ媒体は、最も高価である傾向があります。第二の点についていえば、一部のデータは毎日使用され、一部のデータはあまり使用されません。
多くの企業は、最も重要なデータへの高速アクセスに依存しています。しかし、同じレベルの速度と可用性で、使用するデータの保存とアクセスに、同じくらいの金額を支払うことは、非常に非効率です。
組織によって HSM の実装方法が異なるため、HSM を実行するための唯一のルールブックはありません。しかし、組織がデータ・ストレージを少なくとも 2 つの階層に分割する場合、HSM は、何がどこに保存され、どのように移動されるかのルールを設定するプロセスです。
階層型ストレージ管理のメリット
階層型ストレージ管理を導入することで、多くのメリットを得ることができます。コスト削減は HSM の最も明白なメリットです。緊急性の低いデータを安価なストレージ媒体に移行することで、企業は可用性を犠牲にし、コストを抑えることができます。また、HSM の原則によっても性能が向上します。データへのアクセスが必要なアプリケーションが、古く、時代遅れで、無関係なデータの選別に時間を費やす必要がなくなれば、より良い結果をより迅速に提供できるようになります。
また、HSM は複雑に聞こえるかもしれませんが、異なるカテゴリのデータが存在する場所や、データの自動適用に関する優れたルールは、データ管理の簡素化につながります。HSM は、IT 専門家が設定したルールに基づいて、データを自動的に適切なストレージ層に移行するため、ストレージの利用率を最適化します。
階層型ストレージ管理の仕組み
HSM は、多層のストレージ媒体で構成される場合がありますが、その基本は、一方の端に高性能な階層があり、もう一方の端により遅く、低コストな階層があるという点です。高性能な階層は、従来、ストレージ・クラスのメモリ、エンタープライズ・グレードのフラッシュ・ソリッドステート・ドライブ(SSD)、高性能 HDD で構成されてきました。低い階層には、光ディスクやテープ・ストレージなどのデバイスがあります。
HSM ポリシーの実際の実装は非常に複雑ですが、HSM は基本的に、ファイルにアクセスする頻度を識別することで動作し、時間が経つにつれて、システムは使用頻度の低いファイルを自動的に低速で安価なストレージに移動します。IT チームは、データがいつ移動されるか、どのデータがこれらのルールから除外されるか、その他の明確化を定義するパラメータのルールを作成します。しかし、HSM は通常、データ・アクセスとデータ・ストレージのコストを最適化する自動化されたプロセスです。
HSM ティア
HSM とテープ・ドライブのようなストレージ媒体の使用を理解する鍵は、コスト、性能、速度の違いが極端だった時代があったことです。これらのギャップは縮小し、継続的に縮小していますが、光ディスクとソリッドステート・ドライブのコストの差が、データの並べ替えの複雑な方法を正当化するのに十分なほど大きく、無駄にならなかった時代がありました。
HSM の最小容量、最高性能のティアは通常、ティア 0 と呼ばれます。これはミッションクリティカルなデータであり、サービスの遅延や中断をもたらすことはできません。ティア 1 は、しばしば、「ホットデータ」と呼ばれ、日々の業務に継続的に使用され、その即時性がストレージ・コストとバランスを取ることができるデータです。ティア 2 は、「ウォームデータ」と呼ばれ、コストの考慮が大きな優先事項となり、頻繁にアクセスされないデータが格納される場所です。最後に、ティア 3 は通常、アクセスや更新がほとんど行われない、「コールドデータ」と呼ばれるデータをさします。
HSM ティアに代わるオールフラッシュの代替
理想的な世界では、企業は、あらゆる階層で高速で高可用性のストレージを持ち、それらの階層間に微妙な境界があるでしょう。何十年にもわたって、エンタープライズ・レベルでのオールフラッシュ・データ・ストレージが夢とされてきました。しかし、ごく最近まで、それは単に実現不可能でした。しかし、ここ数十年で、エンタープライズ・レベルでのオールフラッシュ・ストレージのコストは、可能になっただけでなく、Meta のような大企業では定期的に行われています。
ピュア・ストレージは、オールフラッシュのエンタープライズ・ストレージの代表的存在です。2012 年には、エンタープライズ・ネットワークのティア 0 のニーズに応えるフラッシュ・ストレージ・ソリューションを開発しました。FlashArray//C がリリースされたとき、ピュア・ストレージは、エンタープライズ・ネットワークのビジネス・クリティカルなワークロードとデータに対して、99.9999% の可用性と無停止アップグレードで、一貫した 1 ミリ秒の遅延を約束できます。
それ自体が画期的なものであり、その後、FlashArray//X と FlashArray//XL によって、大規模なデータベースからクラウドネイティブなアプリケーションまで、フラッシュ・メモリ上であらゆるものを実行することを可能にしました。これらの進歩にもかかわらず、ティア 2 とティア 3 はコストのためにフラッシュ・メモリに決して道を譲らないと信じていました。
しかし、2023 年に、ピュア・ストレージは、FlashArray//E と FlashBlade//E をリリースし、ローエンドの回転ディスクとテープに挑戦しました。FlashArray//E は、長期保持用に設計されており、1PB-4PB の未加工の統合ファイル/ブロック・データストレージ容量を提供します。FlashBlade//E は、非構造化ワークロードやオブジェクト・ワークロードを格納する場合に、企業に多大なコスト削減をもたらします。
ピュア・ストレージは、あらゆる規模の組織において、HSM ティアに代わるオールフラッシュの代替例を示しています。HSM 自体を排除するわけではありませんが、HSM の階層を分離する線を根本的に再構築しています。
まとめ
階層型ストレージ管理は、最も高速で最も高価なデータ・ストレージと、最も低速で最も手頃なデータ・ストレージの間に存在するコストの大きな違いに対する必要な対応として登場しました。技術上の限界により、データ・ストレージ・ソリューションを自動的に分類、移動、最適化するためのキャリア・フィールド全体が生まれました。
HSM は依然として重要なコスト削減プロセスですが、ピュア・ストレージが提供するエンタープライズ規模のオールフラッシュ・ソリューションは、従来の数分の一のコストで大量の高速データを提供する一方で、両者の間の厳格な境界線を急速に取り払いつつあります。