データ・ファブリックとは
データ・ファブリックとは、ソース、ストレージ、パイプライン、分析、アプリケーションなど、システム内のすべてのデータのエンドツーエンドの統合と管理をキャプチャする統合アーキテクチャです。
データ・ファブリックの比喩的なファブリックとは、組織のデータを単一の統合ネットワーク・レイヤーとして表示すること、または、サイロ化されたポイント・ツー・ポイント接続の集合として表示することを指します。データにファブリックとしてアプローチすることで、性能の最適化、データモビリティの向上、データ運用の効率化が可能になります。
実際には、データ・ファブリックは、IT アーキテクチャにデータ中心のアプローチを採用し、データ統合および管理ソフトウェアを使用して新しいアーキテクチャを定義することで作成されます。
データ・ファブリックが重要な理由
ビッグデータが次の大きな課題に挙げられてから約 10 年が経ち、組織はデータの収集と保存がデータのメリットを享受するための始まりに過ぎないことに気づいています。ビッグデータの約束を果たすには、革新的な洞察、最先端のエクスペリエンス、新しいビジネスモデル、人工知能など、データ管理に対する新しいアプローチが必要です。このアプローチは、あらゆるソースからの情報を統合し、ユーザーやエンドポイントを問わず、必要なときに必要な場所でデータを利用できるようにします。同時に、データが存在する場所や移動中の場所を問わず、データを安全に保ちます。
ガートナーは、データ・ファブリックを2022 年のテクノロジー・トレンドの 1 つに挙げ、データ・ファブリックは組織のデータ統合インフラを簡素化し、統合の課題を軽減するスケーラブルなアーキテクチャを構築できると述べました。データ・ファブリックは、データ管理作業を最大70%削減できるため、価値創出までの時間を短縮できます。
データ・ファブリックを使用する理由
データ・ファブリックは、オンプレミス、パブリック・クラウド、プライベート・クラウド、エッジ環境全体でデータにアクセスできるようにすることで、ハイブリッド・クラウド環境内のビッグデータの潜在能力を解放します。
データ・ファブリックが対処できる一般的なデータ管理の課題を以下に示します。
- 必要なユーザー、顧客、自動化へのアクセスを可能にしながら、データを効率的に保存する必要がある
- 地理的に分散したデータ・ストリーム、ストレージ・ソリューション、エンドユーザー
- 互換性のないデータ:構造化・非構造化データ、特定のアプリケーションのデータ、サイロ化データ、レガシーデータ
- 人工知能、機械学習、リアルタイム分析、コンテキストに基づく顧客体験に依存する、データ集約型の新世代のアプリケーションへの対応
- IoT デバイスとエッジ・コンピューティングの展開との間でデータ・フローの最適化
- データの安全性とコンプライアンスの維持
データ・ファブリックの仕組み
データ管理ソフトウェアは、データフロー、ユーザー、エンドポイント、ストレージ、ネットワーク・アーキテクチャをデータ管理層に統合し、可視性と制御と管理のためのインターフェースを提供します。ソフトウェアは、組織のデータ資産全体を把握し、ボトルネックにフラグを立て、パフォーマンスとアクセスを改善するための提案を行います。
ソフトウェアを使用することで、データ・エンジニアは、個々のユースケースのパフォーマンスを向上させるために、高レベルのビューを見たり、掘り下げたりすることができます。また、ソフトウェアは、共通のデータ・ランドスケープと、アプリケーション、データ・ストリーム、ユースケースと統合するための API のセットを確立します。
データ・ファブリックの要素
データ・ファブリックには、通常、次の層が含まれます。
- データ管理:システムの健全性、データ・セキュリティ、ネットワークの最適化の監視を支援。
- データ取り込み:新しく導入されたデータのための経路とプロセスを確立する。
- データ処理:データのクレンジング、改良、変換を行い、特定の用途に備える。
- データ・オーケストレーション:関連データのみがユーザーに提供されるようにすることで、システムをより効率的に実行できます。
- データ・ディスカバリ:異なるデータソース間の新しいつながりを浮き彫りにし、価値を解き放ち、新しい洞察を指摘します。
- データアクセス:アプリケーション、自動化、組織内のチーム、デバイスなど、さまざまなユーザーがデータに容易にアクセスできるため、手間いらずに使用できます。
- データ・セキュリティ: セキュリティ規制の遵守を確保しつつ、組織全体のデータを監視・保護します。
データ・ファブリックのメリット
データ・ファブリックは、多くのデータ・エンジニアリングの課題を解決するだけでなく、組織全体に次のようなメリットをもたらします。
- データの価値を高める: データ・ファブリックは、データを最大限に活用するように設計されています。たとえば、お客さまにより良いエクスペリエンスを提供し、運用効率を高め、新しいビジネス・モデルを可能にするなどです。
- リソースの有効活用:データ・ファブリックは、組織全体のデータの概要を把握し、AI を使用して提案を行うことで、さまざまなユースケースにコストやリソースの負荷がどのように発生するかを示すことで IT 部門の意思決定に役立ちます。
- 俊敏性と耐障害性の向上:データ・ファブリックは、変化を事前にモデル化し、データ・アーキテクチャを構築するための一貫した基盤を提供することで、変化する状況や新しい現実に応じて組織のスケーリングやピボットを支援します。
データ・ファブリックはデータ・レイクに似ていますか?
データ・レイクは、データ・アクセスの問題を解決するために多くの組織がデータ・レイクを選択していますが、データ・レイクはトップダウンのアプローチであり、データのマスター・リポジトリが 1 つあると定義されています。データ・レイクは、ストリーミングやアップロードの面で余分な作業を生み出し、データへのアクセスや管理をより困難にします。さらに、データ・レイクから十分な距離にあるデータが必要なため、高遅延が発生する場合があります。実際には、データ・ファブリックは、データ・レイクを最大限に活用するのに役立ちます。
データ・ファブリックはデータ仮想化に似ていますか?
これら 2 つの概念は、反対よりも補完的です。データ仮想化は、データの管理、移動、処理のためのインターフェースを作成します。一方、データ・ファブリックは、性能、コスト、リソース効率、セキュリティ、成長、変更管理など、データ運用のあらゆる部分を最適化するための包括的な方法です。
データ・ファブリックのユースケース
データ・ファブリックを活用してデータ・アクセシビリティを向上させる方法の例を以下に示します。
- 大手小売業者は、複雑な在庫とサプライチェーンのデータを統合し、生産と計画について十分な情報に基づいた意思決定を行うことができます。
- IT コンサルティング企業は、顧客サポート・リクエストからのデータを統合し、利用可能なソリューションのギャップに関する洞察に基づいて販売戦略を再構築できます。
- 農家は、天気予報、市況、土壌の状態などの異なるデータストリームを重要な意思決定に組み込むことができます。
ピュア・ストレージでデータ・ファブリックを簡素化
ハイブリッド・クラウド環境全体を完全にカバーするデータ・ファブリックのセットアップは、決して容易ではありません。オンプレミス、パブリック・クラウド、プライベート・クラウド、エッジ環境全体で、データ・ガバナンスとセキュリティを維持しながら、異なるソース間でデータを統合する必要があります。
データ・ファブリックにギャップが生じたり、独自のデータ・ファブリックをセットアップしたいと思いませんか? ピュア・ストレージは、近代的なデータ・ファブリックの構築とサポートに必要なソリューションを提供します。
- Pure1:AI を活用したデータストレージ管理と監視ソリューションで、テクノロジー・スタック全体に自動運転ストレージを提供します。
- Purity オペレーティング環境:Purity は、Pure Storage® FlashArray™上のデータをインテリジェントに管理する統合プラットフォームです。データセンター、エッジ、クラウドのどこにあっても、データ管理を簡素化し、ストレージのサイロ化を排除できます。
- Pure Fusion ™:クラウド運用モデルをオンプレミスで実現するStorage-as-Code V プラットフォーム。エンタープライズ・ストレージのプロビジョニング、管理、消費が簡単にできます。
- Portworx:クラウドネイティブ・アプリケーションを強化するための包括的な Kubernetes データ・サービス・ソリューション。
- Cloud Block Store:クラウド環境全体でシームレスなデータ・モビリティ、耐障害性、一貫したユーザー・エクスペリエンスを提供するマルチクラウド・ソリューション。
ピュア・ストレージは、データの消費とやり取りを簡素化することで、イノベーターがエンタープライズ・データに潜む潜在能力を解き放つお手伝いをします。