Skip to Content

カラム型データベースとは?

※このページの内容が日本語である場合は、機械翻訳システムで翻訳したものです。

レコードを行に格納するデータベースには、馴染みがあるかもしれませんが しかし、カラム型データベースは、データを列に格納します。カラム型データベースは、非構造化データを保存する NoSQL データベースの一種です。従来の構造化された行ベースのデータベースよりも高速にデータを取得できます。データを列に格納するデータベースは、はるかに高速な読み取りを可能にしますが、書き込みトランザクションの性能を犠牲にします。データは行ではなく列ごとにグループ化されて格納されるため、読み取り性能が向上します。

カラム型データベースとは?

クエリを高速化するために、カラム型データベースは、行ではなく列にデータを格納します。これらのモダンなデータベースは、「列指向」「ワイドカラム・ストア」とも呼ばれます。企業は、格納されるデータ量が増えると、取得する必要のあるテラバイト(またはそれ以上)のデータ・ストレージに達する可能性があります。カラム型データベースはクエリ処理を高速化し、ビッグデータや機械学習分析のためのクエリによく使用されます。

カラム型データベースの主な特徴

クエリ性能の向上は、カラム型データベースの重要なメリットの 1 つですが、他にもいくつかのメリットがあります。行ベースのデータベースからカラム型データベースへの切り替えがメリットとなる理由をいくつかご紹介します。

  • データ圧縮:高度なデータ圧縮は、ストレージ要件の量を減らし、ディスク上のデータを見つけるのに必要な時間も削減します。シーク時間や性能のアップグレードが高速化することで、一般的な計算(例:MIN や SUM)が高速化します。
  • 分析の高速化:機械学習と分析ソフトウェアには大量のデータが必要なため、大規模なデータセットのクエリ処理を高速化することで、これらのアプリケーションを高速化します。
  • 自己インデックス化:従来のデータベースで手動のインデックス作成に慣れている管理者は、カラム型データベースの自己インデックス機能を評価するでしょう。この機能は、データに必要なストレージ容量を削減できます。
  • ベクトル化:カラム型データベースは、複数のデータ・ポイントを処理し、高度な分析と数学的な機能を、標準的な行ベースのデータベースよりもはるかに高速に処理します。
  • NULL の排除:ストレージのスペースを占める NULL 値を保存する代わりに、カラム型データベースには、欠損値や NULL 値が格納されません。

カラム型データベースのユースケース

カラム型データベースは、結果に必要な列がわずか数列しかない場合のデータクエリに最も有益です。従来のリレーショナル・データベースには、単一の行に対して複数の列を持つテーブルがありますが、カラム型データベースは列に基づいてデータをグループ化します。ユーザーへの結果の表示に数列しか必要としないクエリがある場合、カラム型データベースはアプリケーションの性能を向上させます。

カラム型データベースのユースケースの例:

  • ビジネス分析:多くのビジネス指標では、成功を要約するためにいくつかの列が必要です。カラム型データベースは、これらの数列に基づいて分析と機械学習の予測をより適切に表示することができます。例えば、製品の総売上高に基づく分析は、カラム型データベース・ストレージに適しています。
  • セキュリティ、アプリケーションの監視:アプリケーション・イベントから収集されたデータ(認証エラーや応答時間など)は、カラム型データベースに保存し、性能を向上させ、進行中のサイバー攻撃を阻止するために分析に使用できます。
  • IoT:倉庫機械や医療監視のための IoT センサーは、データを収集して特定の列に格納し、機械や人間の生体活動の異常を検出するために使用されます。

行ベースのデータベースとの比較

列(カラム)ベースのデータベースと行ベースのデータベースの主な違いは、バックエンド・ストレージの機能です。カラム型データベースは列データをグループ化するため、クエリは、取得する必要のある各列の行全体を探す必要はありません。列はグループ化されているため、検索が高速化されます。

行ベースのデータベースは、インデックスを使用して行全体のストレージをグループ化するため、トランザクション・クエリがある場合に便利です。例えば、ユーザーが最近の購入を検索するサイトをホストする場合、リレーショナル・データベースは、より優れた性能と開発戦略を提供します。列ベースのデータベースは、ビッグデータや分析に適しています。何百万ものレコードを検索して購入を検索し、結果を機械学習アルゴリズムにフィードする必要がある場合は、列ベースのデータベースが最適です。

一般的なカラム型データベースのソリューション

開発ソリューションには、一般的なカラム型データベースがいくつか用意されています。それぞれに長所と短所があります。以下に、考慮すべき点をいくつかご紹介します。

  • Snowflake:Snowflake は、大規模なデータ・ウェアハウス・インフラで人気があります。複数のデータソースを組み合わせて、1 つの場所からクエリ・エンジンを提供できます。Snowflake は、主に機械学習や分析に使用されますが、Snowpipe は、リアルタイムの出力に最適な継続的なデータ取り込み機能です。
  • MariaDB:MariaDB は、MySQL の改良されたスケーラブルなバージョンであるため、現在のインフラが MySQL で動作するときによく使用されます。MySQL に精通している管理者は、拡張 JSON クエリのサポートを高く評価し、MariaDB は最大 200,000 の同時接続をサポートしています。MariaDB は、XtraDB、Aria、InnoDB、MariaDB ColumnStore、Memory、Cassandra、Connect などの拡張ストレージ・エンジンを使用しています。MariaDB は、大量の接続があり、高速なリアルタイム結果を必要とする場合に活用できます。
  • Redshift:Redshift は Amazon のソリューションであるため、組織が AWS インフラを持つときによく使用されます。機械学習、予測、財務予測、分析用のユーザー・ダッシュボードのために Redshift とデータを共有する必要がある AWS クラウド・データベースを扱う企業にとって有益です。
  • BigQuery:Google Cloud Platform(GCP)ユーザー向けに、Google は BigQuery を提供しています。Redshift と同様に、Google プラットフォームに既に保存されているデータを持つ管理者は BigQuery を活用し、GCP のデータを使用して、機械学習アルゴリズムに供給されるデータのサイロを構築できます。BigQuery は、ビジネス・インテリジェンスや分析 でよく使用されます。
  • Vertica:Hadoop ソリューションの統合を目標とする管理者は、Vertica がここに記載されている他のカラム型データベースよりもはるかに便利であると感じるかもしれません。Vertica は、オンプレミスで展開する場合にも便利です。
  • SAP HANA:SAP HANA Cloud は、SAP HANA DPaaS(データベース・プラットフォーム・アズ・ア・サービス)を提供し、SAP は ERP 技術のために独自のデータベースと連携します。JavaScript ソリューションを構築する開発者は、ERP プロジェクトをサポートする HTML5 を備えた SAP HANA JavaScript フレームワークを高く評価しているかもしれません。
  • Cosmos DB:Cosmos DB は Microsoft Azure ソリューションであるため、管理者が既に Azure クラウド・サービスを利用している場合に使用されます。Microsoft 環境では一般的に使用されていますが、予測やリアルタイム分析を必要とする IoT データ収集、小売・マーケティング、ゲーム、ソーシャル・アプリケーションにも有益です。

まとめ

リレーショナル・データベースの複数の列に基づく大規模なデータセットがある場合、カラム型データベースに切り替えることで性能を向上させることができます。これらのデータベースは、分析、リアルタイム・アプリケーション、機械学習、予測分析、その他のビッグデータ・アプリケーションに最適です。ほとんどのカラム型データベースは、テラバイトのストレージ要件を持つビッグデータで動作します。ピュア・ストレージは、ビッグデータを保存するためのソリューションを提供し、カラム型データベースに取り込み、保存することができます。

こちらの資料もご覧ください!

04/2024
Disaster Recovery for MySQL with FlashArray
Detailed guidance for choosing a data-protection and disaster-recovery solution for MySQL databases with Pure Storage FlashArray.
ホワイト・ペーパー
24 pages

リソースとイベントを検索

テックトーク
API でストレージの可能性を最大化

API が可能にするシームレスな性能管理。ピュア・ストレージの API は、自動化と最適化を容易にします。是非詳しくご覧ください!

Web セミナーを視聴する
シンプルさでお客さまにパワーを

業界で最も包括的で一貫性があり、直感的で使いやすいデータ・ストレージ・プラットフォームが、あらゆるワークロードをサポート。IT 部門の運用管理負荷とコストを削減し、重要なプロジェクトへの注力を可能にします。

NAND Research のレポートを読む
リソース
ストレージの未来形:AI 時代の新原則

AI をはじめとする新潮流がデータ・ストレージのニーズを変えています。成功のための考え方と最新の対策を解説します。

eBook をダウンロード
リソース
ストレージの購入から、プラットフォームの導入へのシフト

エンタープライズ・ストレージ・プラットフォームの選び方を、要件、構成要素とともに解説しています。

レポートを読む
ご相談・お問い合わせ
ご相談・お問い合わせ情報アイコン
チャットのアイコン
ご質問・ご相談

ピュア・ストレージ製品および認定についてのご質問・ご相談を承っております。ご連絡をお待ちしております。

カギのアイコン
デモのご用命

ライブデモのご用命を承っております。ピュアがいかにしてデータを成果に変えるお手伝いができるかをご説明します。 

ピュア・ストレージ・ジャパン株式会社

〒100-0014 東京都千代田区永田町 2 丁目 10-3 東急キャピトルタワー 12 階

 

一般: info-japan@purestorage.com

メディア: pr-japan@purestorage.com

03-4563-7443(総合案内)

閉じる
閉じる閉じる X のアイコン
このブラウザは現在サポートされていません。

古いブラウザには、セキュリティ・リスクが存在する場合があります。ピュア・ストレージの Web サイトをより快適にご利用いただけるよう、最新のブラウザにアップデートしてください。