HPC を実現するための要素
HPC を支える要素として、具体的には以下の 4 つが挙げられます。
プロセッサの処理能力
大量のデータを処理するのに必要な能力を単一のプロセッサだけでまかなおうとしても無理があります。そこで、HPC モデルでは、複数の処理センターを並列で運用し、必要な性能を確保しています。HPC モデルには、前述のように、以下の要素があります。
- クラスタ:ネットワークで相互に接続された複数のコンピュータの集合
- ノード:クラスタ内の個々の処理ユニット
- コア:ノード内の各プロセッサには複数のコアが存在
例えば、それぞれが 4 つのコアを持つ 16 のノードから構成された、極めて小型のクラスタでは、並行して稼働するコアの数は合計 64 になります。
現在、ほとんどの HPC のユースケースで数千のコアが並列運用され、処理時間を短縮しています。サービスとしてのインフラ(IaaS)のプロバイダは、必要に応じて大量のノードを利用可能にし、目的が達成された時点で規模を縮小できるようなソリューションを提供しています。必要な処理能力の分だけ料金を支払えばよく、インフラスの構築に設備投資(CAPEX)コストをかける必要がありません。IaaS では、通常、必要に応じて特定のアプリケーションにあわせてノードのレイアウトを指定することもできます。
オペレーティング・システム
HPC で使用するハードウェアとソフトウェアの間でインターフェースの役割を担うのが、オペレーティング・システムです。HPC 環境で主に使用されるオペレーティング・システムには、Linux と Windows の 2 つがあります。Linux が使用されることが多く、Windows 固有のアプリケーションが必要になるときだけ Windows が使用されます。
ネットワーク
HPC では、コンピューティング・ハードウェア、ストレージ、ユーザーを、ネットワークでつなぎます。コンピューティング・ハードウェアは、広帯域でデータを扱えるネットワークを介して接続されます。ネットワークには、データ転送を高速に行うために低遅延が求められます。データの転送やクラスタの管理には、クラスタ・マネージャー、管理サービス、スケジューラが用いられます。
クラスタ・マネージャーは、CPU、FPGA、GPU、ディスク・ドライブなどのコンピューティング・リソースを分散した環境で、個々のリソースにワークロードを振り分けて実行します。これらのリソースはどれも、クラスタ・マネージャーが管理できるよう、共通のネットワークに接続しなければなりません。IaaS プロバイダのサービスでは、インフラの管理に必要な機能が全て、プロバイダによって自動的に適用されます。
ストレージ
HPC で処理するデータは、最終的には大規模なデータ・リポジトリに格納されます。データには、構造化、半構造化、非構造化などの形式があり、異なる形式のデータを格納するのに、種類の異なるデータベースを複数用意しなければならないケースもあります。
RAW 形式のデータは、データ・レイクに格納されます。RAW 形式のデータにはまだ用途が割り当てられていないため、処理が難しくなることがあります。一方、特定の用途にあわせてデータをクリーンアップした場合は、そのデータはデータ・ウェアハウスに格納されます。
HPC で見過ごされがちなストレージの重要性
HPC のユースケースの多くでストレージが重要な役割を果たしていますが、その事実は見過ごされがちです。HPC は、大量のデータを並列で処理する目的で使用されます。そして、HPC の性能は、アーキテクチャ内のコンポーネント全てがお互いの能力に見合う性能を発揮できるかどうかによって決まります。
従来型のストレージ・ソリューションは、HPC のニーズに対応できないことがあり、ストレージ・ソリューションが処理のボトルネックとなって、性能の低下を招くおそれもあります。データ・ストレージには、HPC アーキテクチャの処理速度についていける性能が求められます。それゆえに、HPC のアーキテクチャの多くが、統合型高速ファイル/オブジェクト(UFFO)ストレージを活用しているのです。
Evergreen//One™ は、信頼性の高い高速の UFFO ストレージを、利用しやすい従量課金制のモデルで提供します。オンプレミス、ハイブリッド・クラウドのいずれのモデルでも利用可能であり、性能を犠牲にせずに運用規模のスケーラビリティを確保しなければならない HPC 環境には理想的です。
Evergreen//One をぜひお試しください。最初の 3 か月間はサービスを無料でご利用いただけます。