專用 GPU 伺服器是具有一或多個圖形處理器(GPU)的伺服器,可為執行運算密集型任務,例如影片渲染、資料分析和機器學習,提供更高的效能和速度。專用 GPU 伺服器可能也有專門的 CPU,並配備大量的 RAM 和儲存設備。
GPU 的平行架構最初設計用於處理圖形和影片處理,讓專屬的 GPU 伺服器能以超越 CPU 伺服器能力的速度,同時管理多項工作。
什麼是 GPU Rack Server?
GPU 機架伺服器是配備 GPU 的伺服器,專為伺服器機架而設計。伺服器機架是一個矩形的框架,具有多個安裝插槽,旨在容納機架伺服器和其他網路元件。伺服器相互堆疊,以盡可能減少使用地板空間,並在必要時滑入和滑出機架。
GPU 機架伺服器具備多項優勢,包括空間利用率提升、擴充性提升、氣流最大化,以及維護更簡易。
使用專用 GPU 伺服器的原因
GPU 是 CPU 的輸送量最佳化、專業化、並駕齊驅。與其擁有少數具備高時脈速度的重型核心,能執行各種運算任務,GPU 採用數以千計的輕量型核心最佳化,以並行處理相同的作業 (亦即單一指令、多重資料 【SIMD】)。
這些核心的指令集已針對維數矩陣算術和浮點計算進行最佳化,可加速線性代數。最終結果是針對平行運算最佳化的系統。
您可能想要使用專用 GPU 伺服器的原因包括:
- 大數據分析管道
- 串流影片
- 影像處理
- 3D 動畫與模擬(例如蛋白質鏈摺疊的模型)
- 深度學習應用程式(例如語音辨識)
- 雜湊破解(如密碼復原)
- 挖礦加密貨幣
如果你只需要一個作業,就需要加速,才能從數千個核心的平行執行中獲益,專屬的 GPU 伺服器就能提供協助。
GPU 機架伺服器的類型
GPU 機架伺服器適合機架伺服器或機櫃。伺服器機架和安裝的設備是以機架單位來測量,寫入單位為“U”,有時為“RU”。“U” 表示設備的高度(例如,伺服器的高度或伺服器機架中的架子高度和數量)。
一個 U 等於 1.75 吋,因此 1U 伺服器的高度為 1.75 吋,而 2U 伺服器的高度為 3.5 吋。舉例來說,32U 機架裝置可以容納 32 個 1U 伺服器、4 個 8U 伺服器或 1 個 32U 伺服器。
閱讀“19-Inch伺服器機架大小的終極指南”,以取得更多關於機架大小的資訊。
較小型的規格尺寸與較大型的規格尺寸
大小機架伺服器尺寸之間的主要區別在於其密度和擴充性。
1U 和 2U GPU 機架伺服器
1U 和 2U GPU 機架伺服器等較小的規格尺寸,在設計時皆考量效能密度,但比較大的 GPU 伺服器規格更強大。因為成本較低,且能夠節省伺服器機架空間,所以經常被使用。
1U 和 2U GPU 機架伺服器易於維護、高度便攜,且易於擴充(您可以使用其中數個擴充效能)。1U 伺服器通常可以容納 CPU 或兩個、數 TB 記憶體和多個 GPU。2U 伺服器高度是 1U 伺服器的兩倍,可為您提供額外的空間來計算電力和儲存。
在較小的伺服器中,由於空間限制,GPU 通常以水平方式安裝。雖然您可以使用 PCIe 擴充套件或 JBOD 機殼擴充 PCIe 插槽和儲存空間,但也較少。
8U 和 16U GPU 機架伺服器
8U 和 16U 等大型 GPU 機架伺服器,適合需要更廣泛效能能力的工作負載。它們提供更多的儲存空間和額外的擴充槽,讓您可以插入額外的 PCIe 卡來提高資料處理效能。額外的空間也能促進更好的空氣循環,避免過熱。
GPU 的垂直安裝尺寸較大,在卡片上方而非後方有額外的電源連接空間。
如何擴充專用 GPU 伺服器
在調整專屬 GPU 伺服器的大小時,您需要考量想要的產品功能,以及目前和未來的業務需求。最佳伺服器配置取決於您的目標工作負載、該伺服器的特定使用案例,以及您需要的快感。
可針對特定目標工作負載設定專用 GPU 伺服器,例如影片渲染、深度學習訓練、推論、大數據分析和高效能運算(HPC)。最佳伺服器配置取決於您的目標工作負載、該伺服器的特定使用案例,以及您需要的快感。
GPU 使用大量電力並產生大量熱量。它們比 CPU 大,需要更多空間來連接電源連接器。伺服器機箱不僅必須足夠大,以配合您想要使用的 GPU 數量,而且還須提供良好的通風,以避免過熱和熱節流。
專屬 GPU 伺服器的成本是多少?
可以理解的是,成本會因您選擇打造專屬 GPU 伺服器、租用伺服器或使用雲端服務而異。
如果要打造自己的伺服器,就必須考量 GPU 的成本,以及電源供應、機箱、專用 CPU、RAM 和儲存裝置。您可能還需要考慮建就地部署資料中心的成本,例如電力、空間、冷卻和維護成本。
GPU 按專業分類,價格因使用案例而異。舉例來說,NVIDIA 提供 V100-based 伺服器,適合深度學習和高精度計算。NVIDIA NVIDIA 的 NVIDIA GTX Titan Z 等頂級 GPU 可能花費約 3,000 美元。
如果您選擇使用雲端平台,有好幾個雲端服務供應商可提供專用 GPU 驅動的伺服器方案,包括 AWS V2 Cloud、Google Cloud Platform 和 Azure 等主要雲端服務供應商。舉例來說,AWS 提供單一 GPU 和四個虛擬核心每小時 0.900 美元的隨選定價。
GPU 機架伺服器:購買與租賃
選擇購買或租賃取決於幾個因素。您公司的預算和潛在的使用案例是主要的。
購買 GPU 機架伺服器需要預先成本。機器學習工作負載的頂級 GPU 可能標有高昂的價格。將此加到將 GPU 伺服器儲存到本機的維護、能源和頻寬成本中,您的初始投資成本可能是天文學的。
隨著現代技術創新的步伐,購買 GPU 伺服器會有過時的風險,之後您才能獲得投資回報。更新系統也會產生額外費用。
如果您使用大型資料集,並計畫在生產環境中部署模型,請考慮透過雲端服務供應商租用 GPU 基礎架構。此訂閱模式可讓您按小時或按月付費,視使用的資源而定,並根據目前需求進行擴充或縮小。
使用 Pure Storage 取得最先進的 AI 基礎架構
專用 GPU 伺服器比 CPU 伺服器具備多項優勢,包括效能提升、彈性提升,以及 CPU 資源利用率提升。專屬 GPU 伺服器可直接向服務供應商購買或租用。
AIRI 是 Pure Storage® 和 NVIDIA 開發的簡易、高度可擴充的快閃式 AI 基礎架構。AIRI 由最新的 NVIDIA DGX 系統驅動,包括 Pure Storage FlashBlade//S® 儲存、Pure Storage Purity//FB 作業系統,以及 Pure1® 雲端管理。
進一步瞭解 Pure 和 AIRI。