I server GPU sono server con una o più unità di elaborazione grafica (GPU) dedicate che offrono una potenza e una velocità maggiori per l'esecuzione di attività con tanti calcoli, come il rendering di video, i data analytics e il machine learning. I server GPU possono avere una CPU specializzata e grandi quantità di RAM e storage.
L'architettura parallela di una GPU, progettata in origine per l'elaborazione di immagini e video, consente a un server GPU di gestire più attività contemporaneamente a velocità di gran lunga superiori rispetto a quelle supportate da un server basato su CPU.
Cosa sono i server rack GPU?
I server rack GPU sono server dotati di GPU adatti per il montaggio in rack. Il rack consiste in una struttura rettangolare con più slot in cui collocare i server e gli altri componenti di rete. I server vengono impilati in verticale per ridurre al minimo lo spazio occupato e vengono fatti scorrere dentro o fuori il rack in base alle necessità.
Un server rack GPU offre molti vantaggi, quali un miglior utilizzo dello spazio, una maggiore scalabilità, un migliore ricircolo dell'aria e una manutenzione facilitata.
Perché usare un server GPU
A differenza delle CPU, le GPU sono unità ottimizzate per la velocità di trasmissione. Anziché avere una serie di core pesanti con velocità di clock elevate in grado di eseguire tante operazioni computazionali diverse, le GPU utilizzano centinaia di core leggeri ottimizzati per elaborare la stessa operazione in parallelo (Single Instruction Multiple Data, SIMD).
Questi core hanno diverse istruzioni ottimizzate per i calcoli a virgola mobile e aritmetici con matrici dimensionali che velocizzano l'algebra lineare. Il risultato finale è un sistema adatto ai calcoli in parallelo.
Un server GPU è utile nei seguenti casi:
- Pipeline di Big Data Analytics
- Streaming video
- Elaborazione di immagini
- Animazioni e simulazioni 3D (es. modellazione del ripiegamento di una catena proteica)
- Applicazioni di deep learning (es. riconoscimento vocale)
- Cracking con hash (es. recupero delle password)
- Mining di criptovalute
Se vuoi accelerare una determinata operazione sfruttando i vantaggi dell'esecuzione in parallelo con migliaia di core, un server GPU può fare al caso tuo.
Tipi di server rack GPU
Questi tipi di server si inseriscono in rack o armadi e vengono misurati in unità rack (U o RU). L'unità rack indica l'altezza dei componenti installati (es. l'altezza di un server o l'altezza e il numero di alloggiamenti).
1U corrisponde a 1,75 pollici, per cui l'altezza di un server da 1U è pari a 1,75 pollici, di un server da 2U a 3,5 pollici e così via. Un'unità rack di 32U, ad esempio, può contenere 32 server da 1U, 4 server da 8U oppure 1 server da 32U.
Consulta la Guida definitiva ai rack per server da 19'' per maggiori informazioni sulle dimensioni dei rack.
Differenza tra fattori di forma più piccoli e più grandi
La differenza principale tra i server rack più piccoli e quelli più grandi sta nella loro densità ed espandibilità.
Server rack GPU da 1U e 2U
I fattori di forma più piccoli, come i server rack GPU da 1U e 2U, sono stati progettati per la massima densità di performance ma risultano meno potenti rispetto ai fattori di forma più grandi. In genere vengono utilizzati perché hanno ingombro e costi contenuti.
I server rack da 1U e 2U sono facili da gestire, trasportare e scalare: per aumentare le performance, basta usare più server. Un server da 1U può contenere una o due CPU, svariati terabyte di memoria e più GPU. Un server da 2U (due volte più alto rispetto a un server da 1U) avrà un po' più di spazio per i componenti di calcolo e storage.
Nei server con fattori di forma più piccoli, le GPU vengono montate in orizzontale perché lo spazio a disposizione è scarso. Hanno meno spazio anche per gli slot PCIe e lo storage, ma si può ovviare a questo problema con un kit di espansione PCIe o un alloggiamento JBOD.
Server rack GPU da 8U e 16U
I server rack GPU con fattori di forma più grandi, come quelli da 8U e 16U, sono adatti per i workload che richiedono performance più elevate; hanno infatti più spazio per lo storage e gli slot di espansione per il collegamento di altre schede PCIe per aumentare le performance di elaborazione. Lo spazio aggiuntivo migliora inoltre il ricircolo dell'aria ed evita il surriscaldamento.
Nei fattori di forma più grandi, le GPU sono installate in verticale lasciando spazio per i connettori elettrici sopra la scheda anziché sul lato posteriore.
Come dimensionare un server GPU
Per dimensionare un server GPU, devi tenere conto delle funzionalità di prodotto che vuoi applicare, nonché delle esigenze di business attuali e future. La configurazione ottimale è strettamente legata ai workload che prevedi di eseguire, ai casi d'uso specifici e alle velocità di cui hai bisogno.
I server GPU possono essere configurati per workload specifici come il rendering di video, l'addestramento del deep learning, l'inferenza, i Big Data Analytics e i calcoli HPC (High Performance Computing). La configurazione ottimale è strettamente legata ai workload che prevedi di eseguire, ai casi d'uso specifici e alle velocità di cui hai bisogno.
Le GPU consumano tanta energia e generano tantissimo calore. Sono più grandi delle CPU e richiedono più spazio per i connettori elettrici. Lo chassis deve essere più grande per ospitare il numero di GPU che desideri, ma anche garantire una buona aerazione ed evitare il surriscaldamento e il throttling termico.
Quanto costa un server GPU?
Ovviamente, i costi variano a seconda se scegli di acquistare un server GPU, di noleggiarlo oppure di utilizzare i servizi basati su cloud.
Se stai assemblando un server di proprietà, devi tener conto del costo della GPU oltre ai costi di alimentazione, chassis, CPU, RAM e risorse di storage. Inoltre devi tenere presenti i costi legati alla costruzione di data center on-premise, tra cui quelli di alimentazione, spazio, raffreddamento e manutenzione.
Le GPU sono classificate in base alla specializzazione e i prezzi variano a seconda del caso d'uso. Ad esempio, NVIDIA offre server V100 Tesla adatti per il deep learning e i calcoli ad alta precisione. Una GPU di fascia alta come Nvidia GTX Titan Z può costare circa 3.000 $.
Se scegli una piattaforma cloud, esistono diversi cloud service provider che offrono server con GPU dedicate, tra cui AWS V2 Cloud, Google Cloud Platform e Azure. Ad esempio, AWS offre prezzi on-demand a partire da 0,900 $ l'ora per una GPU e quattro core virtuali.
Server rack GPU: acquisto o noleggio?
La scelta tra l'acquisto o il noleggio dipende da tanti fattori. I principali sono il budget e i potenziali casi d'uso della tua azienda.
L'acquisto di un server rack GPU implica dei costi da pagare in anticipo. Le GPU di fascia alta per i workload di machine learning possono essere molto costose. Bisogna poi aggiungere i costi di manutenzione, energia e larghezza di banda legati all'installazione del server GPU on-premise, per cui l'investimento iniziale può risultare esagerato.
Considerati i ritmi delle innovazioni tecnologiche moderne, l'acquisto è piuttosto rischioso perché il server può diventare obsoleto prima di ottenere un ritorno sull'investimento. E l'aggiornamento del sistema comporta ulteriori costi.
Se lavori con grandi set di dati e intendi distribuire i modelli in un ambiente di produzione, valuta il noleggio di un'infrastruttura GPU da un cloud service provider. Con il modello in abbonamento puoi pagare all'ora o al mese a seconda delle risorse utilizzate e aumentare o diminuire la capacità in base alla domanda.
Scegli un'infrastruttura AI all'avanguardia con Pure Storage
I server GPU offrono diversi vantaggi rispetto ai server basati su CPU, tra cui performance più elevate, maggiore flessibilità e migliore utilizzo delle risorse CPU. I server GPU si possono acquistare tout-court o noleggiare da un service provider.
AIRI//S™ è un'infrastruttura AI basata su flash, semplice e ad alta scalabilità, sviluppata da Pure Storage® e NVIDIA. AIRI//S abbina i sistemi NVIDIA DGX più recenti allo storage FlashBlade//S®, al sistema operativo Purity//FB e alla soluzione di gestione cloud Pure1® di Pure Storage.
Raggiungi nuovi traguardi con l'AI grazie a Pure e AIRI//S.