Quali sono i fattori alla base dello sviluppo dell'HPC?
L'uso della tecnologia HPC si è diffuso grazie a quattro fattori in particolare:
Potenza di elaborazione
In sostanza, un singolo processore non dispone di tutta la capacità necessaria per elaborare volumi di dati enormi. Il modello HPC consente di produrre i risultati necessari utilizzando più unità di elaborazione in parallelo. Ricorda che in questo modello:
- L'insieme di più computer connessi in rete prende il nome di cluster.
- Ogni singola unità di elaborazione all'interno del cluster si chiama nodo.
- Ogni processore di un nodo dispone di diversi core.
Ad esempio, un cluster con 16 nodi da quattro core ciascuno è considerato molto piccolo, ma offre un totale di 64 core che lavorano in parallelo.
Oggi, nella maggior parte degli scenari di utilizzo dell'HPC vengono utilizzati migliaia di core che lavorano in parallelo per accelerare il completamento dei processi designati. I provider di servizi Infrastructure-as-a-Service (IaaS) offrono agli utenti la possibilità di sfruttare un numero elevato di nodi quando necessario, per poi ridurre il workload al termine dell'operazione. Gli utenti pagano solamente la potenza di elaborazione richiesta, senza sostenere i costi di capitale (CapEx, capital expenditure) associati alla costruzione dell'infrastruttura. In genere, le soluzioni IaaS permettono agli utenti di definire il layout dei nodi per applicazioni specifiche, se necessario.
Sistema operativo
Il sistema operativo è l'interfaccia tra l'hardware e il software utilizzati in un sistema HPC. I sistemi operativi più diffusi negli ambienti HPC sono Linux e Windows. Per le operazioni HPC viene solitamente utilizzato Linux, mentre Windows viene utilizzato solo quando sono necessarie applicazioni specifiche di Windows.
Network
In un sistema HPC, la rete connette l'hardware di elaborazione, lo storage necessario e l'utente. L'hardware di elaborazione viene connesso tramite network in grado di gestire larghezze di banda elevatissime per la trasmissione dei dati. Questi network devono presentare anche una latenza ridotta, per accelerare il trasferimento dei dati. La trasmissione dei dati e la gestione dei cluster vengono affidate a cluster manager, servizi di gestione o scheduler.
Il cluster manager esegue il workload suddividendolo fra le risorse di elaborazione distribuite, come CPU, FPGA, GPU e unità disco. Per consentire al cluster manager di gestirle, tutte queste risorse devono essere connesse alla stessa rete. Quando si utilizzano i servizi di un provider IaaS, quest'ultimo attiva automaticamente tutte le funzioni necessarie per la gestione dell'infrastruttura.
Storage
Infine, i dati elaborati da un sistema HPC devono essere memorizzati in un repository di grandi dimensioni. Poiché i dati possono assumere varie forme (strutturati, semistrutturati e non strutturati), per memorizzarli possono essere necessari diversi tipi di database.
I dati non elaborati vengono memorizzati in un data lake. L'elaborazione di tali dati può essere problematica, perché non sono ancora stati assegnati a uno scopo. I dati ripuliti ed elaborati in funzione di uno scopo specifico vengono memorizzati in un data warehouse.
Storage: l'anello mancante nell'HPC
In molti scenari di utilizzo dell'HPC, lo storage, che costituisce un componente cruciale dell'architettura, viene spesso trascurato. La tecnologia HPC viene utilizzata per elaborare enormi quantità di dati in parallelo, ma le sue performance dipendono dalla capacità di interazione di tutti i componenti dell'architettura.
In genere, le soluzioni di storage legacy tradizionali non consentono di rispondere alle esigenze dell'HPC, creando colli di bottiglia durante il processo e rischiando di pregiudicare le performance. Poiché il data storage deve essere in grado di tenere il passo con la velocità di elaborazione della configurazione, molte architetture HPC si avvalgono dello storage UFFO (Unified Fast File and Object).
Evergreen//One™ offre una soluzione di storage UFFO rapida e affidabile, con tutta la praticità del modello pay-as-you-go (PaYG). Può essere utilizzato negli ambienti on-premise e hybrid cloud ed è perfetto per i sistemi HPC, che richiedono scalabilità per le operazioni senza compromettere le performance.
Acquista Evergreen//One oggi stesso. Per i nuovi clienti i primi tre mesi di servizio sono gratuiti.