Een toegewijde GPU-server is een server met een of meer grafische verwerkingseenheden (graphics processing units - GPU's) die meer kracht en snelheid biedt voor het uitvoeren van rekenintensieve taken, zoals videoweergave, data-analyse en machine learning. Toegewijde GPU-servers kunnen ook een gespecialiseerde CPU hebben en worden geleverd met grote hoeveelheden RAM en opslag.
De parallelle architectuur van een GPU, oorspronkelijk ontworpen voor grafische en videoverwerking, stelt een toegewijde GPU-server in staat meerdere taken tegelijk te beheren met snelheden die de mogelijkheden van een CPU-server te boven gaan.
Wat is een GPU-rackserver?
Een GPU-rackserver is een server met GPU's die ontworpen is om in een serverrack te passen. Een serverrack is een rechthoekig frame met meerdere montagesleuven, ontworpen om rackservers en andere netwerkcomponenten in op te bergen. Servers worden op elkaar gestapeld om het gebruik van vloeroppervlak te minimaliseren en worden indien nodig in en uit het rack geschoven.
Een GPU-rackserver biedt verschillende voordelen, zoals beter ruimtegebruik, grotere schaalbaarheid, maximale luchtstroom en eenvoudiger onderhoud.
Redenen om een toegewijde GPU-server te gebruiken
GPU's zijn de voor verwerking geoptimaliseerde, gespecialiseerde tegenhangers van CPU's. In plaats van een handvol zware kernen met hoge kloksnelheden die een grote verscheidenheid aan rekentaken kunnen uitvoeren, maken GPU's gebruik van duizenden lichtgewicht kernen die zijn geoptimaliseerd om dezelfde bewerking parallel uit te voeren (d.w.z. Single Instruction, Multiple Data [SIMD]).
Deze kernen hebben instructiesets die zijn geoptimaliseerd voor dimensionale matrixberekeningen en drijvendekommaberekeningen, waardoor lineaire algebra sneller verloopt. Het eindresultaat is een systeem dat geoptimaliseerd is voor parallelle berekeningen.
Redenen om een toegewijde GPU-server te gebruiken zijn onder meer:
- Big data analytics pipelines
- Video streamen
- Beeldverwerking
- 3D-animaties en -simulaties (bv. de modellering van de vouwing van eiwitketens)
- Deep learning-applicaties (bijv. spraakherkenning)
- Hash cracking (bv. wachtwoordherstel)
- Cryptocurrency delven
Als u een enkele bewerking wilt versnellen die kan profiteren van parallelle uitvoering over duizenden kernen, kan een speciale GPU-server uitkomst bieden.
Types GPU-rackservers
GPU-rackservers passen in rackservers of kasten. Serverracks en de daarin geïnstalleerde apparatuur worden gemeten in rackunits, geschreven als "U" of soms "RU". Een "U" beschrijft de hoogte van apparatuur (bv. de hoogte van een server of de hoogte en het aantal schappen in een serverrack).
Een U is gelijk aan 1,75 inch (4,45 cm), dus de hoogte van een 1U-server is 1,75 inch (4,45 cm) en een 2U-server 3,5 inch (8,90 cm). Een 32U-rackunit kan bijvoorbeeld 32 1U-servers, 4 8U-servers of 1 32U-server bevatten.
Lees "A Definitive Guide to 19-Inch Server Rack Sizes" voor meer informatie over rackmaten.
Kleinere vormfactoren vs. grotere vormfactoren
De primaire verschillen tussen kleinere en grotere rackservervormfactoren zijn hun densiteit en uitbreidingsmogelijkheden.
1U- & 2U-GPU-rackservers
Kleinere vormfactoren, zoals 1U- en 2U-GPU-rackservers, zijn ontworpen met het oog op prestatiedichtheid, maar zijn minder krachtig dan grotere GPU server vormfactoren. Ze worden vaak gebruikt vanwege hun lagere kosten en de mogelijkheid om serverrackruimte te besparen.
1U- en 2U-GPU-rackservers zijn gemakkelijk te onderhouden, zeer draagbaar, en gemakkelijk te schalen (u kunt de prestaties schalen door er meerdere te gebruiken). Een 1U-server kan doorgaans een of twee CPU's, verschillende terabytes geheugen en meerdere GPU's bevatten. Een 2U-server met de dubbele hoogte van de 1U-server geeft u wat extra ruimte voor rekenkracht en opslag.
In servers met een kleinere vormfactor worden GPU's doorgaans horizontaal gemonteerd vanwege ruimtebeperkingen. Er is ook minder ruimte voor PCIe-slots en opslag, hoewel u deze kunt uitbreiden met een PCIe-uitbreidingskit of JBOD-behuizing.
8U- & 16U-GPU-rackservers
Grotere GPU-rackservers zoals 8U en 16U zijn gericht op workloads die uitgebreidere prestatiemogelijkheden vereisen. Ze hebben meer ruimte voor opslag en extra uitbreidingssleuven, zodat u extra PCIe-kaarten kunt aansluiten om de dataverwerkingsprestaties te verhogen. De extra ruimte zorgt ook voor een betere luchtcirculatie om oververhitting te voorkomen.
In een grotere vormfactor worden GPU's verticaal geïnstalleerd, met extra ruimte voor voedingsaansluitingen aan de bovenkant van de kaart in plaats van aan de achterkant.
Hoe wordt de grootte van een toegewijde GPU-server bepaald?
Bij de dimensionering van een toegewijde GPU-server moet u rekening houden met de gewenste productfuncties en uw huidige en toekomstige bedrijfsbehoeften. De optimale serverconfiguratie hangt af van uw beoogde workloads, de specifieke gebruikssituaties van die server, en hoe snel hij moet zijn.
Toegewijde GPU-servers kunnen worden geconfigureerd voor specifieke workloads, zoals video rendering, deep learning training, inferentie, big data analytics en high-performance computing (HPC). De optimale serverconfiguratie hangt af van uw beoogde workloads, de specifieke gebruikssituaties van die server, en hoe snel hij moet zijn.
GPU's verbruiken veel stroom en produceren veel warmte. Ze zijn groter dan CPU's en hebben extra ruimte nodig voor voedingsaansluitingen. Het serverchassis moet niet alleen groot genoeg zijn voor het aantal GPU's dat u wilt gebruiken, maar ook goede luchtventilatie bieden om oververhitting en thermische throttling te voorkomen.
Wat kost een toegewijde GPU-server?
Het is begrijpelijk dat de kosten variëren naargelang u ervoor kiest uw eigen toegewijde GPU-server te bouwen, een server te huren of cloud-gebaseerde diensten te gebruiken.
Als u uw eigen server bouwt, moet u rekening houden met de kosten van de GPU, de voeding, het chassis, gespecialiseerde CPU, RAM en opslag. Mogelijk moet u ook rekening houden met de kosten die gepaard gaan met het bouwen van datacenters op locatie, zoals stroom-, ruimte-, koel- en onderhoudskosten.
GPU's worden ingedeeld op specialisaties, en de prijzen variëren afhankelijk van het gebruik. NVIDIA biedt bijvoorbeeld Tesla V100-gebaseerde servers die geschikt zijn voor deep learning en hoge-precisieberekeningen. Een GPU van topkwaliteit, zoals de Nvidia GTX Titan Z van NVIDIA, kost ongeveer 3000 dollar.
Als u kiest voor een cloudplatform, zijn er verschillende cloud-serviceproviders die toegewijde GPU-aangedreven serverplannen aanbieden, waaronder de grote cloud-serviceproviders zoals AWS V2 Cloud, Google Cloud Platform en Azure. AWS biedt bijvoorbeeld on-demand prijzen vanaf 0,900 dollar per uur voor één GPU en vier virtuele cores.
GPU-rackserver: Aankoop vs. huur
De keuze om te kopen of te huren hangt af van verschillende factoren. Het budget van uw bedrijf en de potentiële gebruiksmogelijkheden zijn de belangrijkste.
De aanschaf van een GPU-rackserver brengt aanloopkosten met zich mee. De beste GPU's voor machine learning workloads kunnen een stevig prijskaartje hebben. Voeg dit bij de onderhouds-, energie- en bandbreedtekosten van de opslag van uw GPU-server op locatie, en uw initiële investeringskosten kunnen astronomisch hoog oplopen.
Met het tempo van de moderne technologische innovaties brengt de aankoop van een GPU-server het risico met zich mee dat deze verouderd is voordat u uw investering kunt terugverdienen. Ook het updaten van het systeem brengt extra kosten met zich mee.
Als u met grote datasets werkt en van plan bent uw modellen in een productieomgeving in te zetten, kunt u overwegen GPU-infrastructuur te huren via een cloud-serviceprovider. Met dit abonnementsmodel kunt u per uur of per maand betalen, afhankelijk van de resources die u gebruikt, en op- of afschalen op basis van de actuele vraag.
Krijg geavanceerde AI-infrastructuur met Pure Storage
Een toegewijde GPU-server biedt verschillende voordelen ten opzichte van een CPU-server, waaronder hogere prestaties, meer flexibiliteit en een beter gebruik van CPU-resources. Toegewijde GPU-servers kunnen rechtstreeks worden gekocht of gehuurd van een serviceprovider.
AIRI//S™ is een eenvoudige, zeer schaalbare, op flash-gebaseerde AI-infrastructuur, ontwikkeld door Pure Storage® en NVIDIA. AIRI//S wordt aangedreven door de nieuwste NVIDIA DGX-systemen met Pure Storage FlashBlade//S®-opslag, het Pure Storage Purity//FB-besturingssysteem en Pure1®-cloudmanagement.
Ervaar nieuwe niveaus van AI-succes met Pure en AIRI//S.