Un serveur dédié GPU est un serveur équipé de plusieurs processeurs graphiques (GPU) qui délivre davantage de puissance et de rapidité pour prendre en charge les tâches gourmandes en ressources de calcul, par exemple le rendu vidéo, l’analytique de données et l’apprentissage machine. Les serveurs dédiés GPU peuvent également intégrer un processeur spécialisé et offrir de grandes quantités de RAM et d’espace de stockage.
L’architecture parallèle d’un GPU, initialement conçu pour le traitement graphique et vidéo, permet à ce type de serveur de gérer plusieurs tâches simultanément à des vitesses qui dépassent les capacités d’un simple serveur basé sur des processeurs.
Qu’est-ce qu’un serveur rack GPU ?
Un serveur rack GPU est un serveur équipé de processeurs graphiques spécialement conçus pour être installés dans un rack de serveurs. Un rack de serveurs se présente sous la forme d’une structure rectangulaire qui intègre plusieurs logements de montage destinés à accueillir des serveurs rack et d’autres composants réseau. Les serveurs sont empilés les uns sur les autres pour réduire l’encombrement au sol et coulissent simplement via un système de tiroir.
Un serveur rack GPU garantit, entre autres avantages, une meilleure utilisation de l’espace, une plus grande évolutivité, un écoulement d’air optimal et une plus grande simplicité de maintenance.
Pourquoi utiliser un serveur dédié GPU ?
Les GPU ne sont ni plus ni moins que l’équivalent des CPU, mais dans une version spécialisée et optimisée pour le débit. Plutôt que d’utiliser de nombreux cœurs « lourds » capables de délivrer de hautes fréquences d’horloge pour prendre en charge une grande diversité de tâches de calcul, les GPU s’appuient sur des milliers de cœurs allégés, optimisés pour traiter la même opération en parallèle (SIMD, Single Instruction, Multiple Data).
Ces cœurs suivent des ensembles d’instructions optimisés pour le traitement arithmétique à matrice dimensionnelle et pour les calculs en virgule flottante, ce qui accélère l’algèbre linéaire et contribue à produire un système optimisé pour le calcul parallèle.
Les serveurs dédiés GPU sont adaptés à de nombreux cas d’usage :
- Pipelines d’analytique et Big Data
- Vidéo en streaming
- Traitement d’images
- Animations et simulations en 3D (par exemple, modélisation du repliement protéique)
- Applications de deep learning (reconnaissance vocale par exemple)
- Cassage de mots de passe (pour la récupération des mots de passe)
- Minage de cryptomonnaie
Un serveur dédié GPU peut être une excellente solution si vous cherchez à accélérer une opération bien spécifique qui pourrait tirer avantage d’une exécution parallèle sur plusieurs milliers de cœurs.
Types de serveurs rack GPU
Les serveurs rack GPU sont montés dans des racks ou des armoires. Les racks de serveurs et leurs équipements internes sont mesurés en unités de rack (« U » ou « RU »). Une unité de rack, « U », décrit la hauteur de l’équipement (par exemple, la hauteur d’un serveur ou la hauteur et le nombre d’étagères dans un rack de serveurs).
Une U est égale à 1,75 pouce ; la hauteur d’un serveur 1U est donc de 1,75 pouce, et celle d’un serveur 2U est de 3,5 pouces. Un rack 32U, par exemple, peut contenir 32 serveurs 1U, 4 serveurs 8U ou 1 serveur 32U.
Pour en savoir plus sur les dimensions de racks, consultez le Guide des tailles de racks de serveurs 19 pouces (en anglais).
Grand ou compact : quel format choisir ?
Les principales différences entre les différents formats de serveurs rack résident dans leur densité et leur capacité d’extension.
Serveurs rack GPU 1U et 2U
Les formats compacts (serveurs rack GPU 1U et 2U, par exemple) sont conçus dans une logique de densité des performances. Ils sont en revanche moins puissants que les plus grands formats de serveurs GPU. Leurs coûts réduits et leur capacité à économiser de l’espace rack les rendent très attractifs, c’est pourquoi ils sont couramment utilisés.
Les serveurs rack GPU 1U et 2U sont faciles à entretenir, à transporter et à faire évoluer (avec la possibilité d’en utiliser plusieurs pour augmenter les performances). Un serveur 1U peut généralement accueillir un ou deux processeurs, plusieurs téraoctets de mémoire et plusieurs processeurs graphiques. Un serveur 2U (deux fois plus haut qu’un serveur 1U) procure légèrement plus d’espace pour la puissance de calcul et le stockage.
Dans les serveurs plus compacts, les processeurs graphiques sont généralement montés à l’horizontale pour des questions de contraintes d’espace. Ces serveurs offrent également moins d’espace pour les logements PCIe et le stockage, bien qu’il soit possible d’utiliser un kit d’extension PCIe ou un boîtier JBOD.
Serveurs rack GPU 8U et 16U
Les serveurs rack GPU plus hauts (8U et 16U par exemple) sont conçus pour les charges de travail qui exigent des performances plus intenses. Ils offrent davantage d’espace de stockage et intègrent des logements d’extension supplémentaires pour vous permettre d’ajouter des cartes PCIe afin d’améliorer les performances de traitement de données. L’espace supplémentaire garantit également une meilleure circulation de l’air, ce qui évite les risques de surchauffe.
Dans les plus grands formats, les processeurs graphiques sont montés à la verticale. Un espace est prévu au-dessus de la carte (et non à l’arrière) pour le raccordement des connexions d’alimentation.
Comment dimensionner un serveur dédié GPU
Pour le dimensionnement d’un serveur dédié GPU, vous devez impérativement tenir compte des fonctionnalités produit dont vous avez besoin et évaluer vos besoins métier actuels et futurs. La configuration de serveur optimale dépend de vos charges de travail, des cas d’usage spécifiques du serveur et du degré de rapidité recherché.
Les serveurs dédiés GPU peuvent être configurés pour des charges de travail spécifiques, par exemple le rendu vidéo, l’entraînement de modèles deep learning, l’inférence, l’analytique et le Big Data, ou encore le calcul haute performance (HPC). La configuration de serveur optimale dépend de vos charges de travail, des cas d’usage spécifiques du serveur et du degré de rapidité recherché.
Les processeurs graphiques consomment énormément d’énergie et génèrent d’immenses quantités de chaleur. Plus massifs que les simples processeurs, ils ont besoin d’espace supplémentaire pour accueillir leurs connecteurs d’alimentation. Le châssis du serveur doit non seulement être suffisamment large pour accueillir le nombre de GPU que vous voulez utiliser, mais également assurer une bonne ventilation d’air pour éviter les surchauffes et l’étranglement thermique.
Combien coûte un serveur dédié GPU ?
Les coûts varient inévitablement selon que vous décidiez de développer votre propre serveur, de louer un serveur ou d’utiliser des services basés sur le cloud.
Si vous développez votre propre serveur, vous devez tenir compte non seulement du coût du processeur graphique proprement dit, mais également du coût de l’alimentation, du châssis, du processeur spécialisé, de la RAM et du stockage. Il peut également être intéressant de prendre en compte les coûts associés au développement de datacenters on-premises, notamment les coûts d’alimentation, d’espace, de refroidissement et de maintenance.
Les processeurs graphiques sont classés en fonction de leur spécialisation et leurs prix varient selon leur cas d’usage. Par exemple, NVIDIA propose des serveurs équipés de GPU Tesla V100 qui conviennent pour le deep learning et les calculs haute précision. Un GPU haut de gamme de type NVIDIA GTX Titan Z peut coûter autour de 3 000 $.
Si vous optez pour une plateforme cloud, un certain nombre de fournisseurs de services cloud, notamment des grands noms comme AWS V2 Cloud, Google Cloud Platform ou Azure, proposent des plans d’abonnement à des serveurs dédiés GPU. AWS, par exemple, propose une tarification à la demande à partir de 0,900 $ de l’heure pour un processeur graphique et quatre cœurs virtuels.
Serveur rack GPU : achat ou location ?
Le choix de l’achat ou de la location dépend de plusieurs facteurs, à commencer par le budget de votre entreprise et par les cas d’usage potentiels.
L’achat d’un serveur rack GPU implique des coûts initiaux et, à cet égard, les GPU haut de gamme conçus pour les charges de travail associées à l’apprentissage machine peuvent être tout particulièrement onéreux. Ajoutez à cela les coûts de maintenance, d’énergie et de bande passante que vous devrez supporter en stockant votre serveur GPU on-premises, et vous obtenez des coûts d’investissement initiaux littéralement astronomiques.
Face au rythme soutenu des innovations technologiques modernes, sachez que votre tout nouveau serveur GPU risque de devenir obsolète avant même que puissiez rentabiliser votre investissement. La mise à jour du système peut également induire des coûts supplémentaires.
Si vous intervenez sur des datasets volumineux et que vous envisagez de déployer vos modèles dans un environnement de production, envisagez plutôt de louer une infrastructure GPU auprès d’un fournisseur de services cloud. Ce modèle d’abonnement repose sur une tarification horaire ou mensuelle, en fonction des ressources que vous utilisez, et vous permet de monter ou de diminuer en capacité en fonction de vos besoins actuels.
Bénéficiez d’une infrastructure IA à la pointe de la technologie grâce à Pure Storage
Performances optimisées, flexibilité accrue, meilleure utilisation des ressources CPU : un serveur dédié GPU offre un certain nombre d’avantages comparativement à un serveur purement basé sur des processeurs. Les serveurs dédiés GPU peuvent être soit achetés directement, soit loués auprès d’un fournisseur de services.
Pure Storage® et NVIDIA ont développé conjointement AIRI//S™, une infrastructure IA simple et hautement évolutive, reposant sur le stockage flash. Pilotée par les systèmes NVIDIA DGX nouvelle génération, l’infrastructure AIRI//S repose sur le stockage FlashBlade//S® de Pure Storage, le système d’exploitation Pure Storage Purity//FB et la solution de gestion cloud Pure1®.
Repoussez les limites de l’IA avec Pure et AIRI//S.