Un servidor GPU dedicado es un servidor con una o más unidades de procesamiento gráfico (GPU por sus siglas en inglés), que ofrece más potencia y velocidad para ejecutar tareas computacionalmente intensivas, como la representación de vídeo, los análisis de datos y el aprendizaje automático. Los servidores GPU dedicados también pueden tener una CPU (unidad central de procesamiento) especializada y grandes cantidades de RAM y almacenamiento.
La arquitectura paralela de una GPU, diseñada inicialmente para encargarse del procesamiento de gráficos y vídeos, permite que un servidor GPU dedicado gestione múltiples tareas simultáneamente a unas velocidades que superan las de un servidor de CPU.
¿Qué es un servidor GPU en rack?
Un servidor GPU en rack es un servidor equipado con unas GPU diseñadas para encajar en un bastidor (o rack) de servidores. Un bastidor de servidores es una estructura rectangular con múltiples ranuras de montaje diseñadas para alojar los servidores en rack y otros componentes de red. Los servidores están colocados unos sobre otros para minimizar la superficie ocupada y se meten y se sacan del bastidor deslizándose, según sea necesario.
Un servidor GPU en rack ofrece varias ventajas, como un mejor uso del espacio, una mayor escalabilidad, un flujo de aire maximizado y un mantenimiento más fácil.
Motivos por los que utilizar un servidor GPU dedicado
Las GPU son el equivalente especializado y optimizado para el rendimiento de las CPU. En lugar de tener varios núcleos pesados con velocidades de reloj altas capaces de realizar una gran variedad de tareas computacionales, las GPU utilizan miles de núcleos ligeros optimizados para procesar la misma operación en paralelo (es decir, una instrucción, múltiples datos [Single Instruction, Multiple Data o SIMD]).
Estos núcleos tienen conjuntos de instrucciones optimizadas para los cálculos aritméticos de matrices dimensionales y de coma flotante, lo que acelera el álgebra lineal. El resultado final es un sistema optimizado para el procesamiento en paralelo.
Existen diversos casos en los que le puede interesar usar un servidor GPU dedicado:
- Las canalizaciones de análisis de macrodatos
- La transmisión de vídeo
- El procesamiento de imágenes
- Las animaciones y las simulaciones en 3D (por ejemplo, el modelado del plegamiento de la cadena proteica)
- Las aplicaciones del aprendizaje profundo (por ejemplo, el reconocimiento de voz)
- El descifrado de hash (por ejemplo, la recuperación de contraseñas)
- La minería de criptomonedas
Si necesita acelerar una operación que puede beneficiarse de la ejecución paralela en miles de núcleos, un servidor GPU dedicado puede ayudarle.
Tipos de servidores GPU en rack
Los servidores GPU en rack se instalan en bastidores o armarios de servidores. Los bastidores de servidores y los equipamientos que hay instalados en ellos se miden en unidades de rack, indicadas como “U” o a veces “RU”. Una “U” describe la altura del equipamiento (por ejemplo, la altura de un servidor o la altura y el número de estantes de un bastidor de servidores).
Una U equivale a 1,75 pulgadas (4,445 cm), por lo que la altura de un servidor de 1 U sería de 1,75 pulgadas (4,445 cm) y la de un servidor de 2 U de 3,5 pulgadas (8,89 cm). Una unidad de rack de 32 U, por ejemplo, puede contener 32 servidores de 1 U, 4 servidores de 8 U o 1 servidor de 32 U.
Lea “La guía definitiva de los tamaños de bastidor de servidores de 19 pulgadas” si desea más información sobre el tamaño de los bastidores.
Los factores de forma pequeños y los factores de forma grandes
Las diferencias principales entre los factores de forma pequeños y grandes de los bastidores de rack radican en su densidad y su capacidad de expansión.
Servidores GPU en rack de 1 U y 2 U
Los factores de forma más pequeños, como los servidores GPU en rack de 1 U y de 2 U, se han diseñado teniendo en cuenta la densidad de rendimiento, pero son menos potentes que los factores de forma de servidor GPU más grandes. Se suelen utilizar debido a sus costes más bajos y a su capacidad para ahorrar espacio en el bastidor.
Los servidores GPU en rack de 1 U y de 2 U son fáciles de mantener, muy portátiles y fáciles de escalar (se puede escalar el rendimiento usando varios de ellos). Un servidor de 1 U puede alojar normalmente una o dos CPU, varios terabytes de memoria y múltiples GPU. Un servidor de 2 U con el doble de altura que un servidor de 1 U le proporcionará un poco de espacio adicional para la potencia de procesado y el almacenamiento.
En los servidores con un factor de forma más pequeño, las GPU suelen estar montadas horizontalmente, debido a las limitaciones de espacio. También hay menos espacio para las ranuras PCIe y el almacenamiento, aunque se pueden ampliar usando un kit de expansión PCIe o una caja JBOD.
Servidores GPU en rack de 8 U y 16 U
Los servidores GPU en rack más grandes, como los de 8 U y 16 U, están enfocados a las cargas de trabajo que requieren unas mayores capacidades de rendimiento. Tienen más espacio para el almacenamiento y ranuras de expansión adicionales, lo que permite conectar más tarjetas PCIe para aumentar el rendimiento del procesamiento de datos. El espacio adicional también mejora la circulación del aire para evitar el sobrecalentamiento.
En un factor de forma más grande, las GPU están instaladas verticalmente y con un espacio extra para las conexiones, que están situadas en lo alto de la tarjeta, en lugar de detrás.
Cómo dimensionar un servidor GPU dedicado
Al dimensionar un servidor GPU dedicado, deberá tener en cuenta las características que desea que tenga el producto y sus necesidades empresariales actuales y futuras. La configuración óptima del servidor depende de las cargas de trabajo que quiere ejecutar, de los casos de uso específicos de dicho servidor y de lo rápido que necesita que sea este servidor.
Los servidores GPU dedicados pueden configurarse para cargas de trabajo específicas, como la representación de vídeo, el entrenamiento del aprendizaje profundo, la inferencia, los análisis de macrodatos y la informática de alto rendimiento (HPC). La configuración óptima del servidor depende de las cargas de trabajo que quiere ejecutar, de los casos de uso específicos de dicho servidor y de lo rápido que necesita que sea este servidor.
Las GPU consumen mucha energía y generan un montón de calor. Son más grandes que las CPU y necesitan un espacio adicional para los conectores de alimentación. El chasis del servidor no solo tiene que ser lo bastante grande para albergar la cantidad de GPU que quiera utilizar, sino que además tiene que proporcionar una buena ventilación por aire para evitar el sobrecalentamiento y la desaceleración térmica.
¿Cuánto cuesta un servidor GPU dedicado?
Como es lógico, los costes varían en función de si decide construir su propio servidor GPU dedicado, si alquila un servidor o si usa unos servicios basados en la nube.
Si va a construir su propio servidor, deberá tener en cuenta el coste de la GPU y el de la alimentación eléctrica, el chasis, las CPU especializadas, la RAM y el almacenamiento. También deberá considerar los costes que trae aparejados la construcción del centro de datos en sus propias instalaciones, como los costes energéticos, de espacio, de refrigeración y de mantenimiento.
Las GPU se clasifican por especializaciones y los precios varían en función de los casos de uso. Por ejemplo, NVIDIA ofrece servidores basados en Tesla V100 adecuados para el aprendizaje profundo y los cálculos de alta precisión. Una GPU de las mejor valoradas, como la Nvidia GTX Titan Z de NVDIA, puede costar unos 3000 dólares estadounidenses.
Si decide optar por una plataforma en la nube, hay varios proveedores de servicios en la nube que pueden ofrecerle planes de servidores que funcionan con GPU, entre ellos los principales proveedores de servicios en la nube, como AWS V2 Cloud, Google Cloud Platform y Azure. AWS, por ejemplo, ofrece unos precios bajo demanda a partir de los 0,900 $ por hora para una GPU y cuatro núcleos virtuales.
Servidor GPU en rack: compra o alquiler
La decisión de comprar o de alquilar depende de varios factores. Los más importantes son el presupuesto de su empresa y los casos de uso potenciales.
La compra de un servidor GPU en rack conlleva unos costes iniciales. Las GPU mejor valoradas para las cargas de trabajo de aprendizaje profundo pueden tener un precio muy alto. Si a ello le añadimos los costes del mantenimiento, la energía y el ancho de banda necesarios para tener el servidor GPU en sus instalaciones, la inversión inicial puede llegar a ser astronómica.
Teniendo en cuenta el ritmo de aparición de las modernas innovaciones tecnológicas, la compra de un servidor GPU conlleva el riesgo de que este quede obsoleto antes de que haya logrado amortizar su inversión. La actualización del sistema también trae aparejados unos costes adicionales.
Si trabaja con grandes conjuntos de datos y prevé implementar sus modelos en un entorno de producción, debe plantearse alquilar la infraestructura de GPU a un proveedor de servicios en la nube. Este modelo de suscripción le permite pagar por horas o meses, según los recursos que utilice, y ampliar o reducir en función de sus necesidades en un momento dado.
Consiga una infraestructura de IA de última generación con Pure Storage
Un servidor GPU dedicado ofrece varias ventajas respecto de un servidor de CPU, como un mayor rendimiento, un incremento de la flexibilidad y una mejor utilización de los recursos de la CPU. Los servidores GPU dedicados pueden comprarse en su totalidad o alquilarse a un proveedor de servicios.
AIRI//S™ es una infraestructura de IA sencilla, muy escalable y basada en el flash, que ha sido desarrollada por Pure Storage® y NVIDIA. AIRI//S funciona con los sistemas NVIDIA DGX más nuevos y con el almacenamiento FlashBlade//S®, el sistema operativo Purity//FB y la administración en la nube Pure1® de Pure Storage.
Experimente unos nuevos niveles de éxito con la IA gracias a Pure y AIRI//S.