Un servidor de GPU dedicado es un servidor con una o más unidades de procesamiento de gráficos (GPU) que ofrece mayor potencia y velocidad para ejecutar tareas computacionalmente intensivas, como renderización de video, análisis de datos y aprendizaje automático. Los servidores GPU dedicados también pueden tener una CPU especializada y vienen con grandes cantidades de RAM y almacenamiento.
La arquitectura paralela de una GPU , originalmente diseñada para manejar el procesamiento de gráficos y videos, permite que un servidor de GPU dedicado administre varias tareas simultáneamente a velocidades más allá de las capacidades de un servidor basado en CPU.
¿Qué es un servidor en rack con GPU?
Un servidor de rack de GPU es un servidor equipado con GPU diseñadas para caber en un rack de servidor. Un rack de servidor es un marco rectangular con varias ranuras de montaje diseñadas para contener servidores de rack y otros componentes de red. Los servidores se apilan uno encima del otro para minimizar el uso del espacio del piso y se deslizan hacia adentro y hacia afuera del rack según sea necesario.
Un servidor de rack con GPU ofrece varias ventajas, entre ellas, una mejor utilización del espacio, una mayor escalabilidad, un flujo de aire maximizado y un mantenimiento más sencillo.
Razones para usar un servidor de GPU dedicado
Las GPU son las contrapartes especializadas y optimizadas para el rendimiento de las CPU. En lugar de tener un puñado de núcleos pesados con altas velocidades de reloj capaces de realizar una amplia variedad de tareas computacionales, las GPU emplean miles de núcleos livianos optimizados para procesar la misma operación en paralelo (es decir, instrucción única, datos múltiples [SIMD]).
Estos núcleos tienen conjuntos de instrucciones optimizados para cálculos de matriz dimensional aritmética y punto flotante, lo que acelera el álgebra lineal. El resultado final es un sistema optimizado para la computación en paralelo.
Entre las razones por las que podría querer usar un servidor de GPU dedicado se incluyen las siguientes:
- Procesos de análisis de Big Data
- Transmisión de video
- Procesamiento de imágenes
- Animaciones y simulaciones en 3D (p. ej., el modelado del plegamiento de la cadena de proteínas)
- Aplicaciones de aprendizaje profundo (p. ej., reconocimiento de voz)
- Descifrado de hash (p. ej., recuperación de contraseña)
- Criptomoneda de minería
Si tiene una sola operación, necesita una aceleración que pueda beneficiarse de la ejecución paralela en miles de núcleos, un servidor de GPU dedicado puede ayudarlo.
Tipos de servidores en rack con GPU
Los servidores de rack con GPU se adaptan a los servidores de rack o gabinetes. Los racks de servidores y el equipo instalado en ellos se miden en unidades de rack, escritas como “U” o, a veces, “RU”. Una “U” describe la altura del equipo (p. ej., la altura de un servidor o la altura y el número de estantes en un rack de servidores).
Una U equivale a 1,75 pulgadas, por lo que la altura de un servidor 1U sería de 1,75 pulgadas y un servidor 2U sería de 3,5 pulgadas. Una unidad de rack de 32U, por ejemplo, puede contener 32 servidores 1U, 4 servidores 8U o 1 servidor 32U.
Lea “Una guía definitiva sobre los tamaños de rack de servidores 19-Inch” para obtener más información sobre el tamaño de rack.
Factores de forma más pequeños frente a factores de forma más grandes
Las principales diferencias entre los factores de forma de los servidores de rack más pequeños y más grandes son su densidad y capacidad de expansión.
Servidores de rack con GPU de 1U y 2U
Los factores de forma más pequeños, como los servidores en rack de GPU de 1U y 2U, están diseñados teniendo en cuenta la densidad de rendimiento, pero son menos potentes que los factores de forma de servidores de GPU más grandes. Se utilizan comúnmente debido a sus costos más bajos y a su capacidad para ahorrar espacio en el rack del servidor.
Los servidores en rack con GPU de 1U y 2U son fáciles de mantener, altamente portátiles y fáciles de escalar (puede escalar el rendimiento al usar varios de ellos). Un servidor 1U generalmente puede contener una o dos CPU, varios terabytes de memoria y varias GPU. Un servidor de 2U al doble de la altura del servidor de 1U le dará un poco de espacio adicional para la potencia de computación y el almacenamiento.
En servidores de factor de forma más pequeños, las GPU generalmente se montan horizontalmente debido a las restricciones de espacio. También hay menos espacio para las ranuras y el almacenamiento PCIe, aunque puede expandirlos con un kit de expansión PCIe o un gabinete JBOD.
Servidores en rack con GPU de 8U y 16U
Los servidores de rack de GPU más grandes, como 8U y 16U, están orientados a cargas de trabajo que requieren capacidades de rendimiento más extensas. Vienen con más espacio para almacenamiento y ranuras de expansión adicionales, lo que le permite conectar tarjetas PCIe adicionales para aumentar el rendimiento del procesamiento de datos. El espacio adicional también promueve una mejor circulación de aire para evitar el sobrecalentamiento.
En un factor de forma más grande, las GPU se instalan verticalmente con espacio adicional para las conexiones de alimentación ubicadas en la parte superior de la tarjeta en lugar de en la parte posterior.
Cómo dimensionar un servidor de GPU dedicado
Al dimensionar un servidor de GPU dedicado, deberá considerar las características del producto que desea, así como sus necesidades comerciales actuales y futuras. La configuración óptima del servidor depende de sus cargas de trabajo objetivo, los casos de uso específicos de ese servidor y la rapidez con la que necesita que sea.
Los servidores de GPU dedicados se pueden configurar para cargas de trabajo objetivo específicas, como renderización de video, capacitación de aprendizaje profundo, inferencia, análisis de big data y computación de alto rendimiento (HPC). La configuración óptima del servidor depende de sus cargas de trabajo objetivo, los casos de uso específicos de ese servidor y la rapidez con la que necesita que sea.
Las GPU usan mucha potencia y generan toneladas de calor. Son más grandes que las CPU y necesitan espacio adicional para los conectores de alimentación. El chasis del servidor no solo debe ser lo suficientemente grande como para adaptarse a la cantidad de GPU que desea usar, sino que también debe proporcionar una buena ventilación de aire para evitar el sobrecalentamiento y la regulación térmica.
¿Cuánto cuesta un servidor de GPU dedicado?
Es comprensible que los costos varíen según si elige crear su propio servidor de GPU dedicado, alquilar un servidor o usar servicios basados en la nube.
Si va a crear su propio servidor, deberá considerar el costo de la GPU, así como la fuente de alimentación, el chasis, la CPU especializada, la RAM y el almacenamiento. Es posible que también deba considerar los costos que conlleva la construcción de centros de datos en las instalaciones, como los costos de energía, espacio, refrigeración y mantenimiento.
Las GPU se clasifican en especializaciones y los precios varían según el caso de uso. Por ejemplo, NVIDIA ofrece servidores V100-based adecuados para el aprendizaje profundo y los cálculos de alta precisión. Una GPU de primera categoría, como Nvidia GTX Titan Z de NVIDIA, puede costar alrededor de $3000.
Si elige usar una plataforma en la nube, hay varios proveedores de servicios en la nube que ofrecen planes de servidores basados en GPU dedicados, incluidos los principales proveedores de servicios en la nube como AWS V2 Cloud, Google Cloud Platform y Azure. AWS, por ejemplo, ofrece precios según demanda desde $0,900 por hora para una GPU y cuatro núcleos virtuales.
Servidor en rack de GPU: Compra frente a alquiler
Elegir si comprar o alquilar se reduce a varios factores. El presupuesto de su empresa y los posibles casos de uso son los principales.
Comprar un servidor de rack con GPU implica costos iniciales. Las GPU mejor calificadas para las cargas de trabajo de aprendizaje automático pueden tener un alto precio. Agrega esto a los costos de mantenimiento, energía y ancho de banda del almacenamiento de su servidor de GPU en las instalaciones, y sus costos de inversión iniciales podrían ser astronómicos.
Con el ritmo de las innovaciones tecnológicas modernas, comprar un servidor de GPU conlleva el riesgo de que se vuelva obsoleto antes de que pueda obtener un retorno sobre su inversión. La actualización del sistema también incurrirá en costos adicionales.
Si trabaja con grandes conjuntos de datos y planea implementar sus modelos en un entorno de producción, considere alquilar la infraestructura de GPU a través de un proveedor de servicios en la nube. Este modelo de suscripción le permite pagar por hora o mensualmente según los recursos que utilice y escalar hacia arriba o hacia abajo según las demandas actuales.
Obtenga infraestructura de AI de última generación con Pure Storage
Un servidor de GPU dedicado ofrece varias ventajas sobre un servidor basado en CPU, incluido un mayor rendimiento, una mayor flexibilidad y una mejor utilización de los recursos de CPU. Los servidores GPU dedicados se pueden comprar directamente o alquilar a un proveedor de servicios.
AIRI es una infraestructura de AI simple, altamente escalable y basada en flash desarrollada por Pure Storage ® y NVIDIA . AIRI cuenta con la tecnología de los sistemas NVIDIA DGX más recientes con el almacenamiento FlashBlade//S ® de Pure Storage, el sistema operativo Purity//FB de Pure Storage y la administración de la nube de Pure1®.
Experimente nuevos niveles de éxito de AI con Pure y AIRI.