¿Qué factores posibilitan la HPC?
En particular, hay cuatro factores que impulsan el uso de la HPC:
Potencia de procesamiento
En palabras simples, el ancho de banda que se requiere para procesar grandes volúmenes de datos no puede ser proporcionado por un único procesador. En cambio, en un modelo HPC, varios centros de procesamiento funcionan en paralelo para ofrecer buenos resultados. Recuerde que en este modelo:
- El grupo de computadoras individuales que se conectan en red de forma conjunta se denomina clúster.
- Cada unidad de procesamiento individual en el clúster se denomina nodo.
- Cada procesador en un nodo tendrá varios núcleos.
Como ejemplo, un clúster con 16 nodos y cuatro núcleos cada uno es un clúster pequeño, que representa un total de 64 núcleos que funcionan en paralelo.
La mayoría de los casos de uso de HPC actuales incluyen miles de núcleos que funcionan en paralelo para completar los procesos designados en un periodo de tiempo más corto. Los proveedores de infraestructura como servicio (IaaS) ofrecen a los usuarios la posibilidad de aprovechar grande cantidades de nodos cuando se requiere y luego se desconecta la carga de trabajo cuando se completa el requerimiento. Los usuarios solo pagan por la potencia de procesamiento requerida, sin los costos de desembolso de capital (CAPEX) asociados con la construcción de la infraestructura. Con IaaS, los usuarios generalmente tienen la posibilidad de prescribir diseños de nodos para aplicaciones específicas, si se requiere.
Sistema operativo
Los sistemas operativos actúan como la interfaz entre el hardware y el software que se usa en HPC. Los dos sistemas operativos más importantes que se usan en los entornos HPC son Linux y Windows. Linux generalmente se usa para HPC, mientas que Windows se usa solo cuando se requieren aplicaciones específicas de Windows.
Red
En HPC, la red conecta el hardware informático, el almacenamiento requerido y el usuario. El hardware informático se conecta a través de redes que pueden manejar un gran ancho de banda de datos. Las redes también deben tener una baja latencia para permitir que las transferencias de datos sean más rápidas. Las transmisiones de datos y la administración de clústeres están manejadas por los gerentes del clúster, los servicios de administración y los programadores.
El gerente del clúster ejecuta la carga de trabajo entre los recursos informáticos distribuidos, como CPU, FPGA, GPU y discos. Todos los recursos deben estar conectados a la misma red para que el gerente del clúster administre los recursos. Cuando se usan servicios de un proveedor IaaS, todas las instalaciones que se requieran para administrar la infraestructura serán aplicadas por el proveedor.
Almacenamiento
Por último, los datos que serán procesados por HPC deben ser almacenados en un repositorio de datos grande. Debido a que los datos pueden tomar diferentes formas (estructurados, semiestructurados y no estructurados), es posible que se requieran diversos tipos de bases de datos para almacenar los datos.
Los datos en su formato sin procesar se almacenan dentro del data lake. Estos datos pueden ser difíciles de procesar debido a que no tienen aún un propósito asignado. Los almacenamientos de datos almacenan datos después de procesar, una vez limpios para adaptarse al propósito específico.
Almacenamiento: El enlace que falta en HPC
En varios casos de uso de HPC, por lo general se pasa por alto el almacenamiento, una parte crítica de la arquitectura. Se usa HPC cuando se debe procesar una vasta cantidad de datos en paralelo, además su rendimiento depende de si todos los componentes en su arquitectura pueden mantenerse actualizados unos con otros.
Es posible que las soluciones de almacenamiento heredadas tradicionales no puedan manejar las necesidades de HPC, lo que crea cuellos de botella en el proceso y posiblemente el rendimiento se vea obstaculizado. El almacenamiento de datos debe poder mantener la velocidad de la potencia de procesamiento de la configuración, razón por la que varias arquitecturas de HPC usan el almacenamiento rápido de objetos y archivos unificados (UFFO) .
Evergreen//One™ ofrece almacenamiento UFFO rápido y confiable con la conveniencia del modelo de pago por el tiempo de uso (PaYG). Se puede usar en modelos en las instalaciones y la nube híbrida, y es ideal para los entornos de HPC que requiere la habilidad de escalar operaciones sin comprometer el rendimiento.
Comience hoy con Evergreen//One. Los nuevos clientes obtienen los tres primeros meses de servicio gratis.