Skip to Content

¿Qué es la computación de alto rendimiento?

La computación de alto rendimiento (HPC) es la capacidad de ejecutar la informática de forma sincronizada en un gran número de computadoras en red. HPC permite que se ejecuten procesos informáticos muy grandes para las computadoras comunes, lo que reduce el tiempo que lleva completar grandes operaciones. También se conoce el HPC como supercomputación, y las computadoras de alto rendimiento son conocidas como supercomputadoras.

HPC es especialmente importante por la velocidad sin precedentes a las que se generan los datos hoy. Solo con los dispositivos IoT se espera que se produzcan casi 80 zettabytes de datos para el 2025. Una fábrica con dispositivos IoT podría generar cientos de terabytes de datos cada día. No es posible procesar un volumen de datos tan grande en una sola computadora. Por otra parte, HPC puede manejar una gran cantidad de conjuntos de datos al dividir las operaciones entre varias computadoras con la ayuda del software y las funcionalidades de la red.

Analicemos por qué HPC es importante y de qué forma se usa.

¿Por qué es importante HPC?

HPC permite la simulación o el análisis de grandes volúmenes de datos que, de otra manera, sería imposible de realizar a través de computadoras estándar. Esto, a su vez, lleva a avances más importantes en campos como la investigación científica, donde el uso de HPC genera innovación en todo, desde tratamientos contra el cáncer a vacunas contra COVID-19. 

¿Cómo funciona HPC?

Una computadora única de alto rendimiento se conforma de un grupo de computadoras denominadas clúster. Cada computadora en un clúster se denomina nodo. Cada nodo tiene un sistema operativo que consta de un procesador con varios núcleos, funcionalidades de red y almacenamiento que permiten que los nodos se comuniquen entre ellos. Un pequeño clúster, por ejemplo, puede contar con 16 nodos y 64 núcleos, o cuatro núcleos por procesador, que combinados con funcionalidades de red permiten que la computadora de alto rendimiento calcule con mayor rapidez que una computadora normal. 

¿Dónde se usa HPC?

En la actualidad, se usa HPC en un amplio rango de industrias. En el futuro, es probable que la mayoría de las industrias se pasen a HPC para abordar grandes volúmenes de datos. La adopción de HPC ha sido particularmente robusta en industrias que deben analizar rápidamente grandes conjuntos de datos, entre ellos:  

  • Investigación científica
  • Astronomía
  • Aprendizaje automático
  • Seguridad cibernética
  • Secuenciación genómica 
  • Animación
  • Dinámica molecular
  • Efectos visuales
  • Servicios financieros
  • Modelado de riesgo financiero
  • Análisis de datos del mercado
  • Desarrollo del producto
  • Diseño en áreas nuevas
  • Química informática
  • Imagen sísmica
  • Previsión meteorológica
  • Conducción autónoma
Evergreen One

Reduzca los riesgos con Evergreen//One™

El tiempo de inactividad no es una opción. Puede contar con Pure y asegurarse de que siempre estará listo para cumplir con las demandas de capacidad.

Explore Evergreen//One

¿Qué factores posibilitan la HPC?

En particular, hay cuatro factores que impulsan el uso de la HPC:

Potencia de procesamiento

En palabras simples, el ancho de banda que se requiere para procesar grandes volúmenes de datos no puede ser proporcionado por un único procesador. En cambio, en un modelo HPC, varios centros de procesamiento funcionan en paralelo para ofrecer buenos resultados. Recuerde que en este modelo:

  • El grupo de computadoras individuales que se conectan en red de forma conjunta se denomina clúster.
  • Cada unidad de procesamiento individual en el clúster se denomina nodo.
  • Cada procesador en un nodo tendrá varios núcleos. 

Como ejemplo, un clúster con 16 nodos y cuatro núcleos cada uno es un clúster pequeño, que representa un total de 64 núcleos que funcionan en paralelo.

La mayoría de los casos de uso de HPC actuales incluyen miles de núcleos que funcionan en paralelo para completar los procesos designados en un periodo de tiempo más corto. Los proveedores de infraestructura como servicio (IaaS) ofrecen a los usuarios la posibilidad de aprovechar grande cantidades de nodos cuando se requiere y luego se desconecta la carga de trabajo cuando se completa el requerimiento. Los usuarios solo pagan por la potencia de procesamiento requerida, sin los costos de desembolso de capital (CAPEX) asociados con la construcción de la infraestructura. Con IaaS, los usuarios generalmente tienen la posibilidad de prescribir diseños de nodos para aplicaciones específicas, si se requiere.

Sistema operativo

Los sistemas operativos actúan como la interfaz entre el hardware y el software que se usa en HPC. Los dos sistemas operativos más importantes que se usan en los entornos HPC son Linux y Windows. Linux generalmente se usa para HPC, mientas que Windows se usa solo cuando se requieren aplicaciones específicas de Windows. 

Red

En HPC, la red conecta el hardware informático, el almacenamiento requerido y el usuario. El hardware informático se conecta a través de redes que pueden manejar un gran ancho de banda de datos. Las redes también deben tener una baja latencia para permitir que las transferencias de datos sean más rápidas. Las transmisiones de datos y la administración de clústeres están manejadas por los gerentes del clúster, los servicios de administración y los programadores. 

El gerente del clúster ejecuta la carga de trabajo entre los recursos informáticos distribuidos, como CPU, FPGA, GPU y discos. Todos los recursos deben estar conectados a la misma red para que el gerente del clúster administre los recursos. Cuando se usan servicios de un proveedor IaaS, todas las instalaciones que se requieran para administrar la infraestructura serán aplicadas por el proveedor.

Almacenamiento

Por último, los datos que serán procesados por HPC deben ser almacenados en un repositorio de datos grande. Debido a que los datos pueden tomar diferentes formas (estructurados, semiestructurados y no estructurados), es posible que se requieran diversos tipos de bases de datos para almacenar los datos.

Los datos en su formato sin procesar se almacenan dentro del data lake. Estos datos pueden ser difíciles de procesar debido a que no tienen aún un propósito asignado. Los almacenamientos de datos almacenan datos después de procesar, una vez limpios para adaptarse al propósito específico. 

Almacenamiento: El enlace que falta en HPC

En varios casos de uso de HPC, por lo general se pasa por alto el almacenamiento, una parte crítica de la arquitectura. Se usa HPC cuando se debe procesar una vasta cantidad de datos en paralelo, además su rendimiento depende de si todos los componentes en su arquitectura pueden mantenerse actualizados unos con otros. 

Es posible que las soluciones de almacenamiento heredadas tradicionales no puedan manejar las necesidades de HPC, lo que crea cuellos de botella en el proceso y posiblemente el rendimiento se vea obstaculizado. El almacenamiento de datos debe poder mantener la velocidad de la potencia de procesamiento de la configuración, razón por la que varias arquitecturas de HPC usan el almacenamiento rápido de objetos y archivos unificados (UFFO) .

Evergreen//One™ ofrece almacenamiento UFFO rápido y confiable con la conveniencia del modelo de pago por el tiempo de uso (PaYG). Se puede usar en modelos en las instalaciones y la nube híbrida, y es ideal para los entornos de HPC que requiere la habilidad de escalar operaciones sin comprometer el rendimiento.

Comience hoy con Evergreen//One. Los nuevos clientes obtienen los tres primeros meses de servicio gratis.

11/2024
Cengage Group: From Textbooks to Digital Learning Pioneer
Discover why Cengage turned to Evergreen//One to scale with the rising storage demands of the edtech industry.
Casos de estudio de clientes
3 páginas
CONTÁCTENOS
¿Preguntas, comentarios?

¿Tiene alguna pregunta o comentario sobre los productos o las certificaciones de Pure?  Estamos aquí para ayudar.

Programe una demostración

Programe una demostración en vivo y compruebe usted mismo cómo Pure puede ayudarlo a transformar sus datos en potentes resultados. 

Llámenos: 800-976-6494

Medios de comunicación: pr@purestorage.com

 

Pure Storage, Inc.

2555 Augustine Dr.

Santa Clara, CA 95054

800-379-7873 (información general)

info@purestorage.com

CERRAR
¡Su navegador ya no es compatible!

Los navegadores más antiguos a menudo representan riesgos de seguridad. Para brindar la mejor experiencia posible al utilizar nuestro sitio, actualice a cualquiera de estos navegadores más recientes.