Skip to Content

¿Qué es la computación de alto rendimiento?

La computación de alto rendimiento (HPC por sus siglas en inglés) es la capacidad de ejecutar cálculos de un modo sincronizado en un gran número de equipos conectados en red. La HPC permite ejecutar cálculos que son demasiado grandes para los ordenadores normales y reduce el tiempo necesario para completar operaciones grandes. La HPC también se conoce con el nombre de supercomputación y los ordenadores de alto rendimiento se conocen comúnmente con el nombre de superordenadores o supercomputadoras.

La computación de alto rendimiento es especialmente importante dada la velocidad sin precedentes a la que se generan los datos en la actualidad. Se espera que tan solo los dispositivos de la IdC producirán casi 80 zettabytes de datos en 2025. Una sola fábrica con dispositivos de IdC podría generar cientos de terabytes de datos cada día. Procesar estos volúmenes enormes de datos en un solo ordenador es una tarea imposible. La HPC, por otro lado, puede manejar conjuntos enormes de datos dividiendo las operaciones entre múltiples ordenadores con la ayuda de las capacidades del software y la red.

Veamos con más detalle por qué la computación de alto rendimiento es importante y cómo se usa.

¿Por qué es importante la HPC?

La computación de alto rendimiento permite la simulación y el análisis de enormes volúmenes de datos, que de otro modo serían imposibles de realizar con unos equipos normales. Esto, a su vez, genera grandes avances en campos como la investigación científica, donde la HPC ha permitido progresos revolucionarios en distintos ámbitos, desde el tratamiento del cáncer hasta las vacunas de la COVID-19. 

¿Cómo funciona la HPC?

Un solo ordenador de alto rendimiento está formado por un grupo de ordenadores llamado clúster. Cada ordenador de un clúster se denomina nodo. Cada nodo tiene un sistema operativo formado por un procesador con múltiples núcleos y unas capacidades de almacenamiento y de trabajo en red que permiten que los nodos se comuniquen entre sí. Un pequeño clúster, por ejemplo, puede tener 16 nodos con 64 núcleos, o cuatro núcleos por procesador, que combinados con la capacidad de trabajar en red permiten que el ordenador de alto rendimiento realice los cálculos mucho más rápidamente que un equipo normal. 

¿Dónde se utiliza la HPC?

Actualmente, la HPC se utiliza en una gran variedad de sectores. En el futuro, es probable que casi todos los sectores recurran a la computación de alto rendimiento para tratar grandes volúmenes de datos. La adopción de la HPC ha sido especialmente intensa en los sectores que necesitan analizar rápidamente grandes conjuntos de datos, como por ejemplo:  

  • La investigación científica
  • La astronomía
  • El aprendizaje automático
  • La ciberseguridad
  • La secuenciación genómica 
  • La animación
  • La dinámica molecular
  • Los efectos visuales
  • Los servicios financieros
  • La modelización de riesgos financieros
  • Los análisis de datos de mercado
  • El desarrollo de productos
  • El diseño Greenfield
  • La química computacional
  • La tomografía sísmica
  • La previsión meteorológica
  • La conducción autónoma
Evergreen One

Reduzca el riesgo con Evergreen//One™

El tiempo de inactividad no es una opción Con Pure se asegura que siempre estará preparado para satisfacer las demandas de capacidad.

Explore Evergreen//One

¿Qué factores hacen que la HPC sea posible?

En concreto, hay cuatro factores que impulsan el uso de la computación de alto rendimiento:

La potencia de procesamiento

Por decirlo de un modo sencillo, el ancho de banda necesario para procesar volúmenes enormes de datos no puede ser proporcionado por un solo procesador. En lugar de ello, en un modelo de HPC, múltiples centros de procesamiento trabajan en paralelo para proporcionar los resultados. No olvide que en este modelo:

  • El grupo de ordenadores individuales que están conectados en red se conoce con el nombre de clúster.
  • Cada unidad de procesamiento individual del clúster se llama nodo.
  • Cada procesador de un nodo tiene múltiples núcleos. 

Por ejemplo, un clúster de 16 nodos con cuatro núcleos cada uno es un clúster muy pequeño y ello representa un total de 64 núcleos operando en paralelo.

La mayoría de casos de uso actuales de la HPC incluyen miles de núcleos trabajando en paralelo para completar los procesos designados en menos tiempo. Los proveedores de infraestructura como servicio (IaaS) ofrecen a los usuarios la capacidad de utilizar grandes cantidades de nodos cuando es necesario, para luego reducir la carga de trabajo cuando se acaba dicha necesidad. Los usuarios solo pagan por la potencia de procesamiento que necesitan, sin los costes CAPEX (gastos de capital) derivados de la creación de la infraestructura. Con la IaaS, los usuarios también suelen poder indicar la disposición de los nodos para las aplicaciones específicas, si es necesario.

El sistema operativo

Los sistemas operativos actúan como interfaz entre el hardware y el software que se utilizan en la HPC. Los dos sistemas operativos más importantes usados en la computación de alto rendimiento son Linux y Windows. Por lo general, en la HPC se utiliza Linux, mientras que Windows se utiliza solo cuando se necesitan aplicaciones específicas de Windows. 

La red

En la computación de alto rendimiento, la red conecta el hardware de computación, el almacenamiento necesario y al usuario. El hardware de computación se conecta mediante redes que pueden soportar un gran ancho de banda de datos. Las redes también deben tener una baja latencia para facilitar una transferencia más rápida de los datos. Las transmisiones de datos y la gestión de los clústeres son gestionadas por administradores de clúster, servicios de administración o planificadores. 

El administrador de clúster ejecuta la carga de trabajo repartiéndola entre recursos computacionales distribuidos, como CPU, FPGA, GPU y unidades de disco. Todos los recursos deben estar conectados a la misma red para que el administrador de clúster los pueda gestionar. Cuando se usan los servicios de un proveedor de IaaS, todas las instalaciones necesarias para administrar la infraestructura son implementadas automáticamente por el proveedor.

El almacenamiento

Por último, los datos que la HPC tiene que procesar deben almacenarse en un gran repositorio de datos. Dado que los datos pueden adoptar diversas formas —pueden ser estructurados, semiestructurados y no estructurados—, es posible que se necesiten diferentes tipos de bases de datos para almacenarlos.

Los datos en su(s) formato(s) en bruto se almacenan en un lago de datos. Estos datos pueden ser difíciles de procesar, porque todavía no se les ha asignado una finalidad. Los almacenes de datos almacenan los datos después de su procesamiento, una vez que se han limpiado para ajustarlos a su finalidad específica. 

Almacenamiento: el eslabón perdido de la HPC

En muchos casos de uso de la computación de alto rendimiento, el almacenamiento —una parte fundamental de la arquitectura— se suele pasar por alto. La HPC se utiliza cuando hay que procesar en paralelo una cantidad enorme de datos, sin embargo, su rendimiento depende de que todos los componentes de su arquitectura puedan seguir el ritmo de los otros componentes. 

Las soluciones de almacenamiento tradicionales es posible que no puedan soportar las necesidades de la HPC y que acaben creando cuellos de botella y obstaculizando el rendimiento. El almacenamiento de datos debe poder seguir la velocidad de la potencia de procesamiento de la configuración, por esta razón, muchas arquitecturas de HPC recurren al almacenamiento  de archivos y objetos rápido y unificado (UFFO) .

Evergreen//One™ ofrece un almacenamiento UFFO rápido y fiable, con la comodidad del modelo de pago por uso. Puede usarse en los modelos on-premises y de nube híbrida y es ideal para los entornos de HPC, que requieren la capacidad de escalar las operaciones sin comprometer el rendimiento.

Empiece a usar Evergreen//One hoy mismo.  Los tres primeros meses de servicio son gratis para los nuevos clientes.

11/2024
Delivering a Flexible Path to Speed and AI Innovation
The Pure Storage platform helps EGP ensure that its AI-ready infrastructure is always available for customers.
Estudios de Casos de Clientes
3 páginas
CONTACTAR CON NOSOTROS
¿Preguntas, comentarios?

¿Tiene alguna pregunta o comentario sobre los productos o las certificaciones de Pure?  Estamos aquí para ayudarle.

Programe una Demostración

Programe una demostración en vivo y vea personalmente cómo Pure puede ayudarle a convertir sus datos en unos resultados potentes. 

Llámenos al: +34 51 889 8963

Medios de comunicaciónpr@purestorage.com

 

Castellana 81

28046 Madrid

Oficinas Pure: 1415 y 1417 (planta 14)

info@purestorage.com

CERRAR
Your Browser Is No Longer Supported!

Older browsers often represent security risks. In order to deliver the best possible experience when using our site, please update to any of these latest browsers.