La investigación del BSC acelera las cargas de trabajo de HPC con menos RAM, ahorrando energía

21 Julio 2020
La asignación inteligente de datos a la memoria persistente Intel Optane almacena más datos cerca de la CPU con menos RAM, que consume mucha energía.

El BSC junto a INTEL desarrolla un software para automatizar el proceso de distribución de datos en estos sistemas de forma eficiente.

El trabajo se realiza bajo el Intel-BSC Exascale Lab, y en colaboración con el proyecto EPEEC.
 

El Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC), en el marco del Intel-BSC Exascale Lab, y en colaboración con el proyecto EPEEC, liderado por BSC, está al frente del desarrollo de nuevas herramientas de software y expandiendo el ecosistema de software para procesadores Intel Xeon escalables de segunda generación e Intel Optane Memoria persistente (Intel® Optane PMem). Esta investigación está ayudando a acelerar las aplicaciones de computación de alto rendimiento (HPC) utilizando arquitecturas de memoria heterogéneas.

El investigador del BSC Antonio Peña está al cargo de esta investigación para explorar cómo acelerar grandes cargas de trabajo de HPC aprovechando sistemas de memoria heterogéneos. Con memorias Intel Optane PMem y procesadores escalables Intel Xeon de segunda generación, está impulsando arquitecturas innovadoras que permiten cargas de trabajo de alto rendimiento con grandes conjuntos de datos en clústeres HPC que usan menos energía en DRAM.

"En este momento, muchas aplicaciones de HPC están limitadas por la cantidad de DRAM en los nodos y el clúster", explica Peña. "Necesitan más memoria, pero agregar más con la tecnología actual no es factible debido a las limitaciones de energía en el sistema en general".

"Estamos tratando de reducir la potencia del servidor mientras aceleramos las aplicaciones mediante el uso de Intel Optane PMem y la gestión inteligente de la ubicación de los datos y sus movimientos", asegura Peña. “Podemos aprovechar los grandes tamaños de memoria que ofrece la nueva tecnología y acercar más datos al procesador utilizando considerablemente menos energía. Hay una latencia un poco más larga que la DRAM, pero no tenemos que pagar por la penalización de tener que ir a otras tecnologías de almacenamiento mucho más lentas".

Herramientas innovadoras de perfilado de datos y asignación de memoria para la gestión inteligente de datos

Para hacer posible su proyecto con memorias heterogéneas, Peña y su equipo han creado varias herramientas de software utilizando Extrae, un generador de perfiles de uso general desarrollado por el BSC, Intel vTuneTM profiler, y Extended Valgrind para perfil diferenciado de objetos (EVOP), entre otros. EVOP fue desarrollado por primera vez por Peña en ANL y ahora se mantiene en el BSC. Sus herramientas primero realizan lo que Peña llama perfiles orientados a datos ejecutando las herramientas de perfiles mientras la aplicación se ejecuta normalmente. Las herramientas analizan la demanda y las latencias para diferentes objetos y crean un archivo grande que enumera todos los accesos a datos.

"Saber cómo se accede a cada objeto de datos durante la ejecución nos ayuda a decidir en el paso de optimización dónde deben asignarse esos en las diferentes memorias", explica Peña. “En una vista simplificada, asociamos métricas con los diferentes objetos de datos. Luego contamos el número de accesos o el número de fallos de caché de último nivel para cada objeto. A partir de esto, podemos aplicar diferentes algoritmos para las asignaciones de memoria para maximizar el rendimiento ".

 

  • Pie de foto: Miembros del equipo de investigación del BSC manipulan una plataforma de memoria heterogénea del proyecto EPEEC

 

Case study

High Performance Computing (HPC)

2nd Generation Intel® Xeon® Scalable Processors

Intel® Optane™ Persistent Memory