L’investigador Josep Lluís Berral crea un curs on-line sobre intel·ligència artificial i machine learning en entorns de supercomputació

13 Març 2020

La intel·ligència artificial (IA), l'anàlisi de dades i l'aprenentatge automàtic són àrees de les ciències de la computació que estan presents en molts camps de la investigació i en la supercomputació. Amb l'objectiu d'apropar l'ús de la IA tant a estudiants d'informàtica com a professionals i investigadors de tots els àmbits que treballin amb algoritmes d'anàlisi i predicció de dades, el Barcelona Supercomputing Center (BSC) ha dissenyat un curs online sobre IA en entorns de computació d'altes prestacions. El curs consta de vídeo-tutorials, una breu part teòrica i introducció als conceptes de DataCenters, machine learning, així com exercicis i exemples fent servir plataformes com Apache Spark i Intel BigDL.

En aquesta iniciativa, Josep Lluís Berral, creador de el curs i investigador del grup Data centric computing, introdueix els conceptes bàsics de paral·lelisme, rendiment i virtualització, així com machine learning, orientats tant a estudiants i investigadors iniciats en aquests camps com a aquells que els descobreixen per primera vegada.

El curs es divideix en tres parts fonamentals: rendiment en centres de processament de dades, machine learning i tecnologies de processament de dades distribuïts. Cada part disposa de vídeo-tutorials, que inclouen també una part teòrica i exemples pràctics, acompanyat d'una presentació i alguns exercicis. En els dos primers capítols, els tutorials presenten els fonaments teòrics per a la supercomputació i la intel·ligència artificial. En el tercer capítol s'introdueixen les plataformes Spark i BigDL per al processat de dades i deep learning, juntament amb casos pràctics. En total, Berral, amb l'ajuda de l'investigador Francisco Javier Jurado, han preparat més de cinc hores de vídeo-tutorials, al voltant d'aquests tres capítols, juntament amb els corresponents exercicis i exemples de codi, i addicionalment scripts per desplegar fàcilment els entorns de programari usats en el curs.

"Hem preparat aquest curs pensant en investigadors com els del BSC i en grups de recerca associats que, procedint de camps diversos com les matemàtiques, la biologia, la genòmica o les ciències de la Terra, tenen la necessitat d'utilitzar supercomputadors per processar grans quantitats d'experiments, però mai no han tingut l’ocasió d’emprar mètodes com aquests que poden ajudar-los en el seu treball diari", comenta Josep Lluís Berral.

Berral va rebre el 2019 el patrocini del departament de Relació amb Universitats d'Intel Corp, dins de la Iniciativa d'Educació en IA, per desenvolupar el curs i publicar-lo en obert.

Les tecnologies escollides en aquest curs on-line van des de coneguts llenguatges d’script com Python, eines de virtualització com VirtualBox, el framework de processament de dades distribuïdes Apache Spark, fins a les llibreries de deep learning distribuït Intel BigDL. Es preveu que els continguts i les tecnologies proposades s'actualitzin periòdicament, a mesura que la tecnologia evolucioni i els usuaris enviïn el seu feedback.