El BSC utiliza la bioinformática, la inteligencia artificial y la capacidad de cálculo del superordenador MareNostrum en la lucha contra el coronavirus

27 Marzo 2020
Última actualización el 8 de mayo/El BSC investiga sobre el genoma del virus y participa en la búsqueda de vacunas y fármacos para combatirlo.

Almacena y analiza datos clínicos de pacientes de COVID-19 para la creación de herramientas que asistan a los clínicos en el diagnóstico y tratamiento de la enfermedad

Utiliza la inteligencia artificial, el procesamiento de lenguaje natural y técnicas de big data para analizar la propagación y el impacto social de la epidemia.
 

El supercomputador MareNostrum 4 está a disposición de la comunidad científica para la lucha contra el coronavirus.

 

El Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC) colabora en la lucha contra el coronavirus desde diferentes vertientes: la aplicación de la bioinformática para la investigación sobre el virus y sus posibles tratamientos, el uso de la inteligencia artificial y el procesamiento del lenguaje natural y técnicas de big data para analizar datos sobre la propagación y el impacto de la epidemia y el uso del superordenador MareNostrum 4 para combatir el coronavirus.

Bioinformática para buscar tratamientos

Desde la vertiente de la bioinformática, el BSC es un ejemplo de cómo la bioinformática y los superordenadores son hoy en día una herramienta indispensable de los centros de investigación que cuentan con laboratorios experimentales para acelerar el combate del coronavirus. La bioinformática se utiliza para la investigación sobre el virus y sus posibles tratamientos, analizando el genoma del coronavirus y sus sucesivas mutaciones, y para la búsqueda de fármacos y terapias inmunitarias (anticuerpos y vacunas).

Genómica

Comprender cómo ha evolucionado el virus a lo largo de distintas epidemias (como la epidemia SARS en 2003, MERS en 2012, o la actual Covid-19) es importante porqué nos permite intentar entender cómo es posible que el virus pase de una especie a otra y qué cambios tiene que experimentar para llegar a hacerlo. Nos da luz sobre su modo de transmisión y los mecanismos que utiliza para interactuar con nuestro sistema de defensas o el de otras especies animales. Esta resulta crucial a la hora de buscar tratamientos y para la prevención y predicción de brotes futuros.

Este tipo de estudio se realiza sobre información disponible en bases de datos públicas que albergan secuencias genómicas de las diferentes mutaciones del virus y de diferentes especies animales. La información se analiza con programas informáticos diseñados expresamente para ello, algunos desarrollados en el propio BSC y otros por otros equipos. El proceso de estos datos requiere gran capacidad de cálculo y por ello se utilizan los recursos de computación de altas prestaciones del superordenador MareNostrum 4, del Barcelona Supercomputing Center.

Búsqueda de tratamientos

Otro frente de la investigación es la búsqueda de tratamientos contra las enfermedades causadas por coronavirus a partir de simulaciones informáticas que reproducen “in silico” las posibles vías por la que se puede atacar el virus.

Este proceso se conoce en el mundo de la investigación como “docking” o acoplamiento y consiste en simular en el ordenador las interacciones entre el virus y moléculas que podrían servir para fabricar vacunas, tratamientos con anticuerpos o tratamientos con fármacos.

Para ello, se utiliza como base el conocimiento generado en la investigación del genoma del virus, información sobre las estructuras de sus proteínas del virus y datos sobre fármacos y otras moléculas inorgánicas, que están almacenadas en librerías informáticas en las que se pueden encontrar millones de compuestos químicos, generados durante años y anotados con los resultados obtenidos en experimentos anteriores.

La búsqueda o cribado de fármacos por ordenador es muy útil para acelerar el proceso de encontrar y validar tratamientos y vacunas para enfermedades, puesto que recorta en gran medida el tiempo y la inversión necesarios para la primera fase de esta investigación. Cualquier tratamiento o vacuna que los modelos informáticos predicen que puede tener éxito, posteriormente tiene que ser validada en laboratorios experimentales, en experimentación con animales y en investigaciones clínicas, y refinada en constante colaboración entre los diferentes participantes de la investigación.

Para realizar este trabajo, los investigadores del BSC utilizan diferentes programas informáticos entre ellos PELE, un método desarrollado en el centro, que es uno de los sistemas más competitivos del mercado en este sector. Este software y la potencia del superodenador MareNostrum 4 permiten realizar miles de experimentos computacionales optimizando la unión de fármacos y proteínas de una manera rápida y efectiva.

En el BSC, la investigación sobre el virus y sus posibles tratamientos se desarrolla en estrecha colaboración entre los grupos de Alfonso Valencia, investigador ICREA, director del Departamento de Ciencias de la Vida del BSC y líder del grupo de biología computacional, Víctor Guallar, también investigador ICREA y responsable del equipo de Modelado electrónico y atómico de proteínas y máximo impulsor del software PELE y Toni Gabaldón, investigador ICREA y responsable del grupo de genómica comparada. Todos ellos trabajan en cooperación con el equipo de sistemas del BSC, que les garantiza los recursos computacionales necesarios.

Actualmente tres son los proyectos que canalizan la investigación que se lleva a cabo en el centro sobre el coronavirus y sus posibles tratamientos: EXSCALATE4CoV (E4C), financiado por la Comisión Europea en el marco del programa H2020, un proyecto de colaboración con los centros de investigación IrsiCaixa y CreSa-IRTA con apoyo de Grifols y un proyecto en colaboración con el Instituto de Química Avanzada de Catalunya (IQA) y Nostrum Biodiscovery (NBD), financiado por el fondo COVID-19 del Instituto de Salud Carlos III.

E4C pone más énfasis en la investigación básica y aplicada para la búsqueda de fármacos. La colaboración con IrsiCaixa y CreSa está más centrada en la búsqueda de terapias inmunológicas apoyada en la investigación genómica y las herramientas bioinformáticas y el proyecto con IQA y NBD se centra en la búsqueda de antiretrovirales.

Investigadores del Departamento de Ciencias de la Vida participan en el mapa de enfermedades COVID-19, una plataforma para reunir y ordenar la información científica sobre el virus. Se trata de un esfuerzo de investigadores de 25 países para reunir y organizar el conocimiento generado hasta el momento sobre el mapa molecular de virus y los mecanismos de interacción entre el virus SARS-CoV-2 y el huésped, guiado por aportes de expertos en el dominio y basados en trabajos publicados. Su objetivo es organizar la información disponible para facilitar una mejor comprensión de la enfermedad y ayudar en el desarrollo de diagnósticos y terapias eficientes.

El repositorio se ha dado a conocer a través de la web de la revista Nature y es una colaboración de investigadores clínicos, científicos expertos en ciencias de la vida, biólogos computacionales y científicos de datos, fundamental para poder simular en ordenadores el comportamiento del virus a nivel molecular y contribuir así a la búsqueda de vacunas y tratamientos.

Almacenaje y análisis de datos clínicos de pacientes de COVID-19 para la creación de herramientas que asistan a los clínicos en el diagnóstico y tratamiento de la enfermedad

La evolución de la pandemia está generando la producción de abundante material clínico procedente de la asistencia sanitaria a enfermos de COVID-19. El correcto almacenaje y análisis de estos datos hará posible generar conocimiento que puede ser de gran ayuda para la comprensión de la enfermedad y la actividad de los profesionales de la asistencia sanitaria.

El BSC colabora con hospitales, centros de salud y especialidades médicas en la recogida, almacenaje y ordenación de estos datos (fundamentalmente imágenes e historias clínicas) y en la creación de herramientas para buscar patrones que puedan ser útiles a la hora de realizar diagnósticos y asistir a los clínicos en las decisiones sobre tratamientos.

  • Participación en la plataforma común de datos sobre COVID-19 impulsada por la Unión Europea para asegurar una respuesta rápida y coordinada a la crisis sanitaria provocada por la COVID-19. La plataforma común de datos pretende agregar y compartir todos los datos generados en investigación frente al coronavirus para acelerar en el desarrollo de soluciones frente al virus y la enfermedad. Se incluirán datos ómicos (los provenientes de disciplinas como la genómica, la proteómica, la metabolómica), datos de secuenciación, clínicos y epidemiológicos. La colaboración española en este proyecto se realiza a través del Instituto de Salud Carlos III (ISCIII) y el Instituto Nacional de Bioinformática (INB), liderado por el BSC. Esta plataforma es una de las iniciativas impulsadas en el marco del plan de acción ‘ERAvsCORONA’ lanzado por la Comisión Europea para apoyar la investigación, coordinar esfuerzos y buscar sinergias en el ámbito de la investigación e innovación.
  • Alojamiento y análisis de tomografías pulmonares de pacientes de COVID-19 de la plataforma europea de inteligencia artificial IA4EU. Esta actuación forma parte del proyecto REACT, que tiene como objetivo poner a disposición de la comunidad europea de inteligencia artificial un mínimo de 40.000 TACS (compuestos de 5.000 imágenes cada uno) para impulsar la creación de algoritmos de inteligencia artificial que asistan a los clínicos a la hora de diagnosticar si un paciente está afectado por la COVID-19, de determinar la severidad del caso y predecir su evolución. El proyecto se realiza en colaboración con asociaciones de profesionales de radiología y el BSC ejercerá la coordinación técnica de las diferentes soluciones propuestas.
  • El grupo de High performance computational mechanics está utilizando su simulador del corazón Alya Red para estudiar los posibles efectos de tratamientos utilizados contra la COVID-19 en el sistema cardiovascular. Concretamente, se está estudiando a) el efecto de los fármacos antipalúdicos en varios corazones humanos con una variedad de comorbilidades que pueden estar presentes en la población infectada y b) la hemodinámica compleja asociada con el síndrome norte-sur, en relación con la terapia de oxigenación de membrana extracorpórea venoso-arterial en pacientes con insuficiencia respiratoria profunda. Las investigaciones se llevan a cabo en colaboración con la spin-off del BSC Elem Biotech.

Inteligencia artificial para analizar la propagación y el impacto social de la epidemia

  • El grupo de Data pre and post processing del BSC, el Hospital Clínic y el centro de Investigación en Economía y Salud de la UPF están desarrollando modelos predictivos de ocupación de camas en centros sanitarios. Los modelos están basados en machine learning y ofrecen predicciones de ocupación a una semana vista, tanto de las camas hospitalarias como centros relacionados (ej, instalaciones extraordinarias para hacer frente a la COVID-19). El objetivo de esta herramienta es planificar la logística sanitaria, tanto en fases agudas de la pandemia como en el retorno a los hospitales de pacientes afectados por otras enfermedades. Actualmente los están utilizando el Hospital Clínic, el Hospital Sant Joan de Déu, el Hospital de Bellvitge, el Hospital de Olot y el Área de Salud Integrada del Baix Empordà.
  • El departamento de Ciencias de la Tierra está realizando estudios sobre cómo las medidas de confinamiento han afectado la calidad del aire en España. Los estudios se realizan siguiendo diferentes metodologías, entre ellas modelos basados en machine learning muestran la relación real que existe entre la reducción de las emisiones y la mejora de la calidad del aire, a base de tener en cuenta los eventuales efectos que la meteorología podría haber tenido en este último parámetro.
  • El grupo de investigación Inteligencia Artificial de Altas Prestaciones (HPAI) del BSC colabora con UNICEF en un proyecto que pretende analizar el impacto socio-económico del virus de manera local y global, haciendo hincapié en el distanciamiento social. El objetivo es encontrar indicadores, patrones y estadísticas de impacto que sirvan a la ONU y a los responsables locales para tomar mejores mediciones y más rápidas.
  • El mismo equipo de expertos en inteligencia artificial del BSC colabora con investigadores mexicanos y otros investigadores del centro en la creación de un sistema de recogida y análisis de datos, para ayudar en la toma de decisiones para hacer frente al COVID-19. El proyecto se lleva a cabo en colaboración con las ciudades México DF, Nuevo León y Jalisco: http://dash.covid19.geoint.mx/
  • El servicio de apoyo al usuario del BSC ha asistido al Gobierno de España y a la Generalitat en el cribado de contratos públicos de compra para localizar material sanitario (especialmente respiradores) adquiridos por centros que no se dedican a la atención sanitaria y que puedan ser susceptibles de ser trasladados centros de salud. En total se han cribado más de 850.000 documentos con tecnologías de big data y el servicio sigue abierto.
  • El grupo de Social Link Analytics coordina una iniciativa para realizar un análisis de los tweets emitidos en España relacionados con la COVID-19. Se realiza un seguimiento diario de la evolución del sentimiento de la ciudadanía en relación con la evolución de la pandemia.
  • Investigadores del grupo de Social Link Analytics colaboran en un proyecto que investiga las dinámicas de difusión en redes sociales de noticias falsas sobre salud en España. El objetivo es comprender los mecanismos de su difusión, con el fin de desarrollar y divulgar pautas que sirvan para contrarrestar ese fenómeno. El estudio está liderado por la Universidad de Navarra y ha sido seleccionado para obtener financiación del programa de Programa de Ayudas a Equipos de Investigación Científica 2019 la Fundación BBVA
  • Investigadores del departamento de Aplicaciones para la Ciencia y la Ingeniería han colaborado con la adaptación del simulador de enfermedades infecciosas Epigraph', a las características del COVID-19 para simular la propagación de la actual pandemia en España. El simulador fue desarrollado en la Universidad Carlos III de Madrid por el profesor David Singh y la investigadora Cristina Marinescu, actual investigadora del equipo de Smart Cities del BSC. Ambos han realizado su actualización al COVID-19, con la supervisión del Centro Nacional de Epidemiología (CNE) y el Consorcio Centro de Investigación Biomédica en Red (CIBER).

MareNostrum 4 y apoyo a los usuarios del superordenador

El superordenador MareNostrum 4, que pese a las circunstancias actuales sigue en plena actividad, aporta la capacidad de cálculo necesaria para acelerar las investigaciones en marcha contra el coronavirus.

El BSC lo utiliza para sus investigaciones, pero también está a disposición de equipos de investigación o entidades externas que necesiten computación de altas prestaciones para sus investigaciones contra el coronavirus, ya sea por la vía de la asignación de recursos reservados al BSC o por la vía de las convocatorias a investigadores que se realizan a través de la Red Española de Supercomputación (RES) o la red europea PRACE.

PRACE ha abierto una convocatoria extraordinaria para las investigaciones en COVID-19 y la RES ha reservado un 50% de los recursos de su nueva convocatoria (lo que incluye un 20% del superordenador MareNostrum 4) para investigaciones relacionadas con la pandemia.

El Departamento de Operaciones del BSC proporciona apoyo en el uso del Marenostrum 4, tanto a investigadores internos como externos.

Algunos de los proyectos externos a los que el BSC da apoyo de infraestructura y servicio al usuario son:

  • Alojamiento de un set de datos de imágenes médicas de Rx de tórax para colaborar en el desarrollo de herramientas de inteligencia artificial de código abierto que ayude a la detección precoz de infección y neumonía por COVID-19. El set de datos ha sido elaborado por la Unidad de Bioinformática y Estadística del Centro de Investigación Príncipe Felipe con datos procedentes de diferentes hospitales afiliados al Banco de Imágenes Médicas de la Comunidad Valenciana.
  • Simulaciones de dinámica molecular y diseño de secuencias para la optimización de anticuerpos contra el SARS-COV-2. Colaboración entre investigadores del Departamento de Físico-química de la Universidad de Barcelona en Centro Nacional de Biotecnología y la Universidad de Edimburgo.
  • El grupo del catedrático de química física de la Universidad de Valencia, Iñaki Tuñón, utiliza el superordenador MareNostrum 4 para simular la reactividad química de la proteasa del SARS-COV-2 y obtener información que ayude al diseño de fármacos que sirvan para inhibirla y, por tanto, impedir que el virus se replique.
    Tuñón utilizará 12.000 procesadores (un 7,3 % de la capacidad del MareNostrum) durante dos meses y medio para realizar tandas de diez simulaciones a la vez. En total utilizará 23,3 millones de horas de procesador para realizar unas 400 simulaciones.

    El investigador de la UV ha obtenido acceso MareNostrum 4 en la convocatoria PRACE COVID-19 fast, un procedimiento extraordinario por el que se han puesto a disposición de las investigaciones sobre la COVID-19 los supercomputadores públicos más potentes de Europa, que están incluidos en la infraestructura europea PRACE.