La inteligencia artificial permite la identificación de nuevos genes relacionados con el cáncer

19 Febrero 2019

El método, publicado en Nature Communications, ha sido biológicamente probado en líneas celulares de cáncer de mama, próstata, pulmón y colon, y en análisis retrospectivos de supervivencia de miles de pacientes.

Se han señalado 63 genes y la experimentación ha confirmado que 36 de ellos contribuyen al crecimiento celular irregular.

El método computacional recrea las interacciones biológicas que tienen lugar en nuestras células.

La investigadora del Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC) Nataša Pržulj ha liderado la creación de un nuevo método computacional basado en inteligencia artificial que acelera la identificación de nuevos genes relacionados con el cáncer. El método y sus resultados, que se han probado biológicamente, se han publicado en Nature Communications.

La Prof. Pržulj utiliza técnicas de aprendizaje automático (machine learning) para relacionar grandes cantidades de datos ómicos y los recrea en un prototipo computacional, Integrated Cell (célula integrada) o iCell. Específicamente, fusiona tres redes de interacción molecular específicas de tejido: interacción proteína-proteína, coexpresión de genes y redes de interacción genética. La técnica mediante la cual se realiza esta fusión es la Tri-Factorización de Matrices No Negativa, una técnica de machine learning propuesta originalmente para la agrupación y la reducción de la dimensionalidad que se ha utilizado recientemente para la integración de datos.

Los autores del artículo de Nature Communications han aplicado este método para reconstruir células de cuatro de los tipos más comunes de cáncer (mama, próstata, pulmón y colon) y en todos ellos, ha demostrado ser útil para localizar nuevos genes relacionados con estas enfermedades. El método ha señalado 63 genes y un proceso de validación biológica ha confirmado que al menos 36 de ellos contribuyen al crecimiento irregular de las células. La validación se ha llevado a cabo mediante experimentos de desactivación de genes seguidos de pruebas de viabilidad celular y análisis de datos de supervivencia del paciente.

La experimentación reveló, por ejemplo, que los pacientes con cáncer de mama con alta expresión de MRPL3, una proteína ribosomal mitocondrial que no estaba relacionada con el cáncer previamente, tienen una menor supervivencia. Este es un ejemplo de cómo se puede usar el nuevo método para descubrir nuevos genes biomarcadores, que pueden ser relevantes en la estratificación y predicción de la supervivencia en pacientes con cáncer.

Nataša Pržulj es profesora ICREA y se acaba de incorporar al BSC como líder del grupo de Biología Computacional Integrativa de Redes.

Alfonso Valencia, profesor ICREA y director del Departamento de Ciencias de la Vida del BSC, afirma que "las iCells de Nataša complementan a la perfección nuestras propuestas de análisis del genoma del cáncer en el BSC, y es solo el primero de los muchos métodos computacionales sólidos que esperamos ver desarrollados por su nuevo grupo en los próximos años ".

La Prof. Pržulj destaca que este nuevo método para analizar células "permite la identificación de genes alterados en el cáncer que no aparecen como alterados en ningún otro tipo de datos. Este descubrimiento pone de manifiesto la importancia de los enfoques integrativos para analizar datos biológicos y allana el camino hacia análisis integrativos comparativos de todas las células”.

Las posibles aplicaciones de este método van desde el tratamiento de otras enfermedades hasta el envejecimiento, con el objetivo final de descubrir los principios intrínsecos de la organización interna de la vida en la Tierra.

Artículo: Towards data-integrated cell - DOI: 10.1038/s41467-019-08797-8