Comparando los algoritmos que detectan mutaciones del cáncer

18 Julio 2017

El trabajo publicado en Nature Methods evalua las herramientas utilizadas para detectar el genoma del cáncer

Eduard Porta Pardo, investigador sénior del departamento de ciencias de la vida en el Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) en colaboración con un equipo internacional de científicos, ha llevado a cabo el primer análisis comparativo de los algoritmos subgenéticos que explotan la información genética de las bases de datos del cáncer. Estas potentes herramientas de filtro de datos son útiles a la hora de reducir la complejidad del cáncer y encontrar mutaciones no identificadas previamente pero que son importantes en la formación de células cancerosas.

El estudio, publicado hoy en Nature Methods, revisa, clasifica y describe los puntos fuertes y débiles de más de 20 algoritmos desarrollados por grupos de investigación independientes. La evaluación de los métodos de análisis del genoma del cáncer es una actividad clave en la selección de las estrategias más adecuadas para inetgrar en la plataforma de medicina personalizada del BSC.

Aunque cada vez hay más secuencias genómicas disponibles, una creencia común es considerar un gen como una sola unidad. Sin embargo, hay una serie de eventos, como las sustituciones, duplicaciones y pérdidas de ADN que se pueden producir dentro de un gen; es decir, a nivel subgenético. Los algoritmos subgenéticos proporcionan una visión de alta resolución que puede explicar por qué diferentes mutaciones en el mismo gen pueden provocar fenotipos diferenciados en función de cómo la mutación afecta a regiones proteicas específicas. Un buen ejemplo de cómo las diferentes mutaciones subgenéticas influyen en el cáncer es el gen NOTCH1. Las mutaciones en ciertas regiones de NOTCH1 hacen que actúe como un supresor tumoral en los cánceres de pulmón, piel, cabeza y cuello. En cambio, las mutaciones en otra región pueden conducir a una leucemia linfocítica crónica y a una leucemia linfoblástica aguda de células T. Por lo tanto, es incorrecto suponer que las mutaciones en un gen tendrán las mismas consecuencias independientemente de su ubicación.

Los investigadores del estudio aplicaron cada algoritmo subgenético a los datos procedentes del Atlas del Genoma del Cáncer (TCGA), un conjunto de datos a gran escala que incluye información de genomas de 33 tipos de tumores diferentes procedentes de más de 11.000 pacientes. “Nuestro objetivo no era determinar qué algoritmo funcionaba mejor que otro, ya que esto dependerá de la pregunta que se formula”, dice Eduard Porta Pardo, primer autor del artículo. “En cambio, sí queremos informar a los posibles usuarios sobre cómo las diferentes hipótesis que hay tras cada algoritmo subgenético influyen en los resultados y cómo éstos difieren de los métodos que funcionan a nivel de gen entero”. Porta Pardo es un ex-investigador postdoctoral del Sanford Burnham Prebys Medical Discovery Institute (SBP), que recientemente se ha incorporado al departamento de ciencias de la vida del BSC, bajo la dirección de Alfonso Valencia, también coautor de este trabajo.

Los investigadores han logrado dos hallazgos importantes. En primer lugar, llegaron a la conclusión de que los algoritmos eran capaces de reproducir la lista de genes del cáncer conocidos, con lo que se valida el enfoque subgenético y el vínculo entre estos genes y el cáncer. En segundo lugar, descubrieron una serie de nuevos genes directores del cáncer, que están implicados en el proceso de oncogénesis y que no fueron detectados con los enfoques del gen entero.

Encontrar nuevos genes directores del cáncer es un objetivo relevante en el análisis del genoma del cáncer”, añade Porta Pardo. Este estudio tendría que ayudar a los investigadores a comprender las ventajas y los inconvenientes de los algoritmos subgenéticos utilizados para encontrar potenciales nuevas dianas de fármacos para el tratamiento del cáncer.

Aunque el Sanford Burnham Prebys Medical Discovery (SBP) ha liderado el proyecto, el artículo es el resultado del esfuerzo entre diferentes instituciones internacionales como la Harvard Medical School, el Barcelona Supercomputing Center, el Instituto de Investigación Biomédica de Barcelona (IRB), la Universidad Pompeu Fabra (UPF) y el Centro Nacional de Investigaciones Oncológicas (CNIO), entre otros.

Figura: Tres grupos de mutaciones de cáncer en la proteína PI3KCA identificados por diferentes algoritmos subgenéticos.

Trabajo de Referencia

Porta-Pardo E, Kamburov A, Tamborero D , Pons T, Grases D, Valencia A, López-Bigas N, Getz G and Godzik A (2017). Comparison of algorithms for the detection of cancer-drivers at sub-gene Resolution. Nature Methods. dx.doi.org/10.1038/nmeth.4364