El BSC aporta su experiencia en IA al primer repositorio compartido de datos e imágenes de cáncer

04 Julio 2022

El proyecto INCISIVE lanza el primer prototipo de repositorio interoperable con datos de cáncer, que integra miles de imágenes clínicas de cáncer de mama, pulmón, próstata y colorrectal de más de 7.000 pacientes sin identificar que permitirá a los hospitales compartir datos sanitarios con la comunidad científica.

El proyecto INCISIVE, con participación del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC-CNS), ha alcanzado su primer gran hito tras 18 meses de trabajo al lanzar el primer prototipo de repositorio de datos interoperable federado con miles de imágenes clínicas de cáncer de mama, pulmón, próstata y colorrectal. El repositorio permite que los hospitales compartan datos sanitarios, de forma segura y conforme a la normativa europea de protección de datos, con la comunidad científica que trabaja en la formación y experimentación relacionada con la Inteligencia Artificial (IA).

El grupo de investigación Data-Centric Computing del BSC ha diseñado la arquitectura de IA federada, encargada de aportar la distribución del entrenamiento de la IA, así como mecanismos de datos que coordinan los repositorios de datos federados y las herramientas de IA mediante sistemas de Modelo-como-Servicio. El prototipo incorpora la coordinación de las herramientas de IA Federada y flujo de datos, permitiendo a los investigadores y usuarios crear y compartir modelos, evitando el acceso a datos sensibles desde los proveedores de datos.

El primer prototipo integra todos los datos clínicos y de imagen del cáncer de 3 de los 9 proveedores del proyecto. Para hacerlo posible, el consorcio ha recogido en un almacén central temporal un total de 2,5 millones de imágenes de cáncer de más de 7.000 pacientes desidentificados de todos los socios clínicos que participan en el proyecto. Los datos recogidos están listos para ser integrados en el repositorio de datos federado tan pronto como los 6 proveedores de datos restantes completen la configuración de sus nodos de datos.

La coordinadora del proyecto, Gianna Tsakou, y responsable de proyectos de MAGGIOLI SpA – Research & Innovation Lab en Atenas, destaca los retos a los que se ha enfrentado el consorcio para lograr este hito: “uno de los mayores retos que hemos abordado con éxito ha sido la puesta en marcha de todos los acuerdos necesarios y el trabajo técnico para garantizar que la compartición masiva de datos retrospectivos cumpla con los requisitos legales y éticos en los 5 países europeos y en los 9 proveedores de datos en los que se han previsto nodos de datos”. Otras tareas complejas han sido la recopilación, preparación y desidentificación de datos, el establecimiento de un acuerdo común de los servicios de IA que prestará el proyecto, el diseño de la plataforma y la puesta en marcha de una versión operativa del enfoque federado en términos de almacenamiento de datos y aprendizaje federado.

Avanzando hacia la caja de herramientas de IA

El primer prototipo de INCISIVE ya incluye algunas de las funcionalidades que se esperan para la caja de herramientas de IA (Toolbox), cuyo objetivo es proporcionar apoyo en la toma de decisiones a los profesionales médicos en relación con el diagnóstico y el tratamiento del cáncer. Los socios de INCISIVE ya han empezado a trabajar en casi todos los modelos de IA previstos en el proyecto, incorporando los más avanzados en esta primera fase, que son los modelos de clasificación de la densidad mamaria y de segmentación de imágenes pulmonares para varias modalidades de imagen.

La caja de herramientas de IA de este primer modelo también incluye los enfoques iniciales sobre la explicabilidad de la IA, los conductos de análisis de datos que permitirán la prestación de los servicios de IA previstos, así como el trabajo inicial sobre la interfaz de usuario de los servicios de IA para que los profesionales médicos puedan ver y leer de forma exhaustiva los resultados de la forma más intuitiva y transparente posible.

Casos de uso

El primer prototipo abarca los principales casos de uso y funcionalidades de la plataforma previstos en el proyecto para los usuarios potenciales de la plataforma INCISIVE.

En primer lugar, para los proveedores de datos, da soporte a la preparación de los datos, incluyendo la desidentificación, la anotación y la comprobación de la calidad antes de compartirlos en el repositorio INCISIVE. En segundo lugar, para los investigadores de IA que buscan datos de entrenamiento o validación para sus modelos, el primer prototipo facilita la búsqueda y consulta de los datos en los nodos federados, permitiendo la creación de un espacio de trabajo y el entrenamiento de sus algoritmos utilizando el aprendizaje federado. Por último, para los profesionales de la medicina, admite la prestación de servicios de inferencia habilitados por la IA siguiendo un models-as-a-service approach, en el que los profesionales de la medicina sólo deben proporcionar la imagen al sistema y luego obtener los resultados de inferencia habilitados por la IA con un solo clic.

Próximos pasos

El consorcio INCISIVE ha empezado a trabajar en el segundo prototipo, que integrará a los seis proveedores de datos restantes en el almacenamiento federado y permitirá que sus datos sean interoperables y reutilizables durante y después del proyecto. El consorcio también espera incluir un nodo central de almacenamiento de datos en la plataforma integrada para aquellos proveedores de datos que no puedan o no deseen establecer su propio nodo a nivel local y poner a disposición una herramienta de desidentificación de datos optimizada según las necesidades de los proveedores de datos, así como una herramienta de anotación de datos semiautomática para acelerar su trabajo.

El segundo prototipo, que estará disponible a principios del año que viene, también optimizará el proceso de aprendizaje federado en cuanto al uso de los recursos informáticos necesarios y la calidad de los modelos de IA producidos a partir de este proceso.

[INCISIVE ha recibido financiación del programa de investigación e innovación Horizonte 2020 de la Unión Europea en virtud del acuerdo de subvención nº 952179]

 

INCISIVE WEBSITE: https://incisive-project.eu/

INCISIVE TWITTER: @IncisiveEu

Enlace para suscribirse a INCISIVE newsletter: https://incisive-project.eu/newsletter/