El BSC aporta la seva experiència en IA al primer repositori compartit de dades i imatges de càncer

04 Juliol 2022

El projecte INCISIVE integra milers d'imatges clíniques de càncer de mama, pulmó, pròstata i colorectal de més de 7.000 pacients sense identificar que permetrà als hospitals compartir dades sanitàries amb la comunitat científica

El projecte europeu INCISIVE, amb participació del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC-CNS), ha llançat el primer prototip de repositori de dades interoperable federat amb milers d’imatges clíniques de càncer de mama, pulmó, pròstata i colorectal. El repositori permet que els hospitals comparteixin dades sanitàries de manera segura i conforme a la normativa europea de protecció de dades amb la comunitat científica que treballa en la formació i experimentació relacionada amb la Intel·ligència Artificial (IA).

El grup de recerca Data-Centric Computing del BSC ha dissenyat l’arquitectura de IA Federada, encarregada d’aportar la distribució de l’entrenament de la IA, així com els mecanismes de dades que coordinen els repositoris de dades federats i les eines de IA mitjançant sistemes de Model-com-a-Servei. El prototip incorpora la coordinació de les eines d’IA federada i fluxos de dades, permetent als investigadors i usuaris crear i compartir models evitant l’accés a dades sensibles des dels proveïdors de dades.

 

 

El consorci que gestiona el projecte ha recollit en un magatzem central temporal 2,5 milions d’imatges de càncer de més de 7.000 pacients sense identificar de tots els socis clínics que hi participen. En una primera fase, s’han integrat totes les dades clíniques i d’imatge del càncer de tres dels nou proveïdors. Una vegada que la resta de proveïdors completi la configuració dels seus nodes de dades, tota la informació recollida s'integrarà al repositori de dades federat.

La coordinadora del projecte, Gianna Tsakou, destaca els reptes que s’ha enfrontat el consorci per aconseguir aquesta fita: “un dels reptes més grans que hem abordat amb èxit ha estat la posada en marxa de tots els acords necessaris i el treball tècnic per garantir que la compartició massiva de dades retrospectives compleixi amb els requisits legals i ètics als 5 països europeus i als 9 proveïdors de dades en què s’han previst nodes de dades”.

Avançant cap a la caixa d’eines d’IA

El primer prototip d’INCISIVE ja inclou algunes de les funcionalitats que s’esperen per a la caixa d’eines d’IA (Toolbox), que té com a objectiu proporcionar suport a la presa de decisions als professionals mèdics en relació amb el diagnòstic i el tractament del càncer. Els socis d’INCISIVE ja han començat a treballar en gairebé tots els models d’IA previstos al projecte, incorporant els més avançats en aquesta primera fase, que són els models de classificació de la densitat mamària i de segmentació d’imatges pulmonars per a diverses modalitats de imatge.

La caixa d’eines d’IA d’aquest primer model també inclou els enfocaments inicials sobre l’explicabilitat de la IA, els conductes d’anàlisi de dades que permetran la prestació dels serveis d’IA previstos i el treball inicial sobre la interfície d’usuari dels serveis d’IA perquè els professionals mèdics puguin veure i llegir de manera exhaustiva els resultats de la manera més intuïtiva i transparent possible.

Casos d’ús

El primer prototip inclou els casos principals d’ús i funcionalitats de la plataforma previstos al projecte per als usuaris potencials de la plataforma INCISIVE.

En primer lloc, per als proveïdors de dades, dóna suport a la preparació de les dades, incloent-hi la desidentificació, l’anotació i la comprovació de la qualitat abans de compartir-les al repositori INCISIVE. En segon lloc, per als investigadors d’IA que busquen dades d’entrenament o validació per als seus models, el primer prototip facilita la cerca i la consulta de les dades als nodes federats, permetent la creació d’un espai de treball i l’entrenament dels seus algorismes utilitzant l’aprenentatge federat. Finalment, per als professionals de la medicina, admet la prestació de serveis habilitats per la IA seguint un models-as-a-service approach, en què els professionals només han de proporcionar la imatge al sistema i després obtenir-ne els resultats d’inferència habilitats per la IA amb un sol clic.

Properes passes

El consorci INCISIVE ha començat a treballar en el segon prototip, que integrarà els sis proveïdors de dades restants a l’emmagatzematge federat i permetrà que les seves dades siguin interoperables i reutilitzables durant i després del projecte. El consorci també espera incloure un node central d’emmagatzematge de dades a la plataforma integrada per a aquells proveïdors de dades que no puguin o no vulguin establir el seu propi node a nivell local i posar a disposició una eina de desidentificació de dades optimitzada segons les necessitats dels proveïdors de dades, així com una eina d’anotació de dades semiautomàtica per accelerar el seu treball.

El segon prototip, que estarà disponible a principis de l’any vinent, també optimitzarà el procés d’aprenentatge federat quant a l’ús dels recursos informàtics necessaris i la qualitat dels models d’IA produïts a partir d’aquest procés.