CARMEN-I: digitalizando historiales clínicos de COVID-19 con Inteligencia Artificial

02 Enero 2023

El próximo 13 de enero en la Facultad de Medicina de la Universidad de Barcelona se presentará un avance clave en la aplicación de la Inteligencia Artificial en el ámbito de la salud y en el procesamiento de lenguaje natural: el corpus anonimizado de informes hospitalarios de diversos tipos escritos en el Hospital Clínic durante la pandemia de COVID-19, llamado CARMEN-I (Corpus of Anonymized Records for Medical information Extraction). CARMEN-I se ha desarrollado en el contexto del Plan de Impulso de las Tecnologías del Lenguaje (Plan TL) promovido por la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA) y del convenio entre el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) y el Hospital Clínic de Barcelona. Además del corpus, se prevé el lanzamiento de modelos pre-entrenados para detección tanto de datos sensibles como de conceptos clínicos (enfermedades, hallazgos y procedimientos, entre otros), así como la documentación relativa al proceso de anonimización y anotación para ayudar a otros grupos a usar el procesamiento del lenguaje natural en el ámbito sanitario.

Sobre CARMEN-I: aplicando Inteligencia Artificial a los historiales clínicos de COVID-19

CARMEN-I es un primer paso en la creación de componentes de Procesamiento de Lenguaje Natural (PLN) clínicos debidamente documentados, evaluados y licenciados. El Procesamiento del Lenguaje Natural (PLN) es clave para la mejora de la calidad asistencial y la investigación clínica. Tanto profesionales del ámbito de la salud como investigadoras se pueden beneficiar del acceso a historiales clínicos debidamente procesados, validados y adaptados para su estudio o análisis.

La calidad de los sistemas de procesamiento de texto ha mejorado en los últimos años gracias a los avances en Inteligencia Artificial, técnicas de aprendizaje profundo y el uso de modelos de lenguaje. El objetivo de CARMEN-I es servir como conjunto o base de datos de salud de libre acceso de referencia para la aplicación de estas tecnologías en salud. Martin Krallinger, investigador líder del grupo de Text Mining del Barcelona Supercomputing Center, define el objetivo de CARMEN-I: "CARMEN-I quiere no solo impulsar el desarrollo tecnológico de sistemas de PLN clínico, sino también servir como base técnica para facilitar el proceso de creación de datos anonimizados a nivel nacional e internacional, en especial para Latinoamérica y países con datos en lenguas romances".

CARMEN-I estará accesible para investigadoras y profesionales del ámbito de la salud, junto con modelos pre-entrenados, el protocolo de anonimización y guías de anotación, con el fin de fomentar el desarrollo de tecnologías del lenguaje e IA aplicadas a datos clínicos y ofrecer unas guías y normas que sirvan para el proceso de anonimización de datos sensibles.

El debate - Anonimizar datos y procesar el lenguaje natural en el ámbito de la salud

El evento del día 13 de enero abordará dos temas principales: cómo se ha creado un conjunto de datos anonimizados como CARMEN-I y cómo funciona la extracción automática de información clínica de textos. Martin Krallinger, investigador líder del grupo de Text Mining del BSC, explicará el proceso de extracción automática de datos clínicos y el sistema desarrollado para anonimizar la información de los informes clínicos de CARMEN-I: "Este evento también tiene como objetivo contribuir a la formación y difusión de tecnologías del lenguaje aplicadas al sector de salud, tanto para el entorno de la industria como el sector académico y expertos sanitarios e investigadores".

Además, el evento contará con la ponencia de Jesús Pinilla, Secretaría de Estado de Digitalización e Inteligencia Artificial sobre la nueva economía del lenguaje en aplicaciones en salud y biomedicina. La clausura del evento se llevará a cabo por Alfonso Valencia, director de Life Sciences en el Barcelona Supercomputing Center, Xavier Pastor, médico del Hospital Clínic de Barcelona y Jesús Pinilla, Secretaría de Estado de Digitalización e Inteligencia Artificial.

La agenda completa del evento está disponible aquí.