AINA: El Català i la IA (ECIA)

Status: Active Start:
01/01/2022
End:
31/12/2022

Primary tabs

Description

El projecte El Català i la IA (ECIA) té com objectiu generar els recursos lingüístics necessaris per al català, que permetin i facilitin desenvolupar aplicacions en llenguatge natural com chat bots, traductors automàtics, aplicacions d'extracció d'informació o resum automàtics. La tecnologia de la llengua ha entrat de ple en el món de l'aprenentatge profund i el big data, per tan cal posar a l abast de la comunitat científica i la indústria models de llengua en català, pre-entrenats sobre grans quantitats de dades lingüístiques de qualitat.

Es produirà també un bon nombre de dades anotades que serviran per entrenar i, posteriorment, avaluar models per a tasques específiques (com ara sistemes de pregunta resposta, de classificació semàntica i d'altres tasques que impliquen comprensió del llenguatge). La generació de dades manualment anotades és un procés crític i molt costós que aquest projecte pretén resoldre.

Finalment, es desenvoluparà una aplicació de benchmarking que permetrà l avaluació contínua de models i sistemes utilitzant dades anotades. L'objectiu final del l aplicació és impulsar la investigació en el desenvolupament de sistemes generals i robusts de comprensió del llenguatge natural. Esperem que el projecte tingui un gran impacte en la indústria de la llengua en català i en els ciutadans ja que, per primera vegada, el català disposarà de recursos suficients per a ser considerat llengua de primera en el món digital i els ciutadans podran fer vida digital en català, sense haver de passar a l'anglès o al castellà com passa actualment.

Dades integrades i Observatori Epidemiològic:

Els objectius d'aquest projecte són el desenvolupament d'un sistema d'informació d'accés públic que serveixi com a eina d'assistència a la presa de decisions en la gestió de nous brots de COVID-19, tant en l'àmbit d'autoritats sanitàries com de la ciutadania. Tal eina consta de tres grans components que inclou:

i) un sistema d'informació geogràfic que integri entre altres fonts, informació de casos reportats, patrons de mobilitat i disponibilitat hospitalària;

ii) una eina interactiva de visualització i anàlisi, que resumeixi en forma clara l'estat sanitari dels diferents municipis / zones hospitalàries i que identifiqui tant tendències com patrons de contagi significatius; 

iii) implementació i calibratge de models epidemiològics per a realitzar prediccions a curt termini

Funding