AINA: AINA

Status: Finished Start:
01/01/2022
End:
31/12/2022

Primary tabs

Description

El projecte El Català i la IA (ECIA) té com objectiu generar els recursos lingüístics necessaris per al català, que permetin i facilitin desenvolupar aplicacions en llenguatge natural com chat bots, traductors automàtics, aplicacions d extracció d informació o resum automàtics, etc. La tecnologia de la llengua ha entrat de ple en el món de l'aprenentatge profund i el big data, per tan cal posar a l'abast de la comunitat científica i la indústria models de llengua en català, pre-entrenats sobre grans quantitats de dades lingüístiques de qualitat. Es produirà també un bon nombre de dades anotades que serviran per entrenar i, posteriorment, avaluar models per a tasques específiques (com ara sistemes de pregunta resposta, de classificació semàntica i d altres tasques que impliquen comprensió del llenguatge). La generació de dades manualment anotades és un procés crític i molt costós que aquest projecte pretén resoldre.Finalment, es desenvoluparà una aplicació de benchmarking que permetrà l avaluació contínua de models i sistemes utilitzant dades anotades.

L'objectiu final del l'aplicació és impulsar la investigació en el desenvolupament de sistemes generals i robusts de comprensió del llenguatge natural. Esperem que el projecte tingui un gran impacte en la indústria de la llengua en català i en els ciutadans ja que, per primera vegada, el català disposarà de recursos suficients per a ser considerat llengua de primera en el món digital i els ciutadans podran fer vida digital en català, sense haver de passar a l anglès o al castellà com passa actualment. 

Funding