El BSC rebrà 12 milions de la Generalitat per seguir desenvolupant el projecte AINA fins al 2026

19 Desembre 2022

“La culminació d’AINA assegurarà que mai més cap empresa gran o petita pugui tenir una excusa per no incorporar el català en els seus serveis textuals, visuals o d’àudio”, ha assegurat el director associat del BSC, Josep M. Martorell

L’objectiu d’AINA és garantir el futur de la llengua catalana al món digital al mateix nivell que altres llengües d’abast global.

El Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) rebrà una inversió de 12 milions d’euros en els propers quatre anys per seguir desenvolupant el projecte AINA. El Govern de la Generalitat de Catalunya ha anunciat aquest dilluns una injecció anual de 3 milions fins a l’any 2026 per garantir la continuïtat i culminació d’una iniciativa l’objectiu de la qual és assegurar el futur de la llengua catalana al món digital al mateix nivell que altres llengües d’abast global.

L’anunci l’han fet el conseller d’Empresa i Treball, Roger Torrent i Ramió, i el director associat del BSC, Josep Maria Martorell, després de mantenir una reunió de treball en la qual també hi han participat la secretària de Polítiques Digitals, Gina Tost i Faus; el secretari de Política Lingüística, Francesc Xavier Vila Moreno; el director del BSC, Mateo Valero; i la responsable del projecte AINA i colíder de la Unitat de Mineria de Textos del BSC, Marta Villegas.

“Disposar d’un finançament plurianual fins a l’any 2026 és una notícia excepcional que ens permet donar continuïtat a l’equip que treballa en el projecte AINA i seguir invertint en desenvolupar nova tecnologia. La culminació d’AINA garantirà que mai més cap empresa gran o petita pugui tenir una excusa per no incorporar el català en els seus serveis textuals, visuals o d’àudio”, ha assegurat el director associat del BSC, Josep M. Martorell, després de la reunió.

AINA és un projecte liderat pel BSC que es basa en tecnologies de dades i intel·ligència artificial (AI) amb l’objectiu últim d’aconseguir que la tecnologia entengui i parli català, de manera que la ciutadania pugui participar plenament en el món digital en català.

Per assolir aquest objectiu, el projecte AINA està desenvolupant la infraestructura necessària perquè la inclusió del català a les aplicacions d’IA sigui prou atractiva i viable, tant per a les grans companyies tecnològiques com per a la indústria local, de manera que qualsevol empresa o organització pugui utilitzar els recursos generats per AINA, com ara els corpus (conjunts massius de dades) i els models de la llengua catalana, per desenvolupar les seves solucions o serveis específics (traductors, assistents personals, sintetitzadors de veu, classificadors de textos, etc.) en català.

A dia d’avui, el projecte AINA ha creat ja el “corpus de text” més gran que s’ha fet mai de la llengua catalana. Aquest corpus s’ha obtingut i continua creixent a base de descarregar textos de diferents fonts digitals en català (pàgines web, arxius, etc.) i processar-los per poder ser utilitzats com a dades d’entrenament per les xarxes neuronals que utilitzen els models de la llengua.

AINA ha començat a construir també un gran “corpus de veu” del català, que es nodreix principalment de les dades obtingudes a través de la iniciativa “La nostra llengua és la teva veu”, consistent en una crida a la participació altruista de la ciutadania de parla catalana perquè doni la seva veu i validi l’aportada per altres persones a través de la plataforma Common Voice de Mozilla.

Entre els primers prototips desenvolupats al 2022, destaquen les noves veus sintètiques entrenades per AINA mitjançant el seu ús en un assistent virtual de l'empresa Bookline; una eina de transcripció automàtica (oTranscribe+) que permet i facilita l'edició garantint la privadesa de les dades; i un xatbot de veu que respon preguntes sobre el projecte AINA i que pot servir de base per crear altres experiències conversacionals en català.

Aquest 2023, es continuarà treballant en aquestes línies per ampliar els corpus de text i de veu, i els models de llengua entrenats a partir d’aquests corpus. Al final del projecte AINA, el 2026, es disposarà de totes les peces necessàries perquè qualsevol empresa o organització les pugui combinar per crear les seves solucions o serveis garantint que aquests entendran i parlaran correctament el català en qualsevol de les seves variants.

El BSC també rep 3 milions d'euros del Govern d'Espanya per finançar el projecte AINA, segons va aprovar el Consell de Ministres el mes de novembre passat a proposta del Ministeri d'Afers Econòmics i Transformació Digital, en el marc del Projecte Estratègic per a la Recuperació i Transformació Econòmica (PERTE) de la Nova Economia de la Llengua, del Pla de Recuperació.