El proyecto AINA se va de gira por territorios de habla catalana para sumar voces de todas las variantes dialectales

04 Abril 2022
La gira arranca hoy en Perpiñán, en la Cataluña Norte, y pasará por la Comunidad Valenciana y las Islas Baleares los días 7 y 11 de abril.

El vicepresidente Puigneró encabezará los actos de presentación del proyecto con las principales entidades culturales y de defensa de la lengua de cada uno de los territorios

El objetivo es sumar las voces de las variantes que se hablan en estos territorios en la campaña 'Nuestra lengua es tu voz' para obtener un corpus de voz que contemple toda la diversidad lingüística del catalán oral

AINA es un proyecto basado en tecnologías de datos e Inteligencia Artificial impulsado por la Vicepresidencia y el Barcelona Supercomputing Center (BSC)El projecte AINA se’n va de gira per territoris de parla catalana per sumar veus de totes les variants dialectals

 

El proyecto AINA pone en marcha hoy una gira por territorios de habla catalana con el objetivo de sumar voces de las diferentes variantes dialectales de la lengua catalana.

Según los últimos datos disponibles, las variantes dialectales menos representadas en la plataforma Common Voice de Mozilla son el balear (1%), el noroccidental (1%), el septentrional (3%) y el valenciano (5%). Con la gira de AINA, se pretende animar a los hablantes de estas variantes para que se sumen a la campaña de recogida de voces a través de la web projecteaina.cat con el objetivo último de incrementar notablemente estos porcentajes para garantizar que el corpus de voz resultante contemple toda la diversidad lingüística de la lengua catalana.

Una gira en dos fases

Impulsada por el Departamento de la Vicepresidencia y de Políticas Digitales y Territorio con la colaboración de diferentes entidades y asociaciones culturales y de defensa de la lengua de los territorios de habla catalana, la gira de AINA se desarrollará en dos fases. La primera hará parada en la Catalunya Nord, la Comunidad Valenciana y las Islas Baleares.

El pistoletazo de salida tendrá lugar hoy, 4 de abril, en Perpiñán (Catalunya Nord), con un acto de presentación del proyecto encabezado por el vicepresidente Jordi Puigneró y la colaboración del Consejo Departamental Pirineos Orientales y la Oficina Pública de la Lengua Catalana (OPLC). La misma semana, concretamente el jueves 7 de abril, la gira hará parada en la ciudad de Valencia (País Valencià), que acogerá el acto de presentación impulsado en colaboración con Acció Cultural del País Valencià. Por último, el día 11 de abril la gira del AINA pasará también por Palma (Mallorca), con un acto organizado en colaboración con el Gobierno de las Islas Baleares.

En estos tres actos, tanto las personas participantes como las asistentes podrán grabar sus voces en un punto de recolección de voces itinerante del projecteaina.cat.

La gira de AINA continuará antes del verano con una segunda fase que recorrerá todo el territorio catalán, con actos de presentación del proyecto en un municipio de cada una de las ocho veguerías catalanas.

Más de 640.000 voces grabadas

A mediados del pasado mes de febrero, el Govern de Catalunya lanzó la campaña 'Nuestra lengua es tu voz' en el marco del proyecto AINA con el objetivo de recoger el máximo de voces posible para nutrir de contenidos la primera versión del corpus de voz del catalán, imprescindible para enseñar a las máquinas a entender y hablar nuestra lengua.

La campaña invita a la ciudadanía de habla catalana de todas las edades, géneros, condiciones y procedencias a “dar” su voz a través de la web projecteaina.cat, desde donde todo el mundo puede leer, grabar y validar un número ilimitado de frases agrupadas de 5 en 5 en la plataforma Common Voice de Mozilla.

La excelente acogida de la campaña por parte de la ciudadanía ha hecho que, en poco más de un mes, se hayan alcanzado cifras de grabaciones y horas de grabación que han superado las mejores expectativas, llegando actualmente a los más de 640.000 cortes de voz (frases) grabados y más de 900 horas de grabación desde el inicio de la campaña. Además, el catalán ha pasado a ser la segunda lengua del mundo con más locutores en Common Voice (más de 25.500 personas), sólo por detrás del inglés.

Sin embargo, la variante dialectal dominante en la plataforma sigue siendo el catalán central, que supera el 75% de las voces grabadas.

Sobre el proyecto AINA

Impulsado por el Departamento de la Vicepresidencia y de Políticas Digitales y Territorio en colaboración con el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), AINA es un proyecto basado en tecnologías de datos e Inteligencia Artificial para hacer posible que las máquinas entiendan y hablen el catalán.

Se trata de un proyecto estratégico que tiene como objetivo último enseñar catalán a las máquinas de modo que la ciudadanía pueda relacionarse con ellas y participar en el mundo digital en catalán al mismo nivel que los hablantes de una lengua global, como ahora el inglés, evitando así la extinción digital de la lengua catalana.

En este sentido, el proyecto AINA está construyendo los corpus y modelos de lengua del catalán para facilitar que las empresas tecnológicas puedan desarrollar sus soluciones o servicios específicos (traductores, asistentes personales, sintetizadores de voz, clasificadores de textos, etc.) en nuestra lengua.

El proyecto AINA se enmarca en la estrategia digital del Gobierno a través de dos iniciativas lideradas por la Vicepresidencia: la Estrategia de Inteligencia Artificial de Cataluña (Catalonia.AI) y el Consejo de Dirección interdepartamental para la promoción del catalán en Internet y en las tecnologías digitales avanzadas.