Enmarcado en el Plan de Recuperación y la Agenda España Digital, el PERTE Nueva Economía de la Lengua tendrá en el proyecto Lengua Española e Inteligencia Artificial (LEIA) su eje vertebrador. La iniciativa de la Real Academia Española aboga por maximizar el potencial económico y social del español en el contexto de la transformación digital, un proceso maximizado por la pandemia del COVID-19.
La generalización de la Inteligencia Artificial y el Internet de las Cosas con la definitiva integración del lenguaje en las máquinas, o los complejos vericuetos de la traducción automática, son retos para los que las homologaciones clásicas -diccionario, ortografía, gramática- no están del todo preparadas.
LEIA quiere que el español adquiera el estatus que le corresponde en el marco global, pero no a cualquier precio, sino con el máximo rigor formal y libre de sesgos de toda índole. Hace unos días, el proyecto recibía el espaldarazo del Gobierno tras firmar un acuerdo con la Secretaría de Estado de Digitalización e Inteligencia Artificial. El pacto implica una inversión de 1.100 millones de euros.
Si quiere cumplir con la hoja de ruta prevista, además de un firme apoyo público, LEIA requiere de la implicación de agentes privados, con las grandes tecnológicas a la cabeza, pero también en estrecho vínculo con pymes y startups. El carácter horizontal del PERTE así lo demanda, al igual que la permeabilidad de la Inteligencia Artificial en el conjunto de sectores económicos.
El español como combustible
Cristina Gallach, comisionada para la Alianza por una Nueva Economía de la Lengua aseguraba la semana pasada que en la presente revolución digital la lengua es el combustible igual que antes lo fue el carbón. “Es momento de que la lengua española despegue”.
Gallach espera que en LEIA y en otros proyectos del PERTE que comisiona confluyan todos los actores que tengan algo que decir alrededor del español y sus nexos con las nuevas tecnologías. “Se trata de un trabajo conjunto de distintos ministerios, la RAE, el Instituto Cervantes, la Biblioteca Nacional y las empresas. Estamos bien posicionados, pero las alianzas son la clave. Unir ideas y recursos es lo más transformador. Si no avanzamos de manera armónica, no alcanzaremos los objetivos”.
Para andar este camino, Gallach celebra el cálido acompañamiento de los fondos de recuperación europeos. “Estamos ante la posibilidad de movilizar fondos públicos y con ellos una nueva economía. Ahora podemos hacerlo bien”. Considera que el español se va a posicionar desde el punto de vista del uso y del espacio que ocupa la lengua en la economía global. “Supone un gran salto basado en la interdisciplinaridad. Ya no es una cuestión de tecnólogos o lingüistas, sino de toda la sociedad, como siempre que hablamos de cambios de gran calado”.
Un nuevo Babel
Alberto Granados, presidente de Microsoft España, representa, al igual que Amazon, Google, Twitter o Telefónica, a la tipología de empresa con la que la RAE está promoviendo un buen uso del español. “La lengua española tiene una presencia muy significativa en nuestras herramientas. El español se usa cada vez más como lengua de negocios, incluso, por ejemplo, en zonas de EEUU no mayoritariamente hispanohablantes. Es un momento único para entrenar de forma apropiada a máquinas y algoritmos”, apuntaba Granados.
Ligado a LEIA, Microsoft y la Real Academia Española acordaron la incorporación de los datos de la RAE a sus herramientas -Windows, Office, Bing- y motores de búsqueda. La compañía fundada por Bill Gates trabaja, además, para que Word incluya el corpus de la RAE, el mismo con el que entrenarán a sus algoritmos.
“Invertimos en una inteligencia artificial que considere muchos otros aspectos del idioma: ambigüedades, sentidos, matices, pronunciaciones…”. Granados se refiere a un escenario de perfeccionamiento donde el entrenamiento de los algoritmos de inteligencia artificial esté, de algún modo, aislado del lenguaje, una especie de Babel donde todas las lenguas tengan cabida.
Los acuerdos con la RAE suponen una actualización constante de los datos para asegurar que los algoritmos evolucionan al mismo compás que la lengua. “Debe ser algo vivo. Cumplir con este propósito requiere de un trabajo permanente”. El máximo dirigente de Microsoft en España recordaba que el compromiso de la empresa pasa por cuidar la herencia cultural de la lengua. “Hay lenguas minoritarias que corren el riesgo de desaparecer en el futuro. Además, estamos diseñando unos algoritmos que detectan sesgos en otros algoritmos, ya sean de género u otro tipo”.
Rigor en el análisis
En esta línea, Chema Alonso, director de Estrategia Digital de Telefónica asegura que “no se trata de que la inteligencia artificial reconozca y genere un buen español, sino de que lo entienda, interprete y genere en todas sus facetas”. Alonso admitía que aún hay muchos retos por resolver, de ahí que Telefónica esté en LEIA “desde el primer día”.
“En Telefónica enseñamos a las máquinas a hablar español. Somos una empresa tecnológica que tiene a la mayoría de sus clientes en España y en otros países de habla hispana”. Chema Alonso detallaba que todos estos desarrollos pasan por un proceso de certificación. “Así garantizamos que no llevamos a ningún lugar frases sin sentido o un asistente de voz que no entiende lo que le decimos. Se trata de un trabajo exigente que nos autoimponemos para no caer en errores del pasado”.
Calidad y acceso a los datos
Itziar Aldabe, experta en lenguaje natural en la Universidad del País Vasco recordaba que las máquinas piensan en español, pero aún falta trabajo investigador. Aldabe confía en que las ambiciones de LEIA deriven en un cambio de paradigma. “Debemos centrarnos en la importancia de la capacidad de cómputo, en la formación de expertos y en la calidad y accesibilidad de los datos que manejamos”.
Según la investigadora, con esos pilares son capaces de representar mejor el idioma. “Hilamos más fino y conseguimos mejores predicciones y generaciones”. Implicada en el proyecto European Lenguage Equality, Aldabe incidía en la fortaleza de la corriente que considera el idioma como un motor económico. Esta iniciativa europea monitoriza todos los idiomas del continente (más de 70), también el lenguaje de signos. “La tecnología y su desarrollo es importante, pero lo que marca la diferencia entre un idioma y otro son los datos y el acceso a los mismos. De ello depende que podamos usarlos para investigar y desarrollar mejores sistemas”.