LEIA y el desarrollo de una inteligencia artificial en español: "No podemos perder nuestro principal valor cultural"

La RAE y el Gobierno pactan impulsar la nueva economía de la lengua a través del proyecto LEIA que contempla, entre otras cosas, la correcta integración del español en los sistemas de inteligencia artificial
leia rae real academia española lengua lenguaje inteligencia artificial IA español

A lo largo de los últimos 300 años, la RAE y demás academias de la lengua española han trabajado para homogenizar el uso del español, la lengua principal del 7,5 % de la población mundial. Sin embargo, la creciente y sofisticada incorporación de la inteligencia artificial (IA) a las máquinas, ha puesto patas arriba la validez del orden que imponían diccionarios, gramáticas y ortografías oficiales.

El pasado jueves, la Real Academia Española y el Ministerio de Asuntos Económicos y Transformación Digital, a través de la Secretaría de Estado de Digitalización e Inteligencia Artificial, suscribían un acuerdo para impulsar definitivamente el proyecto Lengua Española e Inteligencia Artificial (LEIA), una vez transcurridos más de dos (convulsos) años desde su nacimiento.

“LEIA aportó entonces una visión lúcida de lo que iba a pasar”, apuntaba la vicepresidenta primera y ministra Nadia Calviño durante su intervención. Para la titular de Economía, el proyecto empieza a articular el español en un nuevo mundo marcado por un imparable y acelerado proceso de digitalización que la pandemia ha acentuado.

Un PERTE distinto

El acuerdo supone el primer hito del Proyecto Estratégico para la Recuperación y la Transformación Económica (PERTE) Nueva Economía de la Lengua, que se enmarca en el Plan de Recuperación y la Agenda España Digital. “Necesitamos una digitalización humanista donde la inteligencia artificial nos entienda sin proyectar y aumentar sesgos ya existentes. Una inteligencia artificial que piense como los ciudadanos, en nuestro caso en español y demás lenguas cooficiales”, añadía Calviño.

El pacto implica una inversión de 1.100 millones de euros. Entre las actividades previstas, los implicados destacan la creación de un sello digital de la RAE que certifique que las herramientas tecnológicas y la IA usan el español de una manera apropiada. Se proporcionarán recursos técnicos y documentales para mejorar el uso del español en la IA y en la tecnología en general, al mismo tiempo que se usará la IA para perfeccionar el empleo del español y su procesamiento automático.

“Es clave aprovechar el extraordinario valor de nuestra lengua”, señalaba Calviño. Según la vicepresidenta, la comunidad hispanohablante (casi 600 millones de personas) está a la cabeza, “por números y capacidad”, para potenciar que el español se aloje en los cerebros de la nueva inteligencia artificial. “LEIA es una ocasión para que surjan nuevos negocios, modos de vida y elementos dirigidos a una sociedad más fuerte, solidaria, justa e inclusiva”.

Evitar dialectos digitales

“LEIA nació de la preocupación de comprobar cómo las máquinas hablaban según el criterio del fabricante, distinto según la ubicación geográfica o la cultura de la empresa”. Santiago Muñoz Machado, director de la RAE, afirmaba que el objetivo del proyecto es evitar que las máquinas hagan un uso incorrecto del español. Para ello han entablado una conversación constante con las grandes tecnológicas a fin de que se atengan a las reglas de la RAE. “Debemos impedir la fragmentación del idioma que conduzca a dialectos digitales que echen por tierra todo lo logrado”, añadía.

La lengua es cada vez más importante en herramientas como chatbots, asistentes virtuales, traducción simultánea o comprensión lectora. El convenio prevé la creación de un observatorio de neologismos y tecnicismos donde, por medio de la IA, se recopilen automáticamente este tipo de palabras en tiempo real. También el desarrollo de herramientas tanto de verificación lingüística como de respuesta automática. Todo ello será gratuito y accesible en la web de la RAE.

Implicación de las grandes tecnológicas

Muñoz Machado aseguraba que cuando las máquinas son entrenadas en el español con materiales que no son de la RAE surgen los problemas. “Aparecen extravagancias en el idioma. El efecto puede ser grave: si la máquina detecta como errónea una palabra que sí existe, esa decisión se viraliza y nos encontramos con palabras españolas que corren el riesgo de desaparecer”.

El director de la RAE detallaba los progresos con la Champions League de las corporaciones tecnológicas para que asuman su papel en la promoción de un buen uso y un dominio adecuado del español. Microsoft, Google, Amazon (Alexa), Telefónica (Aura), Twitter, Meta… todos los grandes avanzan “en la buena dirección” según el director de la Real Academia Española.

Para Muñoz Machado, este acuerdo es solo el comienzo. “LEIA debe ser algo más grande”. Entre las intenciones de la RAE está certificar la calidad del español que hablan las máquinas, incluyendo la calidad de las traducciones automáticas. “Dentro de poco no será necesario conocer muchas lenguas. Por eso es importante que los traductores usen la lengua tal y como la regulamos. De lo contrario, el idioma se convertirá en una jerga particular que solo comprenderán las máquinas”.

IA libre de sesgos

De manera paralela, el director de la Real Academia Española aseguraba sentirse preocupado por las cuestiones éticas en la regulación de la inteligencia artificial. “La IA es una revolución prodigiosa, pero comporta riesgos. Si perdemos las reglas de funcionamiento y uso del idioma, perdemos el valor cultural más importante que tenemos”.

En esta línea, Muñoz Machado agregaba que no es suficiente construir grandes bancos de datos, sino que estos estén libres de sesgos de todo tipo. La propuesta de reglamento de la IA en la Unión Europea prevé certificaciones sobre la calidad del uso de la lengua, inteligible y accesible, sin sesgos ni discriminación, llevadas a cabo por autoridades legitimadas. Su director considera que no hay nadie mejor que la RAE para asumir esta tarea en España.

La RAE percibe que LEIA será el eje vertebrador de otros muchos proyectos con implicaciones digitales. Es el caso de la publicación de un diccionario histórico de la lengua española, un anhelo imposible hasta la fecha debido a las limitaciones humanas y técnicas. La posibilidad de disponer de un número importante de colaboradores trabajando desde cualquier lugar del mundo sin los sometimientos del archivo analógico a las que se han enfrentado hasta ahora abre las puertas a que el diccionario sea una realidad futura.

Liderazgo español

Para Carme Artigas, secretaria de Estado de Digitalización e Inteligencia Artificial, la lengua es un activo cultural y económico del país. “Puede marcar un horizonte de progreso en España y Latinoamérica. Debemos ser capaces de contar con el español como un recurso diferencial de nuestra digitalización”.  

A juicio de la responsable pública, este motor de crecimiento debe impulsar a España en materia de lengua y tecnología a ambos lados del Atlántico con especial énfasis en la IA. “Vemos máquinas cada vez más simples que usan expresiones poco sofisticadas, con menos garantías de cumplir con la normativa”.

“España no quiere quedarse atrás en el desarrollo de una industria de IA líder mundial en lengua española. No podemos ser testigos y consumidores de productos y servicios desarrollados en otros idiomas; traducidos y empobrecidos después”, concluía.  

Especiales