Hace unos meses, Barcelona Supercomputing Center (BSC) lanzó una herramienta de inteligencia artificial que era capaz de comprender la lengua española a partir de archivos web de la Biblioteca Nacional. Ahora, este mismo proyecto, MarIA, ya puede resumir textos existentes y crear otros nuevos a partir de titulares o de palabras.
Antes, MarIA podía clasificar documentos, responder a preguntas tipo test, encontrar similitudes semánticas en diferentes redactados o detectar los sentimientos que se expresan en ellos. Pero, ¿qué supone esta actualización? Con esta nueva versión, creada con GPT-2 –“una tecnología más avanzada que crea modelos generativos decodificadores y añade prestaciones al sistema”, explican desde el BSC–, y si se da una secuencia de texto, puede generar nuevos textos.
“Con ello, pueden servir, por ejemplo, para hacer resúmenes automáticos, simplificar redactados complicados a la medida de diferentes perfiles de usuario, generar preguntas y respuestas, mantener diálogos complejos con los usuarios e incluso redactar textos completos –que podrían parecer escritos por humanos– a partir de un titular o de un pequeño número de palabras”.
Asimismo, indican, que esta herramienta, que funciona gracias al superordenador MareNostrum 4, puede ser de gran utilidad para desarrolladores de aplicaciones, empresas y administraciones públicas. “Por ejemplo, los modelos que hasta ahora se han desarrollado en inglés se utilizan para generar sugerencias de texto en aplicaciones de escritura, para resumir contratos o los complicados documentos que detallan las prestaciones de un producto, en función de lo que quiere saber cada usuario, y para buscar informaciones concretas dentro de grandes bases de datos de texto y relacionarlas con otras informaciones relevantes”.
El futuro de los modelos de lenguaje
Gracias a la nueva versión de MarIA, ahora se podrá crear versiones especializadas en distintas áreas de aplicación, incluyendo biomedicina y legal. Asimismo, la herramienta evolucionará para resolver problemas específicos. Y es que los modelos de lenguaje son “modelos estadísticos complejos, que relacionan palabras en textos de modo sistemático y masivo, son capaces de entender no solo conceptos abstractos, sino también el contexto de los mismos”, explican desde el BSC.
En la presentación de la nueva versión, Carme Artigas, secretaria de Estado de Digitalización e Inteligencia Artificial, ha declarado que “con proyectos como MarIA, que se verán incorporados al PERTE para el desarrollo de una economía digital en español, damos pasos firmes hacia una inteligencia artificial que piense en español, lo que multiplicará las oportunidades económicas para las empresas y la industria tecnológica española. Porque la lengua es mucho más que un medio de comunicación. Es una proyección de la forma que tenemos de ver el mundo, también en la nueva realidad digital”.