Gema Parreño, Data Scientist

"Nuestro móvil tiene la potencia del primer ordenador que se envió a la Luna"

Expertos en gestión de datos y en inteligencia artificial se dieron cita del 19 al 21 de mayo en ESADE, en una nueva edición del congreso internacional itinerante PyData. A lo largo de esos tres días, expertos en data science de prestigio internacional abordaron temas como la mejora de la productividad en las empresas, el análisis de la felicidad de los trabajadores o los modelos de predicción meteorológica como herramienta para el aprendizaje automático o aprendizaje de las máquinas (machine learning).

Entre los ponentes de ESADE estaba Gema Parreño, que presentó el proyecto NASA Space Apps Challenge, para la predicción de impacto de asteroides. Con ella habló InnovaSpain, para conocer más de cerca su trabajo. Arquitecta de formación, se dedicó a la industria de la animación 3D y videojuegos llegando a fundar su propia startup. Para entender las dinámicas de sus compañeros desarrolladores y crear aplicaciones aprendió programación y en 2014 empezó a estudiar e investigar sobre las redes neuronales. Con esta herramienta y la tecnología TensorFlow, la librería de código abierto desarrollada por Google para construir redes neuronales, Gema ha desarrollado junto a varios colaboradores ‘Deep Asteroid’, un proyecto reconocido por la NASA en su certamen Space Apps Challenge en 2016.

Mediante la disposición de una red neuronal artificial, el deep learning, “un subcampo dentro del machine learning, supone una estrategia de diseño multicapa”, explica Parreño, “Deep Asteroid” va clasificando los NEO’s (Near Earth Objets) que rodean la tierra, para detectar aquellos que puedan suponer un peligro de impacto. A medida que tiene más datos, este sistema se va refinando y ganando en precisión.

Estudiaste Arquitectura pero ahora eres científico de datos. Dos campos aparentemente muy distantes ¿Cómo pasaste de uno a lo otro?

Acabé arquitectura en plena crisis y el modelo de negocio que había ya no funcionaba. Junto con un equipo de compañeros creamos una startup de animación y videojuegos. A partir de ahí aprendí los principios de programación; seguí profundizando en ese campo y descubrí el análisis de datos. En arquitectura tuve una parte muy fuerte de diseño de estructuras, aplicable al campo del análisis de datos estudiando sus posibilidades. Ahora no hago estructuras de espacios, sino de datos, pero siguen siendo estructuras. En lugar de estructurar edificios doy estructura a la información. Cada día aprendo cosas nuevas y eso es lo que más me motiva. Y la parte que más me gusta es el machine learning y la inteligencia artificial.

¿Qué es un científico de datos?

Una persona que convierte los datos en decisiones accionables, o en conclusiones que puedan llevar a una decisión. Y ellos estructuran esos datos, y los convierten en decisiones. Esta profesión es muy nueva pero madurará, creando especialidades, porque cada vez hay más datos que manejar.

¿Hay mucha información disponible por explotar? ¿Se puede sacar conclusiones de ella aplicadas a la medicina, por ejemplo?

Si, sobre todo, cuáles son las características nuevas que influyen sobre cosas importantes. En TensorFlow, que ha sido el núcleo de búsqueda de Google de los últimos 5 años, hay un proyecto que aporta un valor diferencial sobre procesamiento de imagen en ceguera para detectar cuándo la enfermedad puede empeorar. Y eso permite, por ejemplo, adaptar la mediación.

Explícanos en pocas palabras algo más acerca del TensorFlow y de las redes neuronales

TensorFlow es una librería de código abierto que permite hacer arquitectura de redes de neuronas, que está inspirado en las neuronas del cerebro. Las redes neuronales transforman información y están basadas en estructuras de red.

¿Llegarán las máquinas a pensar por nosotros?

No. Esto no es más que una herramienta, como lo es una llave inglesa. Con ella, las máquinas nos ayudarán a tomar decisiones. Igual que una llave inglesa nos permite ejercer una fuerza sobre un tornillo, que sin ella no lograríamos mover. Pero nuestra mano puede hacer muchas otras cosas que la llave inglesa no puede. Con las redes neuronales y el machine learning ocurre lo mismo, es una herramienta no un sustituto.

Con esa herramienta que ofrece Google de forma gratuita, tú has sido capaz de resolver algo que a la Nasa se le escapaba, cuéntanos, qué y cómo lo lograste

La NASA lleva bastante tiempo dando vueltas al problema de los asteroides y yo les he dado otra visión innovadora. Les he dado otra forma de solucionar el problema. La NASA, quizá por madurez propia de esa institución, sabe que hay innovadores que aportan una visión fresca a ese problema y reconoce los proyectos técnicamente más solventes. Este proyecto lo desarrollé con cinco personas más, una trabaja en la ESA y tenía un conocimiento técnico sobre asteroides. Yo lo cogí e hice una arquitectura de red coherente con ese conocimiento técnico.

Suena un poco a la película Figuras Ocultas, ¿la has visto? Lo que tantos ingenieros de la nasa no han sido capaces de resolver, para ti no ha pasado desapercibido.

Sí, la he visto y me he leído el libro. Me gusta sobre todo la historia de este grupo de mujeres. ¿Hay semejanzas con mi caso? Sí y no. Quizás la NASA a través de esa experiencia, se dio cuenta de que contar un problema a alguien que piensa fuera de la caja aporta valor. Por eso hace el concurso al que yo me presenté todos los años para tratar muchos tipos de problemas. El de los asteroides es un desafío técnico, otro concurso era contar un cuento a los niños sobre qué es la luna. Cierta analogía, hay porque una anomalía o un outlier que no tiene nada que ver con este campo de repente propone una solución y la NASA la reconoce.

Explícanos más sobre el sistema inteligente Deep Asteroid.

Es un sistema que va cambiando conforme alimentas más datos a la red. Funciona por capas. Hay una primera clasificación que detecta los asteroides que tiene probabilidad de impacto sobre la Tierra y la siguiente capa afina esos datos porque los asteroides con el tiempo cambian de color, velocidad, trayectoria. Esto hace difícil para los humanos no automatizar esta información. La NASA lleva tiempo trabajando en ello. Una red neuronal es un poco como un pastel, un sistema multicapa en el que cada una tiene un nivel de complejidad mayor y utiliza una clasificación que permite tomar decisiones y determinar fecha de impacto. Es importante destacar que el conjunto de datos sobre el que se entrena la red son de asteroides que ya han impactado.

¿Qué innovaciones destacarías en tu campo?

Las redes neuronales generativas, que generan información en sí mismas, máquinas que empiezan a crear música, etc. Antes toda la inteligencia artificial era menos accesible al mundo tecnológico y TensorFlow ha abierto la posibilidad de ser utilizado por desarrolladores de software y se pueda utilizar en el móvil que usamos cada día, por ejemplo. Nuestros móviles hoy tienen la potencia computacional del primer ordenador que se envió a la Luna. Y eso en menos de 20×20 centímetros. Cada vez los ordenadores serán más pequeños y más integrados.

Especiales