Novas Eventos Divulgación Goldtalk

Novas

05 setembro 2022

¿Pesimistas u optimistas con la pandemia? Twitter y deep learning para ahondar la percepción social de la COVID 19

Redactado por M. Martínez Euklidiadas

“El conocimiento sobre el estado de ánimo es un activo muy valioso a la hora de poder crear campañas de salud pública”, explican Guillermo Blanco y Anália Lourenço, autores de un artículo recién publicado, —financiado mediante fondos FEDER como parte del proyecto CURMIS4th, y llevada a cabo por el grupo SING e investigadores de CINBIO— en el queanalizan mediante deep learning el optimismo y pesimismo de los mensajes de Twitter durante la COVID-19. ¿Qué se puede aprender de lo compartido en una red social?

Jeremy Bezanger,

Ser capaces de estudiar el pulso de la población a través de la huella digital que dejan impresa en las redes sociales puede ser una herramienta clave como complemento de vigilancia y gestión, tanto en pandemias como en cualquier otro momento de interés. Una forma de modular los planes y establecer prioridades con base en las necesidades y preocupaciones de la gente.

Por qué analizar una red social como Twitter

Twitter, nos dicen los autores, “es un contexto peculiar” en el que es posible realizar algunas acciones (apoyar ciertos mensajes, compartirlos, seguir a gente) en el que todo queda grabado y, por tanto, sobre el que es posible realizar análisis en profundidad. Además, se puede observar en tiempo real.

A diferencia de los análisis convencionales, como las encuestas, el de redes sociales aporta muchas más dimensiones. Por ejemplo, es posible “ver cómo la gente interactúa entre sí, formando conversaciones o como se ven afectados cuando una persona influyente manda un mensaje”.

¿Se puede medir el pesimismo u optimismo de un texto?

Se puede, pero es complejo. Entrenar modelos de análisis de texto para que detecte patrones de optimismo o pesimismo es y ha sido extraordinariamente difícil —Dot CSV realiza un recorrido histórico por estos modelos—, en parte debido a ‘falsos positivos’, como un texto aparentemente positivo pero irónico:

“Qué feliz soy ahora que puedo aplaudir desde mi ventana a un estupendo patio interior en lugar de pasear por la calle”

O mensajes aparentemente negativos pero que se enmarcan dentro de un cuadro de optimismo:

“La pandemia es lo peor que me ha pasado en la vida, pero saldré mejor persona de esto”

¿Cómo puede entonces medirse el optimismo? Una forma de aproximarse al concepto es cómo “el optimismo y el pesimismo reflejan también una idea de futuro y una tendencia”. El optimismo no es tanto un mensaje positivo como la esperanza de un futuro ídem, incluso cuando el presente no lo es.

Con el objetivo de eliminar el ruido derivado del significado de palabras sin analizar su contexto completo esta investigación, los investigadores han “buscado estos tweets manualmente” y, después, “pusimos en común los tweets anotados e hicimos un consenso sobre cuáles deberían entrar para el entrenamiento de los modelos”.

¿Cómo han entrenado los modelos de deep learning?

En el primer modelo, que obtuvo los mejores resultados, se usó como embedding (castellanizado como ‘incrustación’, una representación vectorial de las palabras) “un modelo preentrenado con el corpus de la Wikipedia y Google Books facilitado por Google”. Una vez convertido el texto en embeddings, se conecta a una arquitectura, en este caso una LSTM, que es “la red neuronal encargada de crear la clasificación”.

Los datos fueron analizados también mediante un método algo más clásico que usaba TF-IDF en lugar de embedding, así como machine learning clásico, aunque los resultados no fueron tan buenos. En ambos casos, se estudió la profundidad de las conversaciones, es decir, cómo de largas eran las cadenas de tuits.

Del primer modelo destaca su capacidad para “predecir si un tweet era pesimista o no lo era y el otro si era optimista o no”. Además, permitió añadir una dimensión más a la investigación: “reconstruir y analizar las conversaciones completas” y, a la vez, “analizar el impacto que tenían mensajes optimistas en una conversación pesimista, y viceversa”.

Entre las conclusiones, destaca que “las conversaciones optimistas suelen ser menos comunes y menos participativas” y, al tiempo, que “los usuarios polarizados claramente en el pesimismo tienden a tener poca influencia”. Aquellos usuarios con influencia demostrada “suelen ser bastante participativos y más volátiles en su sentimiento”. Están menos polarizados.

¿Por qué es importante investigar estos mensajes?

Extraer conocimiento, a menudo en tiempo real, de entornos como Twitter (y, en general, cualquier otra red social masiva), puede usarse “para adaptar mejor los planes de gestión de crisis a las necesidades y preocupaciones expresadas por la población a medida que una crisis evoluciona”. Se trata de una herramienta de análisis que tiene utilidad en “vigilancia y gestión de pandemias”.

Con estas funcionalidades es posible una contextualización social de estas emociones, así como ser capaces de comprender “las necesidades y preocupaciones expresadas por la población a medida que la crisis evoluciona”. Son, a falta de palabras más precisas, una forma de medir el pulso a la población. Al menos dentro de estos entornos.

Este estudio ha sido financiado por MCIN/AEI/ 10.13039/501100011033 en el marco del proyecto CURMIS4th (Beca PID2020–113673RB-I00), de la Consellería de Educación, Universidades e Formación Profesional (Xunta de Galicia) en el marco de la financiación estratégica de ED431C2018/55-GRC Grupo de Referencia Competitivo, el “Centro singular de investigación de Galicia” (acreditación 2019-2022) y la Unión Europea (Fondo Europeo de Desarrollo Regional - FEDER)- Ref. ED431G2019/06, y la Fundación Portuguesa para la Ciencia y la Tecnología (FCT) en el marco de la financiación estratégica de la unidad UIDB/04469/2020. El grupo SING agradece al CITI (Centro de Investigación, Transferencia e Innovación) de la Universidad de Vigo por albergar su infraestructura informática. Financiación del cargo de acceso abierto: Universidad de Vigo/CISUG.

Guillermo Blanco, Anália Lourenço, Optimism and pessimism analysis using deep learning on COVID-19 related twitter conversations, Information Processing & Management, Volume 59, Issue 3, 2022, 102918, ISSN 0306-4573.

https://doi.org/10.1016/j.ipm.2022.102918

Volver