140 y más 140 y más

"It's the end of the world as we know it (and I feel fine)" Michael Stipe

Entradas etiquetadas como ‘T-hoarder’

Conversaciones en Twitter: ¿un barómetro social?

Me he quedado muchas veces con las ganas de asistir a mesas redondas, ponencias o debates en los que han intervenido gente como Mariluz Congosto o Mar Cabra. Interesantes profesionales con interesantes cosas que contar sobre los datos, su análisis, la información y el periodismo. Algún día lo haré.

Mientras tanto, y aprovechando las últimas novedades, decidí llamar a la primera para que me contara qué está haciendo exactamente con una herramienta llamada t-hoarder, que nos lanza tres veces al día tuits como este:

 

Congosto es investigadora independiente, estudia «la información basada en las relaciones» y está llevando a cabo desde principios de año varios experimentos para su tesis doctoral -antes hizo algunos más- sobre monitorización de tuits y estudio de conversaciones en Twitter acerca temas de relevancia social, a saber, Bankia, Urdangarín, los recortes del Gobierno, etc.

Hace unos días decidió integrarlos todos en un mismo panel (t-hoarder), que se actualiza automáticamente cada hora, y observar su comportamiento de forma solapada en el tiempo.

Explicado de forma más sencilla: se escoge un tema de actualidad «candente», se seleccionan hashtags de Twitter relacionados con él, se cuentan los usuarios únicos y nuevos -diarios- que hablan del asunto, las palabras más relevantes que utilizan, los usuarios más mencionados, los más activos, etc. Todo eso se almacena y se sigue en el tiempo, se monitoriza. Y ya tenemos un experimento en el que se puede profundizar a través de gráficas interactivas que ofrecen información en función de los contenidos, la participación y los usuarios.

Gráficas experimento Urdangarin

El experimento más longevo activo -la conversación seguida durante más tiempo por Congosto- es sobre Reforma laboral y recortes: 170 días; el más joven, la prima de riesgo, tiene 12 días de vida. Los experimentos Urdangarin, Aniversario 15M y Bankia completan el panel t-hoarder, que la investigadora ha creado para que se vean todos los proyectos juntos y pueda apreciarse, por comparación, de qué habla más la gente en un día concreto.

Todo esto lo hace gracias a las APIs de Twitter: Search, Streaming y Rest, aunque esta última, que da información usuario-usuario, no la usa demasiado.

Los usuarios seguimos lo más comentado en Twitter a través de los llamados trending topics, que «miden muchas cosas, muchas de ellas muy relevantes», explica Congosto, pero que se olvidan de temas que llevan mucho tiempo en el candelero para dar paso a otros nuevos. «Te sale Justin Bieber y pierdes de vista la actualidad», dice, añadiendo que una monitorización como la que ella hace «sirve de alguna manera para ver cuándo las cosas se despiertan y cuándo se apagan». Queda, además, un registro histórico, un twitterline.

Por supuesto, las posibilidades son infinitas. Se puede estudiar si los usuarios hablan en positivo o negativo de algo y qué tipo de sentimientos expresan; o se pueden «sacar los grafos de qué comunidades se forman».

Esto ya lo ha hecho, aunque aún no lo ha publicado. Y algunas de las conclusiones son, por ejemplo, que la conversación sobre los recortes está dirigida de alguna manera por «plataformas, partidos políticos y sindicatos» y la de Urdangarin por la prensa y usuarios anónimos que dan su opinión, incluidos los «personajes graciosos» que aportan ironía y humor.

El componente sociológico es grande, «va más allá del dato puro», aunque hay que dejar claro que no es representativo de la sociedad. «En Twitter no estamos representados igual los hombres que las mujeres», la edad de la mayoría de los tuiteros se sitúa en una horquilla determinada y «el nivel de estudios es medio alto». No es representativo, por mucho que a veces los medios nos empeñemos en ello (autocrítica on)…

Por eso no es posible, entre otras cosas, hacer una predicción de resultados electorales usando datos de Twitter, añade Congosto. A pesar de todo esto, asegura, la red social «sí te da una medida de cuál es la opinión de un grupo concreto de personas, gente bien informada». Más o menos, una cierta élite.

Twitterline 2012

¿Y qué hay de las restricciones de Twitter? Porque este es un aspecto que suele dar muchos problemas, aunque solo quieras buscar información.

«Twitter nunca te lo da todo, pero te lo da de una manera estadística y siempre igual, te da una muestra sin sesgo. El todo es relativo, pero la medida es buena», dice Congosto. Uno de los límites de la red social es el de los «50 tuits por segundo», que provoca una saturación cuando lo comentado es, por ejemplo, «un evento deportivo». Se publican tantos comentarios que al buscarlos después Twitter solo te muestra, como máximo, 50 por segundo, no más. Y «pierdes mucha información».

Pero cuando no se llega a esa cifra «el porcentaje que te da a lo mejor es el 80%«. En cualquier caso, explica, «hay mucha gente haciendo artículos científicos sobre Twitter y se basan en las capturas de datos por streaming o por search dándolos por buenos».

Algunos números: el pasado 11 de julio, cuando el presidente del Gobierno anunció su gran paquete de recortes, hubo un pico de más de 123.000 personas comentando el tema en Twitter, «una barbaridad». Según Congosto, en el momento más álgido del 15-M en 2011 la cifra fue de 65.000, aproximadamente. Todo sigue siendo relativo. «Estadísticamente hay mucho por hacer, esto no es el CIS, pero sí es como un barómetro, un barómetro de cierta sociedad española», comenta.

Una última pregunta sobre los datos y las dificultades para obtenerlos. En general, pero sobre todo en relación a la Administración pública. Congosto, prudente, expresa un deseo: «Tendrían que ir hacia un modelo tipo API, pero lo veo lejos»…