Ad verba per numeros


Tuesday, May 17, 2011, 11:32 PM
Aviso: Este post se sale un poco de la línea habitual del blog: en primer lugar está en castellano y suelo escribir en globish; en segundo, es una transcripción/adaptación de una charla, cosa que hasta ahora no había hecho y de la que no estoy muy seguro de cómo quedará; por último, la temática es "ligera" y más cercana a la "opinión" que a la divulgación pero el objetivo era agitar a la audiencia un poco y animar al debate.

Por lo que respecta a las transparencias no son tan autocontenidas como otras de mis presentaciones en Slideshare así que es probable que leer el post ayude a entenderlas.

Por cierto, la charla la impartí en el X Congreso Ciberciudadano celebrado hoy en Oviedo.


Y ya, sin más preámbulos, la entrada:

Las redes sociales online se han desarrollado de manera extraordinaria y no sólo por el número de servicios disponibles (que es enorme) sino, y sobre todo, por el número de usuarios que las utilizan y por la cantidad de contenidos que se publican en las mismas.

Tal vez parte de su éxito radique en que ofrecen algo para todo el mundo. Para el público en general, para las marcas, para los medios de comunicación, para los famosos, para los publicistas, para los spammers, incluso para los investigadores. Sin embargo, es ese grueso de usuarios anónimos el que me interesa hoy puesto que, de no ser por ellos, esa pirámide de los medios sociales no se sostendría ni tendría interés para el resto de grupos.

Así pues, ¿qué ofrecen las redes sociales online al usuario promedio?

Conectar

La funcionalidad más inmediata y obvia es la de conectar. Conectar con amigos o con familia y así estrechar lazos o redescubrir vínculos hace tiempo olvidados. Lazos que se estrechan y vínculos que se redescubren gracias, cómo no, a vivencias que se comparten a través de fotos, videos, mensajes y comentarios.

Alguien entre el público comentó la utilidad de las redes para encontrar pareja aunque él no lo llamó así; lamentablemente, no había contado con ese punto de vista para la charla y también lo debo dejar fuera del post (para otra ocasión).

Por supuesto, además de redes para conectar y relacionarnos con amigos y parientes existen otras con una orientación más profesional. Redes en las cuales dar a conocer nuestro perfil laboral, nuestra experiencia, buscar y establecer contactos. El networking de toda la vida pero 2.0...

Comunicar

La segunda funcionalidad evidente de las redes sociales (sobre todo en algunas como Twitter) es comunicarse, expresarse, dejar por escrito nuestros sentimientos, emociones u opiniones.

Sin embargo, que esa sea una funcionalidad básica y ampliamente usada no significa que todos los usuarios publiquen de manera extensa; es más, muchos usuarios (la mayoría, de hecho) se sienten cómodos publicando poco (incluso nada) y consumiendo la información que producen otros (ver, por ejemplo, [1] o [2]). Dicho de otro modo, las redes sociales pueden ser un medio de comunicación pero muchos usuarios lo usan no para comunicar-se sino para informar-se.

Algunos ejemplos de temas de actualidad que pudieron seguirse por Twitter fueron la revolución egipcia de 2011 (#egypt); la campaña para la liberación de Manu Brabo (#freemanubrabo) que, por cierto, aún sigue retenido en Libia; o las concentraciones ciudadanas del 15 de mayo (#15m y #15mani).

Los dos últimos son, además, ejemplos no sólo de temas informativos sino de actos organizados parcial o totalmente utilizando medios sociales.

Descubrir

En relación con esto uno podría preguntarse cómo enterarse de lo que se "cuece" en la red social en caso de que nuestros contactos no estén tampoco enterados.

¡Los "trending topics"! Diréis algunos. Sí, claro, pero, ¿qué son los trending topics? O, mejor, ¿qué funcionalidad sirven y qué otras formas hay de satisfacer dicha funcionalidad?

Me estoy refiriendo a la capacidad de "descubrir" nueva información (o información oculta) entre la cantidad ingente de datos que los usuarios publican en las redes sociales y sí, los trending topics son una forma de lograr descubrir esa información.

Los trending topics (o temas populares) son, como su nombre indica, temas que están "de moda" en un momento dado. Es decir, los usuarios están mencionándolos de manera frecuente y, en consecuencia, son probablemente interesantes y en algunos casos actualidad informativa.

Ni que decir tiene, no es un problema trivial detectar de manera automática que algo es un tema popular. Pensemos que no basta con mostrar los más frecuentes puesto que es más que probable que existan temas de los que se hable a diario; en este sentido resulta curioso el hecho de que Twitter modificase su algoritmo de detección de trending topics para evitar, entre otras cosas, que Justin Bieber fuese un trending topic "peremne" (ver, por ejemplo, [3]).

De hecho, el algoritmo actual es bastante más útil y permite enterarse en tiempo casi real de la mayor parte de los eventos dignos de mención sin necesidad de recurrir a los medios de información tradicionales. Un ejemplo muy reciente en España es el de #acampadasol.

Y ya aquí hay que empezar a hacer advertencias. Los trending topics no son más que el resultado de un algoritmo cuyos resultados son, probablemente, editados antes de aparecer en la página de Twitter. Con un algoritmo diferente los resultados deberían ser diferentes, ni mejores ni peores pero sí distintos y el cuadro que pintarían de la actualidad podría cambiar bastante.

A modo de ejercicio implementé hace unos meses una visualización de temas populares en España (sólo península). Ciertamente sólo utilizo una muestra irrisoria de los datos de Twitter y sólo los de usuarios geolocalizados para Twitter mientras que Twitter puede emplear todos los tweets (el famoso firehose) además de geolocalizar por dirección IP (ignoro si lo hacen pero yo lo haría si tuviese las IPs :) ¿Puede eso explicar las diferencias? No lo sé pero me inclino a pensar que, o bien el algoritmo de Twitter es muy diferente al mío, o bien los resultados están fuertemente editados, o bien da más importancia a menciones de personas.

En el momento de escribir esta entrada (las 22:11 del 17 de mayo) estos son los 10 primeros trending topics que ofrece mi sistema:


#acampadasol
#nonosvamos
#spanishrevolution
sol
#nolesvotes
#democraciarealya
#yeswecamp
#acampadabcn
#15m
#diadeinternet
Mientras que Twitter ofrece:

L.A. Noire (promocionado)
#nonosvamos
#yeswecamp
#cineturmix
Talavante
Lisa Edelstein
Encarnación
Cuddy
Strauss-Kahn
RNE
Algunos coinciden pero algunas ausencias son llamativas (p.ej. que #diadeinternet no haya sido trending topic el Día de Internet) o presencias como Lisa Edelstein o Cuddy (actriz y personaje que representa en House M.D.) y que aparecen en mis datos pero mucho, mucho, mucho más abajo).

En resumen, los trending topics permiten descubrir eventos y actos e incluso dan ciertas posibilidades de visibilidad y organización a los usuarios pero no son la verdad absoluta (como tampoco la son mis trending topics).

Ya para terminar con los trending topics apuntaré una cuestión que surgió durante la pausa para el café y que comenté con David Maeztu (dijo que le daría una pensada): ¿sería legal que apareciesen consignas de voto en los trending topics durante la jornada de reflexión? En teoría, Twitter poco podría hacer para evitarlo (si es cierto que no filtra los temas populares) pero, ¿qué consideración legal tendría que apareciese en un sitio web algo como #nolesvotes o #votapsoe o #votapp?

Aún más interesante, desde mi punto de vista, es la posibilidad que ofrecen las redes sociales online para potenciar mecanismos que ya se dan en las redes sociales offline. Por ejemplo para que surjan y evolucionen rumores.

En este punto hay que señalar que un rumor NO es un cotilleo, o un chisme, o una difamación. Un rumor es, en traducción libre de DiFonzo y Bordia:

Una información relevante aunque no verificada que aparece y circula en contextos de ambigüedad, peligro o amenaza potencial y que permite a la gente dotar de sentido a la situación y gestionar los riesgos.

Ni que decir tiene que Twitter es un campo de cultivo ideal para los rumores y recientemente hubo un ejemplo "de libro" al respecto. Me estoy refiriendo al hecho de que el 1 de mayo muchos usuarios de Twitter estuvieran razonablemente seguros que un comunicado programado de Barack Obama iba a versar sobre la muerte de Osama Bin-Laden.

Se podrían decir muchas cosas al respecto pero ninguna mejor que las que ya dijeron los investigadores que estudiaron el suceso así que os recomiendo que leáis "Breaking Bin Laden: visualizing the power of a single tweet".

No podría terminarse esta sección dedicada al descubrimiento de información mediante la explotación de redes sociales sin mencionar las distintas iniciativas para "predecir el futuro" con Twitter. Sí, tal cual suena: se han realizado estudios que muestran cómo las conversaciones en Twitter pueden servir para predecir los ingresos de una película, las ventas de un videojuego ([4]) o, incluso, la marcha del mercado de valores ([5]). Si todo esto parece extraño más extraño puede resultar que haya quien esté dispuesto a invertir realmente en base a estos hallazgos (véase [6]).

Por falta de tiempo no pude profundizar demasiado en este tema aunque es algo que me interesa profundamente; en particular, en relación con su aplicación a la predicción electoral. He de decir, sin embargo, que mi investigación al respecto hace que sea excéptico en cuanto a la viabilidad de semejantes sistemas de predicción (véase [7], [8] y [9])

Monetización

Y llegados a este punto surge la cuestión pecuniaria, crematística, la pasta, vamos. ¿Cómo diantres ganan dinero las redes sociales? Porque los usuarios no pagan un real por usarlas...

Muy sencillo, los usuarios que, como ha quedado claro, no son clientes de las redes sociales son el producto que éstas venden. Sí, nos están vendiendo. Nuestros contenidos a granel para su posterior destilación y nuestros perfiles convenientemente "loncheados" para fines publicitarios.

Porque si algo está claro es que aunque no vayamos a pagar por usar las redes sociales sí estamos dispuestos a pagar por otros bienes o servicios y si hay algo que vender hay publicidad que hacer.

Puede argumentarse que los usuarios han desarrollado una "ceguera selectiva" para la publicidad y eso es, básicamente, cierto, razón por la cual es preciso adaptar la publicidad a las características del usuario como ilustran algunos de los siguientes anuncios en Facebook.

Se apuntó desde el público que los anuncios parecían bastante básicos (zapatos y bolsos para mujeres, coches y productos de electrónica de consumo para hombres) y sí, lo son. Pero segmentar por sexo ya es un comienzo y, por otro lado, aún estamos en las primeras fases. A los lectores interesados en el marketing online les recomiendo encarecidamente que visiten la página de Microsoft adCenter Labs.

Ni que decir tiene que los anuncios deben seleccionarse automáticamente y para lograr una asignación razonable (es decir, que maximice la probabilidad de click por parte del usuario) hay que recurrir a técnicas de minería de datos, aprendizaje automático y otras.

Filtrar

Todas esas técnicas no son únicamente aplicables a la recomendación de anuncios sino que pueden aplicarse a cuestiones muy diversas que encuadraremos bajo el epígrafe de "filtrado".

Un filtro interesante es el que nos permita encontrar "expertos" en algún tema dado. Por ejemplo, usuarios que habitualmente discutan sobre recuperación de información en Twitter o expertos en Web Mining en Linkedin.

Claro está, si se puede encontrar usuarios expertos en un tema tal vez se pueda filtrar o segmentar usuarios por otros criterios como edad, raza, preferencia política u orientación sexual. Sin embargo, nadie en su sano juicio haría tal cosa ¿verdad?

Pues lo cierto es que sí, se han llevado a cabo investigaciones que demuestran que es posible determinar la orientación sexual de un usuario a partir de sus conocidos en Facebook, o su perfil psicológico, o rasgos como su raza, orientación política o creencia religiosa.

La última investigación mencionada es mía y le di bastantes vueltas antes de pasarse al "lado oscuro", más detalles en un post anterior.

Podría uno pensar que aunque esto se haga tan sólo es el trabajo de unos cuantos "científicos locos" pero, ¿es así? ¿Podemos estar seguros de que los operadores de redes sociales no estén haciendo algo parecido?

Lamentablemente parece que Facebook permitió (tal vez no de manera deliberada) que anunciantes fuesen capaces de determinar si usuarios del sitio eran gays en base a anuncios que se les ofrecieron y sin conocimiento de esos usuarios. Más información en [10] y [11].

Dicho de otro modo, el "dime con quién andas y te diré quién eres" sigue más vivo que nunca solo que ahora puede automatizarse y los usuarios le damos información detallada sobre contactos, lugares y horas.

Vigilar

Adentrándonos aún más en el lado oscuro llegamos a las facilidades que ofrecen las redes sociales para vigilar la aparición de determinados contenidos. Obviamente tiene una utilidad legítima muy interesante como vigilar las menciones que se hacen de una empresa, marca, producto o servicio y determinar si son opiniones positivas o negativas y si precisan de una respuesta aclaratoria.

En este sentido está claro que en muchas ocasiones una respuesta rápida es imprescindible puesto que las redes sociales online tienen una gran capacidad para la magnificación y la única forma de responder rápidamente es mediante algún sistema que alerte de manera automática.

Por supuesto, si es posible vigilar qué se dice sobre una celebridad es posible vigilar cualquier otro tema y almacenar información sobre los usuarios que opinan sobre ese tema, qué opinaron, cuándo lo opinaron y con quién se relacionaron.

Dicho de otro modo, la aplicación de un estado policial en Internet es viable y hay gobiernos de todo tipo y color que parecen encontrar atractiva la idea ([12] o [13]) con resultados "chocantes" como el del usuario que, a raíz de una broma en Twitter, fue detenido en aplicación de una ley antiterrorista.

Manipular

Así pues, los usuarios están expuestos por sus contactos y por sus contenidos pero, además, la información que consumen en los medios sociales es manipulable. Al ser contenidos generados por usuarios muchos no están contrastados y pueden ser falaces o no totalmente ciertos. La credibilidad es un problema y se está trabajando en formas automáticas de evaluarla (ver, por ejemplo, "Information Credibility on Twitter").

Pero el mayor problema no es ese sino la capacidad que ofrecen las redes sociales para que individuos u organizaciones maliciosas desinformen. De hecho, hay estudios que muestran cómo se ha utilizado Twitter para orquestar campañas de desinformación dirigidas contra adversarios políticos ("From Obscurity to Prominence in Minutes: Political Speech and Real-Time Search") y hay empresas que desarrollan sistemas para disponer de "marionetas" en redes sociales que permitan simular múltiples individuos para difundir desinformación y dar la impresión de ser grupos espontáneos ([14] y [15]).

¿El fin de la privacidad?

El cuadro que he pintado es, cuando menos, preocupante pero no pretendo alarmar, ni estigmatizar la tecnología. Las redes sociales no son el problema, su mal uso es el problema.

Así pues, ¿qué podemos hacer como usuarios?

  • Comprender cómo funcionan los mecanismos de privacidad,
  • mantener una profilaxis en cuanto a los contenidos que se publican (p.ej. fotos personales, familiares, niños, etc.) y las relaciones que se establecen (en particular con desconocidos).
  • Conocer nuestros derechos y exigir que se aplique la legislación vigente (LOPD).
  • Y, por supuesto, aplicar el sentido común. La tecnología es nueva pero el comportamiento humano no: siempre se ha vigilado, etiquetado y manipulado.
Y eso es todo amigos. Como de costumbre, podéis contactarme en Twitter @PFCdgayo para cualquier comentario o sugerencia sobre el post.



Back Next