¿Puede Internet predecir el futuro?

to Reuters
Descargar el Economist Intelligence Unit
Periódico La Jornada
Martes 21 de junio de 2011, p. 28

Un día de 2008 un tuitero anónimo puso un mensaje: "No estoy nada aburrido. ¡Muy ocupado! ¡Me siento fantástico!" Qué bueno, pensaría uno, pero sin ningún interés para nadie que no sea el autor y acaso algunos amigos suyos. No es así, según Johan Bollen, de la Universidad de Indiana en Bloomington, quien guardó ese tuit junto con muchos otros enviados ese día, clasificados según su contenido emocional. Muchos eran igual de radiantes, con altos grados de confianza, energía y felicidad. De hecho, recuerda Bollen, el día que ese tuit fue publicado, el estado de ánimo colectivo en EU se elevó un tanto. Cuando el científico y su equipo examinaron los datos del otoño y el invierno de 2008, hallaron que el estado de ánimo colectivo fluctúa según los acontecimientos nacionales. Por ejemplo, la felicidad crece alrededor de los días feriados.

La idea de recabar datos basados en la red para construir una medición en tiempo real de las emociones y preferencias de los usuarios no es nueva. Tampoco la de usar esos resultados para predecir su conducta. El interés en la predicción por Internet surgió a raíz de un documento publicado en 2009 por Hal Varian, jefe de economistas de Google. Varian descubrió que los picos y descensos en el volumen de búsquedas de ciertos productos y servicios en Google, como autos y vacaciones, preceden a las fluctuaciones en las ventas de esos bienes. Otros investigadores han mostrado que las búsquedas de términos relativos al empleo sirven para predecir las tasas de desempleo y que las menciones de candidatos políticos en Twitter se relacionan con los resultados electorales.

Bollen encontró otra curiosa correlación. Al comparar tendencias en el estado de ánimo nacional con movimientos en el promedio industrial Dow Jones, notó que los cambios en la ansiedad, uno de los siete componentes de la medición del estado de ánimo, predecían variaciones en el índice de precios de acciones. Los saltos en los niveles de ansiedad venían seguidos, unos tres días después, por caídas en el precio de las acciones. No está claro por qué ocurre así, pero una posible explicación es que el descenso es causado por la tendencia de los operadores de bolsa a abandonar posiciones riesgosas si se sienten ahorcados.

El algoritmo del doctor Bollen, que describió en un documento publicado en febrero pasado en la revista Journal of Computational Science, ha sido concedido mediante licencia a la firma londinense de capitales de riesgo Derwent Capital Markets. Derwent lo usará para guiar inversiones hechas con un fondo de 41 mdd que espera lanzar en los próximos meses. Corre el rumor de que otras firmas ya se valen de trucos similares. WiseWindow, empresa de mercadeo en Irvine, California, utiliza la actividad de los medios sociales para predecir la demanda de ciertos productos. Entre sus clientes están Paramount Pictures y Belkin, fabricante de artículos electrónicos de consumo.

Todas estas iniciativas enfrentan un problema. Los humanos son expertos en extraer significado y sentimiento hasta de los más ínfimos fragmentos de texto, tarea que resulta formidable para las máquinas. Para una computadora, un tuit que dice "Feliz luego de mi visita al dentista. Sí, cómo no", indica que el autor ha ido al dentista y ahora está feliz. En fechas recientes los investigadores han avanzado algo en enseñar a las máquinas a reconocer tal sarcasmo, así como dobles sentidos y referencias culturales. En febrero, Watson, una supercomputadora inventada por IBM, arrolló a dos campeones humanos en Jeopardy!, programa estadunidense de concurso que es renombrado porque sus pistas están cargadas de ambigüedades, ironías, acertijos y retruécanos. Pero, en su mayor parte, procesar el lenguaje natural sigue siendo un reto.

Luego está la cuestión de cómo se comparan los nuevos métodos con otros ya existentes. Duncan Watts, investigador de Internet que dirige uno de los dos laboratorios de investigación de Yahoo en Nueva York, gusta de citar el ejemplo de los pronósticos del tiempo en Santa Fe, Nuevo México. Un pronóstico que prediga sol radiante todos los días acertará 80% de las veces, bromea. No serviría de nada, pues los pobladores locales saben que la ciudad tiene unos 300 días de sol cada año. En otras palabras, para ser útil una técnica predictiva debe añadir algo a lo ya sabido.

Es difícil saber si esto ocurre en las finanzas, pues los fondos de capital de riesgo tienden a no revelar el éxito que pueda tener (o no) un algoritmo de predicción en particular. Así, el doctor Watts buscó en campos en los que existen ciertos datos disponibles al público, como la recaudación en taquilla de una película o las ventas de música o juegos de video. Por ejemplo, se puede vaticinar el desempeño de una cinta en taquilla con base en fragmentos de datos previamente agregados: su presupuesto de producción, el número de pantallas en las que abre y de participantes en las apuestas de HSX, sitio web que acepta apuestas de personas en relación con los ingresos de las películas. Watts halló que añadir datos de búsquedas en Internet al modelo no produce ninguna mejoría.

En cambio, los métodos ligados a búsquedas dieron mejor resultado al predecir ventas de juegos de video, en los que existen sólo dos tipos de información disponible al público: calificaciones en reseñas y, si el juego es una secuela, cifras de ventas de su predecesor. Los modelos de predicción que añadieron datos de búsquedas a la mezcla fueron mucho más precisos que los que no. Igual ocurrió con la música, otro campo en el que la información previa es escasa.

Watts cree que las predicciones por volumen de búsquedas ayudarán a detectar tendencias de consumo de este tipo con cada vez mayor precisión. Pero las mejoras que aporten serán progresivas. En contraste, los métodos avanzados, basados en el análisis del lenguaje natural en los tuits, los blogs o Facebook, tienen mayor potencial de producir cambios. A medida que los usuarios de medios sociales se acostumbren a compartir información altamente personal, sin que al parecer les preocupe que firmas de investigación de mercado como WiseWindow sigan todos sus pasos, los sentimientos e intenciones de cientos de millones de personas estarán allí para que los observen computadoras hambrientas de datos. Y, gracias al doctor Bollen, se vuelven cada vez más legibles.

Fuente: EIU

Traducción de texto: Jorge Anaya
Fuente

Comentarios