Data drives all we do…and think

Los antecedentes

En mayo de 1942, Isaac Asimov logra que Hugo Campbell publique en Astounding Science Fiction el primero de cuatro cuentos cortos que luego se transformarían en la primer novela de la trilogía «Fundación». Allí Hari Sheldon crea la Psicohistoria. Una ciencia ficticia que, mediante el análisis de la historia, la sociología y el uso de estadísticas y complejas matrices matemáticas logra predecir (y en consecuencia manipular) el comportamiento de las masas sociales del Imperio Galáctico.

¿Les suena conocido? En todo caso el sueño dorado de cualquier político. Por milenios los gobernantes de todo tipo y calaña ya sean jefes de tribu, brujos, reyes, emperadores, presidentes o dictadores – y los aspirantes a serlo aún en mayor medida – han sabido que no hay mejor forma de mentir que decir lo que el otro quiere oír. Y así lo han hecho, basados solamente en su olfato e intuición. ¿Lo más sofisticado? Segmentar a su público demográficamente y dar un discurso distinto a cada etnia, religión, sexo, clase social y económica. Y, por supuesto besar bebés. Siempre funcionó bastante bien. Pero cuando la ciencia y la tecnología vienen en su ayuda, lo que era un truco de vendedores de feria de aceite de serpiente, humo y espejos, se transforma en algo mucho más ominoso.

En 1884, Sir Francis Galton comienza a investigar si es posible lograr una taxonomía exhaustiva de la personalidad humana mediante el análisis del lenguaje y llama a esto la hipótesis léxica. La investigación en esta área continúa a través de dos siglos y muchos catedráticos, desembocando en los 80 en lo que es llamado coloquialmente los Big Five. En este método -standard de facto- los múltiples rasgos de personalidad son agrupados en cinco grandes clases y esto permite una descripción asombrosamente detallada de la personalidad de un individuo y su clasificación en modelos de conducta.

¿Es esto Psicohistoria? Muy probablemente no. Pero es interesante notar que lo que marcó la primera revolución en este campo fué que los científicos abandonaron el intento de predecir la conducta de un individuo aislado y, mediante el estudio de grandes cantidades de datos de perfiles (no se llamaba Big Data en esa época), comenzaron a intentar predecir la conducta de una masa social. Y funcionó. Le hubieran preguntado a Asimov…que basó la Psicohistoria en las leyes de los gases. La conducta de una sola molécula de gas es imprevisible, pero aplicando estadísticas la conducta de un volumen de gas es absolutamente determinable…Los genios son incomprendidos, hasta que los escuchamos.

Los protagonistas y la historia

En el 2008, Michal Kosinski estaba terminando un máster en Psicología Social en Varsovia cuando supo que era aceptado para hacer un doctorado en el Centro de Psicometría en la Universidad de Cambridge, uno de los más antiguos y prestigiosos en la materia. El polaco se unió allí a David Stillwell que, un año antes, había comenzado el proyecto MyPersonality, una app que se volvió viral en Facebook.

MyPersonality, basada en el standard de los Big Five, permitía a los usuarios tomar test psicométricos profesionales con el único costo de permitir registrar sus datos. Los usuarios recibían después un informe con el perfil de su personalidad. Si bien Kosinski y Stillwell esperaban recopilar unos pocos cientos de perfiles la respuesta fué abrumadora, 70.000 interesados solo al principio. Al día de hoy, los datos de más de 6.000.000 de tests, junto con los de 4.000.000 de usuarios de FB están aún allí disponibles para ser descargados. Procesados y anonimizados, como debe ser.

¿Y que tan precisos son esos perfiles? El secreto está en los «likes». En 2012, Kosinski demostró que con 68 «likes» podía predecir el color de una persona con un 95% de precisión, su orientación sexual con el 88% y su orientación política con un 85%. Adicionalmente y en grados diversos podía decir si la persona consumía drogas o alcohol, deducir sus creencias religiosas y aún si sus padres estaban separados.

El modelo se siguió perfeccionando a medida que la cantidad de datos disponibles aumentaba. Los «likes» ofrecen un dato más preciso que una encuesta, la respuesta está menos condicionada y es más veraz. En una encuesta el sujeto tiende a presentarse mejor de lo que es, en un «like» obedece a sus impulsos. Se revelan patrones cuyas motivaciones ocultas escapan aún a los psicólogos y sociólogos. Ejemplo: a las personas que «likean» ‘I hate Israel’ tambén les gusta ‘Nike’ y ‘KitKats’…(?!) Muy probablemente el algoritmo puede saber de un individuo cosas que él mismo ignora.

Kosinski afirma que con solo 10 «likes» el algoritmo puede conocer a una persona mejor que sus compañeros de trabajo, con 150 mejor que sus padres y con 300 mejor que su pareja. El mismo día que hace estas afirmaciones recibe dos llamadas de facebook, una para demandarlo, otra para contratarlo. Una semana después, los «like» en Facebook pasan a ser privados por defecto…

En el 2014, Aleksandr Kogan se acerca a Kosinski en Cambridge y le expresa su interés en acceder a la información de MyPersonality y el modelo subyacente en nombre de «una empresa» cuyo nombre y propósitos no podía revelar. Kosinski duda al principio. Al final Kogan revela que la empresa es SCL – Strategic Communication Laboratory. Una rápida busqueda en Google da como resultado un slogan: «[Somos] la principal agencia de gestión electoral». Una empresa de marketing basada en modelos psicológicos cuyos objetivos incluían «Influenciar en elecciones». El polaco empieza a darse cuenta de la potencialidad – y el peligro inherente – de su algoritmo y algo le huele mal en la propuesta de Kogan. En realidad Kogan había fundado una empresa llamada Global Science Research (GSR) que trabajaba o pretendía trabajar para SCL. Finalmente (según sus últimas declaraciones, hay pruebas en contrario) Kosinski desecha la propuesta, corta todo vínculo con Kogan e informa al director del instituto de Cambridge. Se genera un conflicto ético que termina con Kogan mudándose a Singapur con el nombre de Dr Spectre y Kosinski mudándose a USA con un trabajo en Stanford.

¿Y que es SCL? Una empresa británica. La casa matriz de un conglomerado de compañías con una compleja estructura corporativa. Un contratista para gobiernos en operaciones de defensa y elecciones (?!) El vínculo entre estos aparentemente tan diferentes rubros son las «operaciones psicológicas» o «psyops», un conjunto de técnicas que incluye rumores, desinformación y noticias falsas. Aparentemente algunas de sus ramas han estado involucradas en derrocamiento de gobiernos del tercer mundo, manipulación psicológica en Afganistán a solicitud de la OTAN…sigo? Obviamente quienes son sus verdaderos dueños es, y probablemente seguirá siendo un misterio, aunque los Panamá Papers han dado algunas pistas. SCL Elections, una de sus ramas, ha participado en más de 200 elecciones alrededor del mundo, la mayoría en países subdesarrollados. Internamente sus empleados la llaman «MI6 for hire».

En el 2012, Alexander Nix – CEO de SCL Elections en ese momento – le hace a Christoper Wylie – un prospecto a la fecha – una oferta imposible de rechazar:

«Te daremos total libertad. Experimenta. Prueba tus ideas más locas».

En el otoño del 2013, en la sede de SCL en Mayfair-Londres Wylie es presentado a Stephen Bannon quien a su vez lo lleva a USA a conocer a Robert Mercer (pionero en AI y uno de los primeros creadores de los algoritmos de trading. El primero director y el segundo, dueño de Breitbart News comparten ideologías políticas de extrema derecha. Hablan de una investigación del Centro de Psicometría de Cambridge cuyo paper se titula «Computer-based personality judgements are more accurate than those made by humans» y cuyos autores son… Wu Youyou, Michal Kosinski y David Stilwell. Mercer queda fascinado por la idea, la posibilidad de segmentar un electorado y hacer un discurso personalizado mediante «microtargetting», pero necesitaba pruebas. Y Wylie necesitaba datos…

Hasta entonces las firmas tradicionales de investigación analítica utilizaban los registros de los votantes y los historiales de compras de los consumidores para intentar predecir las creencias políticas y el comportamiento de los votantes. Pero esto no era suficiente para lo que ellos querían. Wylie necesitaba datos…y «likes»!!!

El 31 de Diciembre del 2013 Robert Mercer y Stephen Bannon fundan en USA Cambridge Analytica (CA) la cual específicamente dice aplicar minado, analisis y venta de datos junto con comunicación estratégica al marketing político además de comercial. La compañía pertenece al grupo SCL. Su objetivo principal es participar en la política de USA. Nombran CEO a Alexander Nix y contratan a Christoper Wylie como Jefe de Investigaciones. El nombre no tiene ninguna relación oficial con la universidad y probablemente quisieron crear un vínculo con el paper que dio origen a la empresa.

Wylie necesitaba datos… y en Junio del 2014 acepta una oferta de GSR (la empresa de Kogan) para cosechar y procesar datos personales de Facebook…y emparejarlos con los rasgos de personalidad. Más tarde Nix negará ante el Congreso haber recibido ningún dato de GSR pese a las pruebas documentales en contrario. CA gasta US$8: en todo este proceso (US$1: para GSR y US$7: adicionales para el tratamiento de los datos).

Aqui la historia se complica. Wylie afirma que se comunicó primero con Kosinski, quien habría aceptado el trato por US$ 500.000. Kosinski dice que no y luego que los fondos eran para futuras investigaciones…Finalmente Kogan logra dejar a Kosinski fuera del trato afirmando que puede replicar su algoritmo y cosechar sus propios datos.

Pero…¿qué podría salir mal?

La tormenta perfecta estaba por empezar. Con los millones de Mercer se crean avisos ofreciendo pagar a todo aquel que aceptara tomar un test de personalidad mediante  Amazon-Mechanical TurkQualtrics. Al fin de las mismas, la aplicación de Kogan, «thisismydigitallife» obtenía el permiso para acceder al perfil de Facebook del encuestado…y sus amigos. 320.000 personas aceptaron la oferta y, en promedio, cada uno dio acceso a al menos 160 más, ninguno de los cuales había dado su consentimiento. La cuenta más baja da 51.520.000 perfiles, 51.200.000 no autorizados. Nix habla mucho más tarde de 230.000.000, prácticamente cada adulto en USA y 5.000 rasgos de identidad de cada uno.

«Today in the United States we have somewhere close to four or five thousand data points on every individual […] So we model the personality of every adult across the United States, some 230 million people.»
— Alexander Nix, chief executive of Cambridge Analytica, October 2016.

Es al menos dudoso que Facebook no detectara la exfiltración de datos no autorizados. La empresa lo niega.

“Protecting people’s information is at the heart of everything we do, and we require the same from people who operate apps on Facebook. If these reports are true, it’s a serious abuse of our rules. Both Aleksandr Kogan as well as the SCL Group and Cambridge Analytica certified to us that they destroyed the data in question.”

Mercer y Kogan afirman que todo fue legal y hecho en total acuerdo con los representantes de Facebook (agrega a Twitter y Alphabet). Al final del día, importa poco. Los datos, una vez que fueron comprometidos, permanecen así.

Durante 2014, CA se ejercitó participando en 44 procesos electivos de USA.

En el 2015, CA comienza a hacerse visible al ser contratada para la campaña de Ted Cruz para las presidenciales. Aparentemente aquí comienza el uso de los datos obtenidos fraudulentamente.

En el 2016, CA es contratada para la campaña Leave-EU (referendum por el Brexit) con los resultados conocidos.

En el mismo año, CA es contratada para la campaña presidencial de Donald Trump. El hombre naranja twittea: «Pronto me conocerán como el Sr. Brexit». Las continuas inconsistencias y contradicciones del candidato se vuelven su mejor arma. Un mensaje distinto para cada votante. Microtargetting…En una entrevista con Das Magazin, Nix detalla:

«Los mensajes se distinguían en su mayoría por detalles microscópicos, con el objetivo de llegar al espectador de la mejor forma posible: diferentes cabeceras, colores, ilustraciones con fotos o vídeos. El perfeccionismo llegaba hasta los grupos más minoritarios».

«Podemos llegar a pueblos o bloques de apartamentos de una forma concreta. Incluso a particulares”.

“Prácticamente cada mensaje de Trump fue diseñado por el análisis de los datos”

En el tercer y último debate (generalmente decisivo) Trump – Clinton se analizaron 175.000 variaciones.

Luego del triunfo de Trump, Wylie abandona CA.

En Abril del 2017, Stephen Bannon retira sus inversiones en CA, al resultar éstas incompatibles con su puesto como Jefe de Estrategia de la Casa Blanca.

Contacto en Moscú

El 18 de Mayo del 2017, Time informa que el Congreso de USA está investigando a CA en relación a los alegados intentos de Rusia de interferir en la elección presidencial del 2016. El informe declara que CA coordinó el despliegue de propaganda rusa usando sus capacidades de «microtargetting».

El 14 de Diciembre del 2017, se revela que Robert Mueller requirió a CA que entregara los emails de todos los empleados que trabajaron en la campaña de Trump, como parte de su investigación sobre la interferencia rusa.

Explota la bomba

El 17 de Marzo del 2018, The New York Times y The Observer revelan el escándalo, basados fundamentalmente en la información brindada por Wylie, ahora convertido en denunciante. La extracción de datos personales de perfiles de Facebook realizada sin autorización por un investigador externo con el pretexto de hacerlo para propósitos académicos. ¿La respuesta de FB? prohibir a CA realizar publicidad en su plataforma… y borrar la cuenta de Wylie… Por su parte The Guardian acusa a FB de haber estado al tanto de la brecha y no haber hecho nada para proteger a sus usuarios. Al mismo tiempo en Channel 4 News se hacen públicos una serie de videos tomados encubiertamente donde Nix habla del uso de prostitutas, sobornos y «honey-traps» para desacreditar políticos opositores. También afirma que su empresa tuvo a su cargo toda la campaña digital de Donald Trump, incluyendo actividades posiblemente ilegales. CA declaró el martes que había suspendido en su cargo a Nix luego de que los videos se hicieran públicos.

El lunes 19, el valor de mercado de FB cayó US$: 37.000 (7%). El mismo día, Alex Stamos CSO de la empresa renuncia. De su equipo de 120 personas, solo 3 quedan en su puesto, el resto pasa a otras divisiones.

Es de destacar que Stamos siempre abogó por publicar un informe de los hallazgos de la empresa desde que empezaron las denuncias de la conexión rusa.

We are not worthy…

El miércoles 21, Mark Zuckerberg declara, después de un largo silencio:

«Tenemos la responsabilidad de proteger sus datos y si no podemos hacerlo, entonces no merecemos servirles»

Curioso. Un montón de preguntas, pocas respuestas. Si Zuckerberg fuera fiel a sus palabras debería cerrar FB y nukear todos sus discos. Y no es el único que debería hacerlo, por supuesto…

El modelo de acumulación y venta de datos está instalado. Fue la piedra fundamental de la explosión de las dotcom.  Y es la fuente de ingresos de corporaciones más grandes que ciertos estados.Esto, respecto al modelo comercial. Pero las noticias de hoy nos enfrentan a un peligro mayor, la manipulación de nuestro subconsciente con fines políticos. Y ahí…cerrá y vamos.

¿Estamos a tiempo de detenerlo? Probablemente no. ¿De regularlo? Probablemente si.

«Cuando algo es gratis, el producto sos vos»

Es una frase que todos en el mundo de hoy debieran tener presente. Nos entregamos demasiado fácil a la comodidad de cada aplicación que nos promete facilitarnos la vida. Y en el camino, perdemos la libertad.

Las dos condiciones que Hari Seldon estableció como imprescindibles para el correcto funcionamiento de la Psicohistoria son:

1. La población en la cual el comportamiento fuera a ser modelado debía ser suficientemente grande.
2. La población debía permanecer ignorante de la aplicación de los análisis psicohistóricos.

La Psicohistoria ya está aquí. El Imperio Galáctico estará bien controlado…