Para la mayoría de los estadounidenses
nacidos después de la Segunda Guerra Mundial, es improbable que Arlington,
Virginia, tenga alguna trascendencia especial. Pero para aquellos que saben que
el resultado de la guerra dependía en gran parte del desciframiento de códigos
al estilo de la película Imitation Game (El código enigma), Arlington tiene un
aura de misterio como el epicentro del criptoanálisis militar estadounidense.
En 1942, el Servicio de Inteligencia de
Señales del Ejército se estableció discretamente en el Colegio Universitario
Femenino de Arlington Hall, una escuela privada en la que se educaba a las
jóvenes en cuestiones de arte, música, buenos modales, el buen vestir y la
economía doméstica, y lo usó como cuartel general para organizar ataques contra
los sistemas japoneses de encriptación. La Agencia De Seguridad Nacional,
fundada en 1952, se ubicaba originalmente en Arlington Hall. La Agencia de
Inteligencia de Defensa, formada en el Pentágono una década después por el
Secretario de Defensa Robert McNamara, también ocupó dos edificios del lugar.
Actualmente, Arlington conserva sus raíces
de desciframiento de claves, pero ahora descifra otro tipo de códigos y ha
avanzado en la esfera de la computación cuántica, convirtiéndose en un
semillero de iniciativas de investigación financiadas por el gobierno, encabezadas
por instituciones públicas y privadas que trabajan principalmente para
Washington.
Una de ellas, Virginia Tech (VT), permite
ver en qué medida los grandes conjuntos de datos han cambiado el juego al
magnificar la capacidad de la comunidad de inteligencia de Estados Unidos para
pronosticar, con una excepcional precisión, el comportamiento humano a escala
mundial al explorar Twitter, YouTube, Wikipedia, Tumblr, Tor, Facebook y más.
VT utiliza algoritmos y una gran variedad de herramientas avanzadas para
revisar la densa y complicada información en busca de patrones en medio del
caos: modelos que frecuentemente destacan los eventos antes de que ocurran,
como levantamientos civiles, brotes de enfermedades, crisis humanitarias,
migraciones masivas, protestas, tumultos, derrotas políticas e incluso
violencia.
“En cualquier momento en que una persona
publica en Twitter o en Facebook, se convierte en parte de la economía de los
grandes conjuntos de datos”, señala Naren Ramakrishnan, catedrático de ciencia
informática en VT y director del Centro Discovery de Analítica de la
Universidad, que, según su descripción, “estudia toda la gama de la ciencia de
datos.” El año pasado, el centro cambió su base de operaciones del campus de
Virginia de VT de Blacksburg, a Arlington, que es también sede del Pentágono,
después de lograr más de 15 millones de dólares en subvenciones y contratos
para su proyecto EMBERS. Ramakrishnan dirige el proyecto que, hasta el momento,
lidera la carrera armamentista para convertir los grandes conjuntos de datos en
pronósticos que los encargados de la política estadounidense y las agencias de
inteligencia puedan utilizar.
“Muchos analistas pueden darnos pronósticos
para el próximo año, pero cuando nosotros hacemos esos pronósticos, hablamos de
fechas específicas”, dice Ramakrishnan.
Desde su inicio en abril de 2012, un
promedio de 80 a 90 por ciento de los pronósticos que genera han resultado
exactos y se producen, en promedio, siete días antes del evento pronosticado.
EMBERS (Early Model Based Event Recognition using Surrogates, reconocimiento de
eventos basado en un modelo temprano mediante sustitutos) obtiene su
información de lo que los fanáticos de los datos llaman “indicadores de fuente
abierta”, es decir, redes sociales, imágenes satelitales y más de 200 000 blogs
disponibles públicamente. Extrae hasta 2000 mensajes por segundo y compra datos
de fuente abierta como la denominada “firehose” de Twitter, que diariamente
hace circular cientos de millones de tuits en tiempo real.
Aunque se ha logrado mucho a partir de las
operaciones secretas de vigilancia del gobierno, particularmente de aquellas
que espían a los estadounidenses, el proyecto EMBERS se centra en dar
seguimiento a la conducta humana en otros países y publicar sus hallazgos, aun
cuando sean negativos. “No analizamos ninguna información clasificada ni
estamos pronosticando el terrorismo, porque no tenemos acceso a esa clase de
canales secundarios”, dice Ramakrishnan. “Analizamos datos que cualquiera puede
conseguir.”
Se trata de un sistema completamente
automatizado que produce un total de 45 a 50 alarmas totales cada día, las 24
horas del día, los siete días de la semana. El sistema presenta la fecha de un
evento pronosticado, la ubicación y coordenadas, quién o qué grupos están
involucrados, la razón del descontento y el nivel de confianza del pronóstico.
¿El objetivo? Pronosticar cualquier cosa que pueda dar aviso a Estados Unidos
para proteger a sus ciudadanos en el extranjero, así como a sus aliados.
El proyecto fue establecido en primer lugar
para examinar flujos de datos de fuente abierta en América Latina: pronosticó
acertadamente la acusación del presidente de Paraguay en 2012, las protestas
durante la Copa del Mundo en Brasil en 2013, y las violentas manifestaciones
estudiantiles ocurridas en Venezuela en 2014. Actualmente, el programa
supervisa a 20 países en América Latina y está empezando a moverse hacia el
Medio Oriente y el Norte de África, abarcando Irak, Siria, Egipto, Bahréin,
Jordania, Arabia Saudita y Libia.
EMBERS fue el producto de un concurso
organizado en 2012 por Jason Matheny, director adjunto de la Oficina para
Anticipar la Sorpresa (sí, ese es el nombre de una oficina gubernamental
verdadera) y gerente de programa de la Oficina del Director del Programa de
Actividad de Investigación de Proyectos Avanzados de Inteligencia Nacional. Se
solicitó a tres equipos, uno del Tecnológico de Virginia, otro de la empresa de
informática cuántica Raytheon BBN Technologies en Cambridge, Massachusetts, y
uno más de HRL en Malibu, California, antiguamente Laboratorios de
Investigación Hughes, que construyeran el mejor modelo posible de pronóstico
basado en indicadores de fuente abierta. El más exitoso de esos modelos fue
EMBERS, que terminó integrando a algunos miembros de otros equipos en el suyo
propio, entre ellos, Raytheon BBN, que actualmente desarrolla algunos de los
modelos de redes sociales de EMBERS, como los que pretenden pronosticar el
descontento civil a partir de la lectura de las publicaciones en Twitter.
Algunos de los principios rectores de la investigación son increíblemente
simples, afirma Scott Miller, director técnico de alto rango del grupo de habla
y lenguaje de Raytheon BBN.
“Buscamos palabras coloquiales específicas
que indiquen la existencia de una protesta”, dice Miller. “Descubrimos que
existe una correlación entre las frecuencias totales de términos de
descontento, por ejemplo, la palabra en español ‘protesta’, y la cantidad del
descontento civil que hemos descubierto en esas regiones.”
Sin embargo, en otros casos, la información
que llega puede ser mucho más complicada. Dado que dicha información puede
presentarse en forma de imagen, de palabras o de una tabla, por no mencionar el
hecho de que puede estar muchas lenguas y dialectos diferentes, EMBERS utiliza
métodos avanzados de extracción de datos y de traducción en sociedad con Basis
Technology, otra compañía de Cambridge, que enriquece los datos y proporcionar
herramientas de análisis de textos que, en lugar de traducir lenguas extranjeras
al inglés, extraen el significado directo de las lenguas maternas. Por ejemplo,
puede interpretar árabe impreso en caracteres fonéticos ingleses (algo muy
popular en Twitter). Se leen datos gráficos directamente de Tumblr, y las fotos
atmosféricas de satélite se procesan mediante herramientas automatizadas para
la obtención de imágenes.
A pesar de su sofisticación tecnológica, los
algoritmos de los modelos de pronóstico todavía tienen que realizar muchas
pruebas de ensayo y error. Un equipo de 80 expertos y 13 subcontratistas,
compuesto por científicos sociales, científicos informáticos, epidemiólogos,
especialistas en ciencias políticas, estadísticos y expertos regionales de cada
país, trabaja en el diseño y la actualización de los mejores modelos posibles.
Ramakrishnan compara computadoras de entrenamiento para reconocer patrones con
el objetivo de enseñar a las aplicaciones de correo electrónico a reconocer los
correos no solicitados. Existe un “supermodelo” que, con el tiempo, “aprende
qué modelos son mejores, pero continúa aprendiendo, porque las situaciones en
estos países cambian con el paso del tiempo”, afirma Ramakrishnan. El
supermodelo recibe una libreta de notas mensual acerca de la exactitud de sus
pronósticos, la cual le indica cuáles son los modelos que funcionan en qué
combinaciones, y cuáles no. Luego, realiza los ajustes correspondientes.
El contratista independiente que lee y
corrige la precisión de los pronósticos de EMBERS es una instalación de
investigación no lucrativa de la cercana población de McLean, Virginia, llamada
MITRE, compuesta por varios centros de investigación financiados por el
gobierno. Terry Reed, el ingeniero de sistemas de información del Instituto de
Ingeniería y Desarrollo de Sistemas de Seguridad Interior de MITRE, supervisa
un equipo de unas 12 personas que relacionan las alertas de EMBERS con informes
periodísticos para determinar si sus pronósticos se vuelven realidad.
Actualmente, EMBERS ha obtenido una calificación casi perfecta al pronosticar
que los eventos ocurrirán, pero aún trabaja para obtener correctamente los
detalles de evento, dice Matheny.
Ramakrishnan dice que, en su opinión, EMBERS
tiene el potencial de pronosticar eventos a escala poblacional en todo el
mundo. “Uno podía imaginar que las tecnologías como esta serían útiles en el
futuro y podrían volverse de uso común”, dice. “Tratar de pronosticar esto no
es nuevo. Lo que es nuevo es que las redes sociales nos estén permitiendo
hacerlo de mejor manera.”
Hasta la fecha, los organismos gubernamentales
no actúan coordinadamente con base en los pronósticos del proyecto EMBERS, y
aún no es claro qué planea hacer el gobierno con estas crecientes capacidades.
Matheny declinó revelar exactamente cuáles son los organismos gubernamentales
que están dispuestos a adoptar la tecnología de pronóstico de EMBERS, pero
confirmó a Newsweek que diversos organismos de inteligencia, salud pública,
asuntos humanitarios y organismos de seguridad nacional y mundial están dándole
seguimiento. “Mantenemos a nuestros socios gubernamentales informados sobre los
resultados de la investigación”, dice. “Más de una docena de organismos han
recibido actualizaciones periódicas acerca del progreso de esta investigación.”
Uno de los organismos que usan las alertas EMBERS, dice Ramakrishnan, es el
Centro para el Control y la Prevención de Enfermedades. Además de proporcionar
información a organismos gubernamentales, VT puede vender el acceso a sus
tecnologías de redes sociales a entidades comerciales, aunque por el momento no
hay ningún plan inmediato para eso, dice.
“Existen muchas razones legítimas para hacer
esto”, dice Ramakrishnan. “Esto puede permitirnos aumentar nuestra seguridad en
zonas de conflicto u ofrecer advertencias de viaje más exactas, proteger a los
estadounidenses de la violencia e incrementar nuestra seguridad en las
embajadas.”
Por su parte, MITRE tiene profundas
conexiones con los servicios de defensa, seguridad e inteligencia de la nación.
De hecho, de acuerdo con MITRE, Reed representa al jefe de seguridad de la
información del Departamento de Seguridad Interna en un comité dentro del Grupo
de Trabajo de Sistemas de Seguridad Nacional, enfocado en temas políticos
relacionados con sistemas de información clasificada. Aunque MITRE confirmó el
trabajo de Reed con EMBERS, declinó ser entrevistada por Newsweek.
Es posible que EMBERS no sea el único
proyecto del gobierno preparado para analizar las redes sociales con el
objetivo de realizar pronósticos. En febrero, cuando un grupo que afirmaba
estar relacionado con ISIS tomó brevemente el control de las publicaciones de
Newsweek en Twitter, divulgó lo que parecía ser un documento del Ejército que
detallaba “El proyecto piloto de Gist Mill”, que se refería a un “concepto de
operaciones” de indicadores de fuente abierta y “análisis de redes sociales”.
De acuerdo con un portavoz del Pentágono, el proyecto fue interrumpido en 2013,
pero el Ejército está en proceso de trabajar con las redes sociales en sus
operaciones tradicionales de inteligencia, vigilancia y reconocimiento, e
introduce continuamente nuevas capacidades.
A pesar de los beneficios que el
aprovechamiento de los datos de fuente abierta tiene para realizar pronósticos,
Karen Greenberg, directora del Centro sobre la Seguridad Nacional de la
Universidad de Fordham en Nueva York, advierte que el seguimiento estrecho de
las masas a través de las redes sociales y otros medios se parece menos a El
código enigma que a Sentencia previa.
“Realmente tenemos que decidir algunos
lineamientos y parámetros legales y éticos en las etapas iniciales de todos
estos proyectos”, dice. “Hemos visto que cuando eso no ocurre, nuestro gobierno
nos dice, ‘dependemos de este programa, no podemos desmontarlo ahora’. Las
consecuencias de estos programas son extraordinarias. Como nación, ¿estamos de
acuerdo en que estamos tan poco seguros que necesitamos estos programas para
reducir nuestro riesgo a cero a expensas de nuestra privacidad?”
Los funcionarios de inteligencia señalan a
menudo que el término “vigilancia de masas” es un nombre poco apropiado,
argumentando que el objetivo de la vigilancia del gobierno es vigilar a
personas o grupos específicos y no a las masas. Pero EMBERS participa solamente
en la vigilancia masiva. “No damos seguimiento a personas en nuestro proyecto”,
dice Ramakrishnan. “Damos seguimiento a multitudes y grupos.” Señala que el
programa da seguimiento a las publicaciones en Twitter de figuras públicas y
líderes clave, porque tienen una enorme influencia en las masas, pero no a las
de los ciudadanos corrientes.
Greenberg añade que, aunque tales
herramientas son indudablemente útiles, hay señales de que el gobierno podría
depender excesivamente de la tecnología para recibir alertas sobre amenazas de
seguridad. “De algún modo, pasamos por alto la primavera árabe, pasamos por
alto el surgimiento de ISIS”, dice. “Estas son herramientas tecnológicas
valiosas, pero no hay nada como estar en el terreno. Uno desea una respuesta
que provenga de algo más que un par de clics.”
Miller de Raytheon BBN está de acuerdo en
que, en caso de duda, no hay nada como la verdad en el terreno. “Ahora mismo,
aún no tenemos nuestros pronósticos sobre el Medio Oriente. La mejor manera de
averiguar algo es simplemente preguntarle a alguien.”