Cerrar close
23 de septiembre 2020

Los datos de navegación anonimizados son un mito

Publicado por Genbeta

El historial de navegación web de un usuario consiste en la lista de sitios web que este ha visitado. Un usuario podría pensar que, si no aparecen temáticas ‘sensibles’ en el mismo, es una información bastante inofensiva.

Pero no es así, ni mucho menos. Según el experto en privacidad Lukasz Olejnik,

«[Los historiales] transmiten abundante información sobre el usuario, hasta el punto de poder extraer información psicométrica o demográfica.

De algún modo, el historial de navegación se parece, por su singularidad y estabilidad, a los datos biométricos».

Estamos acostumbrados a oír a los representantes de las empresas tecnológicas que los datos que recopilan en Internet no pueden ser utilizados para identificar a los usuarios porque pasan por procesos de ‘anonimización’, en muchos casos basados en la agregación de dichos datos.

Sin embargo. Olejnik (como muchos otros expertos en privacidad) lleva años advirtiendo contra la fiabilidad de dicha anonimización: en 2012 fue co-autor de un famoso ‘paper’ llamado «Por qué Johny no puede navegar en paz: sobre lo singular de los patrones de navegación web» (PDF), que demostraba que los perfiles de navegación de cada usuario no sólo son muy distintos entre sí, sino que también son particularmente estables.

9 años sin cambios en materia de privacidad web

Ahora, tres ingenieros de Mozilla han querido reproducir y ampliar aquella investigación, ocho años más tarde, con un nuevo paper títulado «Por qué seguimos sin poder navegar en paz: sobre la singularidad y la identificabilidad de los historiales de navegación web«.

¿Resultado? De 52.000 perfiles de navegación de usuarios de Firefox, los investigadores pudieron identificar 48.919, una cifra que apenas se reducía incluso cuando sólo se tenían en cuenta los 100 sitios web más relevantes de cada historial.

Olejnik, que ha publicado un análisis del trabajo de sus ‘sucesores’, afirma que se trata de una evaluación «más rigurosa» del problema que abordó en 2012, pero que, aún así, «los resultados se mantienen»:

«La tasa de exclusividad del historial de navegación web, calculada utilizando métodos similares al de nuestro estudio, resultó ser del 99%. [La investigación] indica también que los usuarios pueden ser reidentificados mediante técnicas de fingerprinting en el 80% de los casos. Tales cifras resultan sorprendentemente altas».

En resumen, que por muy anónimos que sean los datos, mientras nuestros patrones de navegación no cambien bruscamente un pequeño porcentaje de nuestros historiales web conceden a las compañías todas las facilidades para identificarnos (y, por tanto, rastrearnos).

Aunque, claro, algunas compañías tienen más facilidades que otras para eso, por su papel predominante en el ecosistema digital:

Noticias relacionadas

03 de febrero 2021

Pandemia urgió la adopción de sistemas de identidad digital

La pandemia de covid-19 provocó que cada vez más empresas y hasta gobiernos entendieran la necesidad de implementar sistemas de identidad digital.

19 de febrero 2018

Alertan de facturas apócrifas de Telcel

Alertan de circulación de Malware a través de facturas apócrifas.

09 de enero 2018

DETECTAN CÓDIGO MALICIOSO EN INFRAESTRUCTURA DE INTERNET EN MÉXICO

Publicado por NetMediaMx Escrito por: Rosa Martínez Gómez   La Procuraduría General de la República, a través de la Agencia de Investigación Criminal (AIC), en colaboración con el Buró Federal de Investigaciones (FBI, por sus siglas en inglés), logró identificar un software malicioso de origen norcoreano en la infraestructura del ciberespacio mexicano. Este “posible virus […]

Contacto

Por favor escríbenos cualquier observación, comentario o duda. Estaremos al pendiente, ¡gracias!

Enviar un comentario Inscripción a talleres