Cerrar close
23 de septiembre 2020

Los datos de navegación anonimizados son un mito

Publicado por Genbeta

El historial de navegación web de un usuario consiste en la lista de sitios web que este ha visitado. Un usuario podría pensar que, si no aparecen temáticas ‘sensibles’ en el mismo, es una información bastante inofensiva.

Pero no es así, ni mucho menos. Según el experto en privacidad Lukasz Olejnik,

«[Los historiales] transmiten abundante información sobre el usuario, hasta el punto de poder extraer información psicométrica o demográfica.

De algún modo, el historial de navegación se parece, por su singularidad y estabilidad, a los datos biométricos».

Estamos acostumbrados a oír a los representantes de las empresas tecnológicas que los datos que recopilan en Internet no pueden ser utilizados para identificar a los usuarios porque pasan por procesos de ‘anonimización’, en muchos casos basados en la agregación de dichos datos.

Sin embargo. Olejnik (como muchos otros expertos en privacidad) lleva años advirtiendo contra la fiabilidad de dicha anonimización: en 2012 fue co-autor de un famoso ‘paper’ llamado «Por qué Johny no puede navegar en paz: sobre lo singular de los patrones de navegación web» (PDF), que demostraba que los perfiles de navegación de cada usuario no sólo son muy distintos entre sí, sino que también son particularmente estables.

9 años sin cambios en materia de privacidad web

Ahora, tres ingenieros de Mozilla han querido reproducir y ampliar aquella investigación, ocho años más tarde, con un nuevo paper títulado «Por qué seguimos sin poder navegar en paz: sobre la singularidad y la identificabilidad de los historiales de navegación web«.

¿Resultado? De 52.000 perfiles de navegación de usuarios de Firefox, los investigadores pudieron identificar 48.919, una cifra que apenas se reducía incluso cuando sólo se tenían en cuenta los 100 sitios web más relevantes de cada historial.

Olejnik, que ha publicado un análisis del trabajo de sus ‘sucesores’, afirma que se trata de una evaluación «más rigurosa» del problema que abordó en 2012, pero que, aún así, «los resultados se mantienen»:

«La tasa de exclusividad del historial de navegación web, calculada utilizando métodos similares al de nuestro estudio, resultó ser del 99%. [La investigación] indica también que los usuarios pueden ser reidentificados mediante técnicas de fingerprinting en el 80% de los casos. Tales cifras resultan sorprendentemente altas».

En resumen, que por muy anónimos que sean los datos, mientras nuestros patrones de navegación no cambien bruscamente un pequeño porcentaje de nuestros historiales web conceden a las compañías todas las facilidades para identificarnos (y, por tanto, rastrearnos).

Aunque, claro, algunas compañías tienen más facilidades que otras para eso, por su papel predominante en el ecosistema digital:

Noticias relacionadas

10 de enero 2018

FALLOS DE SEGURIDAD PODRÍAN PERMITIR INFILTRADOS EN LOS CHATS GRUPALES

Conversaciones grupales podrían ser vulneradas en WhatsApp

12 de diciembre 2017

BANCOS, EL OBJETIVO DE CIBERCRIMEN PARA EL 2018

Firmas de seguridad digital afirman que los bancos serán los próximos objetivos de cibercriminales.

11 de febrero 2020

Esta es la lista de 24 apps en las que Google Play detectó malware

Se detectó que las aplicaciones afectadas llevaban a cabo prácticas potencialmente peligrosas

Contacto

Por favor escríbenos cualquier observación, comentario o duda. Estaremos al pendiente, ¡gracias!

Enviar un comentario Inscripción a talleres