Privacidad diferencial: una de las principales novedades de la WWDC
Al margen del brillo y el glamour de los principales anuncios de la pasada keynote, uno de los principales anuncios de Apple durante esta edición de la WWDC fue la privacidad diferencial.
La privacidad diferencial no es una creación de Apple, de hecho ha estado presente desde hace años y es un método bien conocido para enmascarar los datos para evitar su extracción.
Sin embargo, lo que hay que saber es que Apple está integrando este método de criptografía como un esfuerzo para mantenernos más seguros y para evitar tener datos utilizables que entregar a los organismos policiales o gubernamentales si así lo demandasen.
Datos diferenciales
Es un proceso bastante complejo y que podríamos comparar con abrir una guía telefónica e intentar encontrar a una persona en una ciudad como Madrid o Ciudad México conociendo únicamente que su nombre comienza con la letra "A". Al intentarlo, rápidamente descubriremos que en la guía hay demasiados nombres comenzando con la letra "a" como para encontrar a esa persona.
Así es como funciona la privacidad diferencial. En esencia, añade una gran cantidad de ruido para ocultar la señal. Cuanto más ruido añadas, más difícil será encontrar lo que estás buscando en realidad.
Lo que Apple está haciendo es una desviación de la mentalidad típica de recolección de datos, ya que no crean perfiles de usuario para proporcionar cosas como ubicaciones en Apple Maps, canciones favoritas en Apple Music o palabras nuevas para añadir al auto-corrector. En lugar de ello, Apple está asignando un vínculo profundo con un hash único para estos eventos y luego añade ruido. A partir de ahí, puedes determinar lo que es popular mediante la extracción de un fragmento y el análisis de cómo ha cambiado el patrón sin el.
Por ejemplo, si quieres encontrar los ingresos de Juan y sabes que vivió en Madrid antes de mudarse a Barcelona, tomas el ingreso total de Madrid (durante e inmediatamente después de su mudanza) y calculas la diferencia. Dicha diferencia será el salario de Juan.
Es una analogía muy simple, pero así es como Apple está proporcionando recomendaciones sin crear un perfil de usuario en función de tus datos. En conjunto, estos fragmentos se pueden combinar para averiguar las tendencias y preferencias sin llegar a revelar ningún usuario particular.
El problema con los datos diferenciales es que con suficientes fragmentos, puedes iniciar la extrapolación de los datos individuales (como en el ejemplo anterior).
Para evitar esto, Apple está asignando lo que se conoce como un "presupuesto de privacidad" que limitará efectivamente el número de presentaciones de fragmentos elaborados a partir de un único usuario en un período determinado de tiempo. Aquellos que se utilicen en este plazo de tiempo quedan en el anonimato y Apple elimina cada fragmento después de un período de tiempo para recoger otros nuevos, a partir de los nuevos usuarios.
Esperemos que no está confundido en este punto, pero si lo estás, simplemente piensa en los datos diferenciales como un método de criptografía (cifrado) que mantiene nuestros datos seguro al no seguirnos o monitorearnos.
Lo que no nos queda del todo claro es si Apple adoptó este nuevo método para proteger nuestra privacidad, para evitar más casos como el que le enfrentó con el FBI a principios de año o para ambas cosa.