Vous êtes facile à retrouver grâce à un algorithme qui « désanonymise » les données

Vous êtes facile à retrouver grâce à un algorithme qui « désanonymise » les données

Selon un nouveau rapport, un algorithme permettrait votre ré-identification suite à l’anonymisation de vos données et cette technique serait même rendue publique.

Les organisations qui traitent des données sensibles utilisent des pratiques d'anonymisation dans le but de les partager ou les vendre. Théoriquement, ces techniques de désidentification rendent les individus non identifiables. Une fois rendues anonymes, les données ne sont plus considérées comme des données personnelles et ne sont plus soumises aux régimes de protection des données. Une nouvelle recherche publiée dans la revue Nature Communications affirme que ces données ne demeurent toutefois pas indéchiffrables indéfiniment avec la pratique actuelle. Celle-ci consiste à éliminer les éléments identifiables comme les noms, numéros de téléphone, adresses courriel, etc. Les ensembles de données sont également modifiés pour être moins précis et les colonnes des feuilles de calcul sont supprimées et brouillées, a rapporté MIT Technology Review.

Selon The New York Times, les données anonymes ne sont pas considérées comme des données personnelles dans la plupart des pays du monde, ce qui veut dire que l'information peut être partagée et vendue sans enfreindre les lois sur la vie privée.

Les données anonymisées sont pourtant loin d’être anonymes

Des scientifiques de l'Imperial College de Londres et de l'Université catholique de Louvain en Belgique ont mis au point un algorithme de « machine learning » qui démontre qu'il est possible de ré-identifier avec précision et sans difficulté des individus dans n'importe quelle base de données, même lorsque vos données personnelles ont été supprimées. Le pire dans tout ça, c’est que les scientifiques ont mis en ligne le code de leur algorithme pour que tout le monde puisse l'utiliser…

Selon un chercheur de l'Imperial College, Yves-Alexandre de Montjoye, la décision de la divulgation du code a été difficile à prendre. Il fallait choisir entre conserver ou publier cette méthode pour que les fournisseurs de données puissent sécuriser les futurs ensembles de données et empêcher ainsi la ré-identification des individus.

Des solutions pour prévenir la ré-identification des personnes

Il est possible de contrôler l'accès aux données sensibles, comme celles de vos clients. Les personnes autorisées doivent accéder à ces données dans une salle sécurisée. Les informations peuvent être utilisées, mais pas copiées. Tout ce qui est fait avec l'information doit d’ailleurs être enregistré, a rapporté The Times. Kamel Gadouche, directeur général du CASD, un centre de données de recherche en France, explique que les chercheurs peuvent aussi accéder à l'information à distance, mais les exigences sont très strictes pour accéder à la salle où se trouve le point d'accès.

Une autre solution a été signalée par MIT Technology Review. Selon Charlie Cabot, directeur de recherche chez Privitar, une firme d'ingénierie en protection de la vie privée, la méthode consiste à utiliser la protection différentielle de la vie privée, soit un modèle mathématique complexe permettant aux organisations de partager des données globales sur les habitudes des consommateurs tout en protégeant leur identité.

Source : Nature Communication, MIT Technologie Review


Ce à quoi vous consentez en vous inscrivant.

En vous inscrivant sur notre site Web, vous nous autorisez à communiquer avec vous par courrier électronique, téléphone, courrier postal ou tout autre moyen de communication disponible. Soyez sans inquiétude, nous ne vendrons jamais vos informations ni n'envahirons votre boîte de courriels. À tout moment, vous pouvez vous désinscrire de nos communications.