Le numérique, les données personnelles, le big data : un cocktail détonant

En cette fin mars, l'affaire facebook / Cambridge Analytica fait beaucoup de bruit. Les pratiques relevées ici ne sont cependant ni techniquement inédites, ni politiquement surprenantes, ni inévitables.

En effet, l'objet même de la collecte massive de données est de réussir à profiler assez de gens pour en déduire des schémas de comportement, puis des actions à entreprendre pour en tirer parti.

Par ailleurs la volonté d'influencer les gens lors des campagnes électorales est consubstantielle à l'idée même de campagne.

L'opération de Cambrige Analytica n'est donc pas plus surprenante ni immorale que ce qui pouvait se faire avant. Le problème est surtout que le monde vient de réaliser à quel point le traitement big data, comme la manipulation numérique, pouvaient être efficaces.

La vraie question est donc moins de savoir s'il serait moral, légitime ou possible d'éviter ce genre de pratiques, mais plutôt de savoir comment mieux protéger ses informations numériques et mieux détecter les manipulations. Ceci permettrait de rétablir un équilibre entre les citoyens et les communicants (quels que soient les objectifs de ces derniers).

Et la réponse est probablement oui, il est possible de rétablir cet équilibre.

La RGDP, loi opportune

Le 25 mai prochain, une nouvelle loi de protection des données entre en vigueur. Prolongeant l'ambition de la loi française Informatique & Liberté, elle a pour objet de contraindre les personnes morales à respecter les données personnelles des personnes privées. Dans le cas de facebook, il y aurait eu clairement une violation de la RGPD car à aucun moment les internautes n'ont consenti de façon explicite et éclairée à utiliser leurs données dans le cadre d'un profilage politique pour servir une campagne électorale.

Bien que très contraignante, la future loi RGPD montre ici son intérêt et son efficacité pratique, au bémol prêt d'avoir assez de "policiers et de juges RGPD".

Le bigdata au secours de la police

L'affaire facebook a pris toute sa dimension grâce à un lanceur d'alerte. La question se pose donc de savoir si d'autres moyens peuvent être mis en œuvre. Là aussi, la réponse est positive. À condition de trouver des sources non corruptibles, le bigdata peut servir de juge de paix. Pour le comprendre, si l'on se penche sur le cas français, on peut regarder ce qui s'est passé lors de notre campagne présidentielle.

Un traitement bigdata relativement simple a permis lors des primaires LR et socialistes de 2016 et 2017 de prédire les finalistes et les vainqueurs. Ce même traitement a échoué à prédire les participants au second tour de la présidentielle.

Cette anomalie pouvait avoir plusieurs explications :

  • le filtre bigdata était défaillant 
  • la forte abstention à la présidentielle a été asymétrique et a généré l’anomalie probabiliste
  • la présidentielle présentait une non-homogénéité de comportement statistique qui n’existait pas aux primaires et qui a perturbé le caractère prédictif de l’analyse pour les présidentielles
  • la collecte des données bigdata a subi un problème non identifié
  • un phénomène extérieur modifiant les intentions de vote et n’apparaissant pas dans les intentions de vote a eu lieu aux présidentielles

 

L’analyse bigdata sur googletrends comptabilise les recherches sur le moteur de recherche. Elles sont prédictives des intentions de vote dans le sens où une recherche est très majoritairement implicante pour un internaute (on ne cherche pas ce qui ne vous intéresse pas). Le seul biais étant qu’une recherche qui intéresse l’internaute peut être négative (cela a été le cas avec Fillon lorsque ses problèmes judiciaires sont apparus). En fin de campagne, aucun phénomène de ce type n’était identifiable.

L'analyse bigdata a donc relevé une singularité, donc une alerte. Y-a-t-il pour autant eu manipulation ?

Il semble bien que oui si l'on en croit l’émission Théma sur Arte diffusée début mars 2018. Ce documentaire enquête sur la guerre de l’information. Des éléments factuels et circonstanciés présentés par le documentaire montrent l’existence d’une officine russe dont le but est de produit du contenu numérique sur les réseaux sociaux et destiné à jouer sur l’émotion (par exemple sur le modèle « si tu es d’accord partage »). Le reportage montre comment cette officine est clairement intervenue dans la campagne électorale, en apparence au profit de LePen.

Ceci pourrait expliquer la présence de la candidate frontiste au 2nd tour alors qu’elle n’apparaissait qu’au 4ème rang des recherches google.

Conclusion

Les manipulations marketing ne sont pas une nouveauté. Leur utilisation dans l'espace numérique est un prolongement de l'existant. Couplée à la puissance d'analyse du bigdata et face à l'analphabétisme numérique des citoyens, ces manipulations posent problème.

La RGPD est un premier niveau de protection des citoyens mais son application risque de se révéler complexe.

L'analyse bigdata est un second niveau de protection en qualité de révélateur d'anomalies, mais les sources d'alimentation doivent être contrôlées pour en garantir la pertinence.

Une pensée sur “Le numérique, les données personnelles, le big data : un cocktail détonant”

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *