tout le monde mentJ’ai lu et je recommande « Tout le monde ment … et vous aussi » de Seth Stephens-Davidovitz. Sous-titré « Internet et le big data : ce que nos recherches Google disent vraiment de nous ». Cet ouvrage est important quand on fait de l’intelligence économique.

Voici un compte rendu en deux parties. Lire ici la première partie.


Le big data nous permet de zoomer sur de petits sous-ensembles

- Un des exemples qui m’a le plus intéressé porte sur l’impact des films violents sur la criminalité. Les statistiques officielles prouvent qu’il y a une baisse de la criminalité les weekends de sortie de films violents. Donc on pourrait en conclure qu’il n’y a pas de corrélation. Erreur… explique l’auteur. En réalité, une analyse plus fine du big data permet de comprendre le phénomène : un film violent a beaucoup de chance d’attirer un public violent. Ces derniers vont donc rester assis de 20h à 23h sans boire d’alcool. Ils vont en ressortir « calmés » pour un temps. Et quand bien même ils boiraient à la sortie du ciné, le temps d’incubation de l’alcool va repousser les actes délictueux … Par contre lors de leur prochaine virée entre copains, l’alcool aidant, ils seront plus violents que s’ils n’avaient pas vu le film. Conclusion, la violence des films a bien un impact négatif mais décalé dans le temps ! CQFD.
- Une partie tout aussi passionnante explique que nous avons tous un profil numérique, et des cohortes de personnes nous ressemblent. L’analyse de nos doubles numériques (ou doppelgängers) peut permettre d’anticiper nos prises de position ou nos choix personnels. Beaucoup d’entreprises utilisent ce système pour améliorer leurs offres. C’est ce que fait Amazon quand il nous propose des livres qu’un de nos « doubles numériques » a aimé ! C’est certainement ce que va faire de plus en plus la médecine qui va nous proposer un traitement parce que nos « doubles numériques » l’ont bien supporté.

Le big data nous permet de rechercher non plus des corrélations mais des causalités

- Une autre partie essentielle de son ouvrage concerne l’explication des expériences randomisées (pardon pour l’anglicisme… c’est la traduction dans le livre) appelées Test A/B. Extrait : « Dans le monde digital, les expériences randomisées peuvent être rapides et peu couteuses. Inutile de recruter et de rémunérer des participants. (…) Inutile de faire remplir des questionnaires aux utilisateurs. (…) Inutile de contacter qui que ce soit. Vous n’avez même pas besoin d’informer les utilisateurs qu’ils participent à une expérience. Tel est le pouvoir du big data : il facilite beaucoup la réalisation d’expériences randomisés, qui permettent de détecter de vraies causalités, à tout moment, presque n’importe où, pourvu que l’on soit en ligne. A l’ère du big data, le monde entier est un labo » p220
- Et les GAFAM profitent à plein de cette manne : « En 2011, les ingénieurs de Google ont effectué sept-mille tests A/B. Et leur nombre progresse sans cesse. » « Facebook effectue aujourd’hui un millier de tests A/B par jour. Ce qui signifie qu’un petit nombre d’ingénieurs y lancent en une seule journée plus d’expériences randomisées et contrôlées que toute l’industrie pharmaceutique en une année entière » p231 Obama a fait un grand usage de ces tests pour améliorer sa campagne.
- Et d’où vient notre addiction à l’écran ? Il répond sans détour « De l’autre côté de l’écran, il y a un millier de gens dont le métier est de mettre à bas notre autodiscipline ». Merci qui ? Merci les GAFAM !

Sans surprise Seth Stephens-Davidovitz est technosolutionniste (vous ne l’auriez pas deviné !). Extrait de sa pensée profonde : « Les données des recherches Google ouvrent une fenêtre sans précédent sur les coins les plus sombres du psychisme humain. (…) Mais nos possibilités peuvent aussi en être renforcées. Les données peuvent servir à combattre les ténèbres. Le premier pas vers la solution des problèmes mondiaux consiste à réunir beaucoup de données pour les connaitre » p173. C’est -en  plein- le crédo de la Silicon Valley : L’informatique est le problème mais est aussi la solution … CQFD !

Big data : à manier avec précaution

Dans cette dernière partie, Seth Stephens-Davidovitz analyse les éléments qui peuvent bloquer la performance des analyses du big data.
- Il évoque le fléau de la dimension (la multiplication des jeux de données, la multiplication des variables) qui fait qu’il est possible de trouver des corrélations fausses.
- Il évoque ensuite le problème d’accorder trop d’importance à ce qui est mesurable. Le big data a ses angles morts. « Facebook emploie des psychologues, des anthropologues et des sociologues chargés de trouver précisément ce que les nombres ne disent pas ».
- Il s’interroge enfin sur le pouvoir des entreprises qui maitrisent le big data. « La question éthique est celle-ci : les entreprises ont-elles le droit de juger que nous sommes éligibles à leurs services en fonction de critères abstraits, mais statistiquement prédictifs ». Et plus loin « Puisqu’une grande partie de votre vie est quantifiée, ces jugements par extrapolation risquent de devenir (…) plus intrusifs. De meilleures prévisions peuvent mener à des discriminations plus subtiles et plus malfaisantes ». Pour finir : « Le big data peut permettre aux entreprises de bien mieux savoir ce que les clients sont disposés à payer – et donc d’être bien plus à même de pressurer certains groupes » p274

Conclusion

Seth Stephens-Davidovitz prédit une révolution fondée sur les révélations du big data. « Les algorithmes vous connaissent mieux que vous ne vous connaissez vous-même ».
Mais en bon technooptimiste il conclut « Dans ce livre-ci, le grand thème est que la science sociale devient une science véritable. Et cette science nouvelle, cette science réelle, est destinée à nous améliorer la vie ».

Personnellement, je pense qu’il fait un mensonge par omission. Oui le big data peut nous améliorer la vie. Mais le big data va surtout et d’abord améliorer la vie des propriétaires des big sociétés qui maitrisent les données et les technos. Et ils n’ont pas de limite. Leur pouvoir est absolu et supranational.
Oui pour le big data. Oui pour les bénéfices partagés de cette révolution. Mais surtout oui à une Europe forte dans ces domaines, à un contrôle public, à une morale. Tiens au fait, je viens de me rendre compte en écrivant ces lignes, que les mots Europe, public et morale, sauf erreur, sont totalement absents de son texte ! Bizarre non ? Dans le monde offert par les big techs américaines, l’Europe, le service public et la morale n’existent tout simplement pas !

Jérôme Bondu

L’auteur parle notamment de Google Correlate (outil qui ferme le 15 décembre faute de popularité). Voici une présentation de l’outil.