Dans le cadre de ce billet je vais analyser un aspect du monde numérique actuel : Celui de la transparence (de la nudité devrait-on dire) de l’internaute vis-à-vis des outils qu’il utilise. Et pour ce faire, je vais rentrer en profondeur dans mon utilisation de Youtube. L’objectif, n’en doutez pas une demi-seconde, est de vous faire un peu peur. Car chaque nouvelle intervention en conférence ou formation me convainc davantage de l’importance de sensibiliser le grand public sur le monde en train de sourdre (ouais…j’aime bien les mots compliqués ;-).

Problématique


La question est la suivante : comment les outils que l’on utilise au quotidien peuvent-il déterminer votre personnalité ? Pour cette démonstration, je vais « simuler » ce que pourrait faire Google en analysant mon utilisation de Youtube. Avançons pas à pas !

Première piste : Google Myactivity

J’ai d’abord été sur Myactivity. Cet espace auquel chaque détenteur d’un compte Gmail peut accéder, vous permet d’avoir une vue sur toutes vos activités dans la Googlosphère.
J’ai utilisé le moteur de recherche qui permet de retrouver des vidéos vues sur Youtube. J’ai testé le moteur en recherchant le mot « tourterelle » (évidemment je suis sûr d’avoir préalablement vu une vidéo sur les tourterelles).  Le moteur de recherche de Myactivity ne me donne aucun résultat. Donc, il n’a pas un historique intéressant. Fausse piste.

takeout1
 

Seconde piste : Google Takeout


Puisque la première piste ne fonctionne pas, nous allons sortir l’artillerie lourde. La page Google Takeout vous permet de récupérer toute votre activité sur Google.
J’ai donc téléchargé toute mon activité Google (cf capture d’écran ci-dessous). Attention cela prend des plombes.

takeout2 

On voit bien le dossier YouTube. J’ai ouvert le fichier « watch-history.json » avec Notepad++  (logiciel gratuit à installer). On voit ci-dessous la description d’une vidéo vue sur Harari.
 

takeout3

On voit qu’il y a un champ « description » qui correspond à la description des vidéos visionnées
Grace à notepad++ et une recherche du mot « description » (CTRL F) j’ai pu isoler toutes les descriptions. Je les aient copiées dans un nouveau document texte.
 

takeout4

Pour tester ce gros volume de texte, j’ai d’abord utilisé un générateur de mot clés.
Mais le résultat est relativement décevant.

takeout6
 

Analyse sémantique et cartographique avec Tropes


J’ai ensuite utilisé le bon vieux Tropes (outil gratuit à télécharger, et qui existe depuis 1994) pour mener une analyse plus fine. Tropes est un logiciel d'analyse sémantique de textes. Grace à l’analyse de Tropes sur les descriptions des vidéos vues, je peux faire ressortir mes centres d’intérêts :
-    Télécommunication (le concept est présent 1299 fois dans les 700 descriptions)
-    Communication (901)
-    Internet (688)
-    Réseaux sociaux (365)
-    …
Tropes va analyser les concepts liés. Comme la capture d’écran ci-dessous le montre : Le concept de "communication"  est précédé des concepts : écrit, informatique, commerce, …  et est suivi des concepts : informatique, média, communication, électronique, … De quoi bien mesurer ce qui m’intéresse !


 takeout5

Autre exemple avec ce zoom sur le mot informatique qui est un des concepts les plus présents dans les vidéos regardées. On y voit par exemple les liens avec les mots sécurité, secret, cognition (sur la gauche) et histoire, droit, … (sur la droite).

takeout7


Je peux surfer d’un concept à un autre et naviguer ainsi dans les entrailles de mes centres d’intérêts. Et parfois découvrir des « signaux faibles », des éléments peu présents mais ayant une signification importante.

Réponse à la problématique et conclusion

Comme je fais l’analyse de mon propre compte, je suis bien placé pour savoir à quel point ces cartographies font bien ressortir ce qui m’intéresse et mes centres d’intérêt.

Il va sans dire que l’utilisation de Tropes n’est rien à côté de ce que peut faire Google. Cela donne une petite image de ce que le géant peut faire en termes d’analyse de la personnalité.

Ce petit billet se veut une mise en garde pour ceux qui doutent des capacités de collecte et d’analyse des outils gratuits que l’on utilise (si c’est gratuit c’est toi le produit). Et en conclusion, paraphrasons Lavoisier « sur internet, rien ne se perd, tout se récupère ».


Jérôme Bondu

NB :
Pour toutes demandes de formation ou de conférence, c'est ici.
On pourra lire aussi ce billet sur la capacité d’analyse de la personnalité de Facebook
J’ai fait aussi pas mal de billet à partir d’un autre outil de cartographie absolument génial Gephi.
Il y a aussi cette vidéo (sur YouTube ;-) sur le fait que votre smartphone enregistre ce que vous dite.