geotrend IA souveraineté numérique 5 carte globale


Suite à mon premier test avec Geotrend (voir la carto), j’ai voulu refaire une évaluation mais cette fois-ci en maitrisant les sources. Pour cela, j’ai fait une requête initiale dans Google, pour récupérer des liens pertinents, puis les injecter dans Geotrend, afin de comparer les cartes. Voyons d’abord la méthodologie et ensuite les résultats.

A- Méthodologie

1/ Requête
J’ai repris la requête réalisée lors du premier test sur la souveraineté numérique. J’ai donc recherché dans Google : "souveraineté numérique" OR "autonomie numérique" OR "indépendance numérique" OR "autosuffisance numérique". Le problème est que j’obtiens 193 000 résultats

J’ai refait une requête plus ciblée : intitle:"souveraineté numérique" OR intitle:"autonomie numérique" OR intitle:"indépendance numérique" OR intitle:"autosuffisance numérique" sur l’année écoulé. Google présente 361 résultats, mais seules les deux premières pages s’affichent avec 160 résultats.

geotrend IA souveraineté numérique 1


2/ Scrapping
Le problème est que les liens n’apparaissent plus en clair. Il faut donc scrapper les pages de résultats. J’ai utilisé SEOQuake et obtenu le tableau suivant (capture ci-dessous)

geotrend IA souveraineté numérique 3 excel

3/ Intégration
Il m’a suffi, enfin, de faire un copier-coller des 177 URL dans Geotrend.
L’outil détecte les URL qu’il ne crawl par (Facebook, Twitter, Amazon, Fnac,…) que j’ai enlevé manuellement.

geotrend IA souveraineté numérique 4 intégration

Au final, après vérification, Geotrend a analysé environ 80 URL sur les 177 injectés. Les pages non prises en comptes présentaient divers souci (erreur 404 par exemple). Mais le panel utilisé reste intéressant. En tout cas pour mon test.


B- Description des résultats

Inkedgeotrend IA souveraineté numérique 5 carte globale 2

On retrouve les trois mêmes regroupements que sur la carte précédente (voir ici):
1- Autour des GAFAM et BATX
2- Des structures de santé + institutionnels
3- D’OVH

4- Mais, surprise ... apparait un nouveau groupement avec les acteurs allemands de Gaïa-x. Intéressant !
Je me suis néanmoins demandé pourquil ils formaient un groupement un part ! J'ai trouvé la réponse dans l'article qui les cite. Cet article mentionne OVHcloud et non OVH. Or Geotrend n’a pas fait le rapprochement entre ces deux structures. D'où le fait que ce groupement soit à part et non rapproché d'OVH.
Est-il possible de fusionner manuellement deux acteurs (par exemple OVH et OVHcloud) ? J'ai posé la question aux équipes techniques. Sans dévoiler de secret d’Etat, les équipes techniques travaillent dessus ;-)

Des acteurs peu importants apparaissent. Cela est dû au faible nombre d'URL analysées (80). La présence de certain acteurs est surpondérée. Ce ne serait pas le cas avec plus d'URL pertinentes.

Finalement, la cartographie est remarquablement similaire à la précédente (voir ici).

Conclusion : Faire une requête dans Geotrend permet une analyse sémantique puissante, basée sur leur solution d’intelligence artificielle, de dizaines de pages issus de résultats Google ! Ceux qui sont à la recherche de gain de productivité devraient à s’intéresser sérieusement à Geotrend !

Jérôme Bondu





J’ai testé l’outil Geotrend.
Pour ceux qui ne le connaissent pas encore, c’est un outil de recherche et de veille sur le web, qui cartographie les résultats, et qui utilise une solution d’intelligence artificielle pour catégoriser les acteurs et les liens entre eux. Il présente les résultats sous différentes formes : cartographie d’acteurs, qui est la plus intéressante, mais aussi tableau de bord, liste des documents, carte géographique, nuage de mots, noms de domaine et chiffres clés. Pour cet article, je me suis surtout intéressé à la cartographie. Voici les résultats d’une recherche sur la « souveraineté numérique », domaine auquel je m’intéresse.

Voici la première carte générée par l’outil après ma requête "souveraineté numérique" OR "autonomie numérique" OR "indépendance numérique" OR "autosuffisance numérique". 830 documents ont été analysés.
Dans un premier temps je vais faire une description des résultats.
Puis une analyse.

Description des résultats

 Geotrend intelligence artificielle 1


Si la carte a globalement la forme d’un cœur (qui m’a permis un petit jeu de mots dans le titre) c’est le pur hasard. À chaque nouvelle connexion à la plateforme, la répartition change en fonction des nouvelles analyses de l’outil.

On distingue trois groupements : le premier centré autour de Google

Geotrend intelligence artificielle 2

 
Google est fortement cité avec les entreprises technologiques américaines et chinoises GAFAM et BATXH. La couleur rouge des liens signifie que l’outil a détecté qu’elles sont concurrentes entre elles. Google a la plus grosse bulle, car il est le plus cité dans le corpus de texte. La présence d’Emmanuel Macron, de Cédric O et de Trump (en bas à droite) dans cette nébuleuse signifie qu’ils sont fortement cités avec ces entreprises.  Le lien vert entre Google et Orange signifie une relation partenariale. En cliquant sur ce lien, une fenêtre s’ouvre dans l’application avec les documents qui ont permis de catégoriser ce lien. Cf capture ci-dessous.

Geotrend intelligence artificielle 3
 

Un deuxième groupement est centré autour d’Orange.

Geotrend intelligence artificielle 4

 
 On y trouve des acteurs essentiellement français (ce qui n’est pas étonnant, car ma requête était en français). On y trouve beaucoup d’organismes, comme le CNRS, l’Inserm, le Loria, le Cispa, l’Inria, l’ANSSI. Et des entreprises : Orange, Dassault et Cap Gemini. Ainsi que l’Allemande Deutsche Telekom et Nokia.

 

Un troisième groupement gravite autour d’OVH. On y trouve, OVH, OVH Cloud, Octave Kabla et Michel Paulin, respectivement fondateur et directeur d’OVH, ainsi que Gaia-X auquel participe OVH. Le moteur de recherche Qwant est présent de manière périphérique.


Il est possible d’appliquer de nombreux filtres. Dans la capture ci-dessous, j’ai sélectionné uniquement les personnes.

Geotrend intelligence artificielle 6
 

Si l’on clique sur un acteur, comme Pierre Bellanger, on voit les autres personnes citées avec lui dans le corpus de texte (capture ci-dessous).


 Geotrend intelligence artificielle 7

Interprétation des résultats

Voici quelques pistes d’analyse des résultats.
- Nous voyons clairement deux types d’acteurs : des entreprises privées américaines et chinoises (GAFAM et BATXH) et des organismes français (CNRS…).
- Le lien entre les acteurs français est lié à la santé, et plus particulièrement à l’application StopCovid, dont le cahier des charges contient des éléments sur le respect de la souveraineté numérique. Le projet regroupe l’Inria, l’ANSSI, Capgemini, Dassault Systèmes, l’Inserm, Orange, Santé Publique France et Withings.
- L’autre sujet qui ressort le plus, est le cloud, autour d’OVH. La question du moteur de recherche, qui a un temps agité le landerneau, est devenue (à l’heure où j’ai fait ma requête) périphérique. Qwant n’ayant pas réussi à s’affranchir de Bing.
- Les personnes les plus impliquées sont des politiques, et non des industriels : les plus visibles sont Emmanuel Macron, Bruno Le Maire, Cédric O et Thierry Breton, … Mis à part le charismatique patron d’OVH (Klaba), et quelques autres, on est étonné de ne pas voir figurer les noms des patrons d’Orange ou de Dassault. Ils ne sont pas en première ligne. On pourrait en déduire que la souveraineté numérique n’est pas en haut de leur agenda.

 

Conclusion : Examen de passage réussi brillamment pour Géotrend :-)
Il me semble que l’outil a très bien réussi à traduire les positions des acteurs. Je vais tester d’autres requêtes et faire d’autres analyses. À suivre …



 

 

thomas binant jerome bondu NPL

J’ai visité hier le salon Big Data et Intelligence artificielle à Paris. J’y ai retrouvé Thomas Binant devant le stand Geotrend
Thomas a par la suite animé une conférence avec Camille Pradel et la société Explore, sur une étude pour la Société du Grand Paris. Camille Pradel a notamment détaillé les rouages du traitement automatique des langues ou NLP. Domaine passionnant que Camille a bien su vulgariser. Il a par exemple rappelé la difficulté pour une machine de percevoir l’ironie. Il y a quelques années Bernard Normier avait déjà pointé cette difficulté (voir sa conférence au Club IES).

nothing to hide snowden

La maitrise de l’information est plus que jamais d’actualité. Outre les innovations mises en avant par les exposants sur le salon Big Data, j’ai bien aimé le mur « Nothing to hide » mis en place par la Gaitée Lyrique ! En rappelant le message d’Edward Snowden sur un mur complet et en offrant un cache webcam, cette œuvre alliait art, démocratie et activisme.

Hier paraissait aussi dans Les Echos un article au titre quelque peu pessimiste « Pourquoi l’intelligence artificielle cale ? » En réalité le contenu de l’article est plus nuancé que le titre, et souligne qu’il y a de très nombreuses tâches qui sont déjà confiées avec succès à des IA. Par contre, il y a encore des obstacles comme sur la reconnaissance d’images. C’est pour cela que les voitures sans conducteurs ne se sont pas encore imposées. Le mot de la fin est donné à Yann Le Cun, que l’on ne présente plus : « Il peut y avoir des progrès fantastiques dans quelques mois, quelques années, dix ans, vingt ans… ».

Prochain salon : i-expo ! J'animerai une table ronde mercredi 23/09 vers 13h sur le choix des outils de veille avec notamment Geotrend (encore :-) et Sindup. Titre de la table ronde : L’intelligence économique et la veille en 2020 : quelles plateformes choisir ? Comment automatiser votre veille ?

Au plaisir de vous y retrouver.


Jérôme Bondu





presse citronJe recommande cer article intéressant de Presse Citron "Cette IA permet de simuler des discussions avec de grands penseurs de l’humanité". Il y a quelque temps quand Google avait communiqué sur « la mort de la mort » j’avais imaginé le phénomène suivant :
En collectant tout sur tout sur nous, Google est déjà en capacité de recréer notre double numérique.

On peut imaginer que dans l’avenir, à notre mort, Google pourrait vendre à nos descendants la capacité de (au choix) :
- faire disparaitre nos données,
- de les récupérer,
- de les garder en ligne (sous forme d'abonnement annuel évidemment).
- voire de les modifier (positivement) moyennant évidemment monnaie sonnante et trébuchante.

J’avais aussi imaginé que Google vende la capacité d’interroger des morts sur des sujets précis. Imaginons que la vie de De Gaulle soit entièrement numérisée. Il serait possible de lui demander des conseils sur la position à tenir face à Trump. Avec cet article de Presse Citron, on sent bien que l'on avance petit à petit vers cette solution.

Il y a eu aussi il y a environ un an, un article sur un ingénieur qui a numérisé les paroles de son père (qu’il a longuement interviewé). Son père est décédé. Et grâce à une Intelligence Articielle, il a pu continuer à converser avec lui.

L’avenir va être passionnant. Mais ce qui est sûr, c’est qu'avec la puissance des GAFAM et des BATXH, il sera culturellement très américain et chinois, pas européen ! A moins que l'Europe prenne conscience de l'effort collectif à fournir dans cette direction.

Jérôme Bondu



digimindLa dernière publication de Digimind souligne l'essort de TikTok chez les jeunes.
Extrait :
"Chez la génération Z (15-24 ans), le top des plateformes sociales et messageries les plus utilisées est différent : les médias sociaux préférés sont YouTube (71 % des utilisateurs actifs de 15-24 ans sur au moins une plateforme sociale durant les 30 derniers jours), Snapchat (70% ) et Instagram (69%).
Mais les plus fortes hausses d'utilisation pendant le confinement placent en tête TikTok (+27 points par rapport à 2019 avec 35%), WhatsApp (+18 points avec 63%) et Discord (+9 points avec 24%)".

Lire la suite sur le Blog de Digimind