0saves

oracle future twitter

Utiliser « Google trends » pour anticiper le futur

Voilà un fait intéressant. Si l’on en croit le magazine américain Wired, la communauté du renseignement américain utiliserait google trends pour voir le futur, enfin plutôt pour anticiper les pics liés à un évènement.

Pour cela, il aurait à leur disposition une version plus sophistiquée de la version tout public fourni par Google, comportant en plus les pointes et les « hot trends » de Twitter et de Youtube.

Bon évidemment tout cela n’est pas fourni directement par Google mais plutôt par l’IARPA, le « think tank » de recherche du renseignement américain, qui a annoncé récemment le lancement d’un nouveau programme qui a pour but de mettre en place une solution efficace pour « parcourir le web, collecter des données publiques et les analyser afin d’en extraire des tendances futures et prédire l’apparition d’évènements dans le monde », cela évidemment « avant les médias ».

Un objectif : anticiper tout changement dans le « zeitgeist »

L’idée, si j’ai bien compris, est de collecter des données sur des évènements passés (crises politiques, instabilité économique, catastrophes naturelles, pandémies, pénuries de matières premières….) afin d’en extraire tout le corollaire de « blips », de pics (hot trends) et de signaux faibles dans les réseaux sociaux, les blogs, les forums… référencés par les moteurs de recherche tels que Google, afin de construire des modèles mathématiques d’évènements. Permettant ainsi d’anticiper l’apparition d’un évènement du même ordre.

Il ne s’agit ni plus ni moins que d’analyser tout les frémissements qui secoue le « zeitgeist« , c’est à dire « l’esprit actuel du temps », et pouvant amener à un changement dans la conception prévalente du monde à un temps T.

Extrapolation de Google Flu

C’est indéniablement un projet d’une taille énorme, même si cela n’est pas vraiment nouveau. Google lui-même s’était lancé en 2009 dans la construction de modèles prédictifs en analysant l’ensemble de ses données référencées, dans un but, il faut l’avouer, beaucoup plus philanthropique que les services de renseignements américains.

C’était le projet Google Flu Trends qui avait pour but de prévoir l’évolution de la pandémie de la grippe aviaire dans le monde.

Plus récemment encore, un autre organisme public, la Banque d’Angleterre, avait annoncé utiliser les données provenant de tendances de recherches sur des moteurs de recherche, et notamment depuis Google trends, pour comprendre un certain nombre de tendances économiques, comme par exemple la corrélation des recherches sur les termes « estate agents » (agents immobiliers) avec l’évolution de l’inflation sur les prix de l’immobilier, idem pour l’évolution des courbes du chômage avec des recherches comme « unemployment » et « JSA » (RSA).

Utiliser des données publiques comme sources de renseignements : une évolution logique

Au fond, cet intérêt des services de renseignement pour les données publiques n’est pas nouveau. Le travail de journalisme n’étant au final pas si différent de celui d’officier de renseignements, hormis la portée évidemment. A savoir, tenter de collecter par tous les moyens possibles de l’information.

En plus la masse des données ouvertes est considérable, à condition que l’on puisse filtrer le bruit des parasites pour en extraire des données valables. Sans compter que ces données publiques sont extrêmement dynamiques et réactive, beaucoup plus que les données provenant de circuits moins officiels.

Tout cela explique pourquoi les services de renseignements s’intéressent de plus en plus à des outils « open et cloud » permettant de « crawler » en temps réel la toile de blogs, réseaux sociaux, forums…

La prochaine étape : affiner les prédictions

La prochaine du IARPA sera d’affiner les prédictions, de façon à être sûr que celles qui sortent soit celles qui deviennent des réalités. En effet, si Internet et ses données peut fournir des réponses, reste à savoir poser les bonnes questions.

Mais avant d’en arriver là, le IARPA devra se contenter de trouver des moyens et des outils pour collecter un maximum de données, de tous types possibles (texte, vidéos, audios, stream, statistiques…), afin de pouvoir plus facilement se poser les bonnes questions.

Source : wired.com

0saves
Si vous avez aimé ce "post", n'hésitez pas à laisser un commentaire ou vous abonnez à notre flux RSS.