18 november 2012 | La Revue POLYTECHNIQUE 09/2012 | Informatics

Les maths remontent à la source des rumeurs ou des épidémies

Un chercheur de l’EPFL a développé un algorithme capable d’identifier l’origine d’une information circulant sur un réseau, ou d’une maladie à propagation épidémique. Une méthode qui pourrait également s’avérer utile aux enquêtes criminelles.

Remonter à la source. Les enquêteurs de tout poil savent à quel point la tâche peut se révéler ardue. Paradoxalement, elle l’était peut-être moins dans les «anciennes» organisations criminelles de type mafieux, dont la structure hiérarchique ressemblait, peu ou prou, à un arbre généalogique.

Aujourd’hui, calquée sur le modèle d’Internet, la grande criminalité s’organise en réseaux. Nœuds et connexions nombreuses démultiplient la complexité des structures, rendant d’autant plus difficile l’identification d’une source. Pedro Pinto, post-doctorant au Laboratoire de communications audiovisuelles de l’EPFL, est toutefois parvenu à mettre au point un algorithme qui pourrait s’avérer un précieux allié pour ceux qui doivent se livrer à de telles investigations, que ce soit dans un contexte criminel ou dans toute enquête faisant intervenir des réseaux. Ses recherches sont publiées dans les Physical Review Letters.

Trouver l’origine d’une rumeur sur Facebook

«Grâce à notre méthode, nous parvenons à remonter à la source de tous les types d’informations circulant dans un réseau, et ce en n’»écoutant» qu’un nombre restreint de membres», explique Pedro Pinto. Voici un exemple: imaginez que parvienne à vos oreilles une rumeur vous concernant, véhiculée sur Facebook et diffusée à 500 personnes – vos amis ou les amis de vos amis. Comment savoir qui en est à l’origine? «En observant les messages reçus par quinze à vingt de vos contacts seulement, et en prenant en compte le facteur temps, notre algorithme est capable de refaire à l’envers le chemin parcouru par l’information et de remonter à sa source», poursuit le chercheur.

Retracer la propagation d’une épidémie

La même démarche pourra être appliquée pour identifier l’origine d’un pourrielou d’un virus informatique. Hors du monde virtuel, elle est en mesure de trouver la source primaire d’une maladie infectieuse, telle que le choléra, par exemple. «Nous avons testé notre méthode avec les données recueillies par le Laboratoire d’écohydrologie d’Andrea Rinaldo concernant une épidémie observée en Afrique du Sud», reprend Pedro Pinto. «En modélisant les réseaux de circulation d’eau, les rivières ou les transports humains, nous avons pu retrouver l’endroit où se sont déclarés les premiers cas».

Il en va de même des actes terroristes, tels que l’attaque du métro de Tokyo au gaz sarin (1995), ou la circulation du poison suivait le réseau des galeries souterraines. «Avec à cet algorithme, il ne serait pas nécessaire d’équiper chaque station de détecteurs: un échantillonnage suffirait à détecter rapidement l’origine de l’attaque et à agir avant qu’elle se propage trop loin», assure le chercheur.

Identifier le cerveau d’un attentat

Les données liées aux communications téléphoniques passées durant la préparation des attentats du 11 Septembre ont, elles aussi, fourni la base à un test du système développé par Pedro Pinto: «En reconstruisant le réseau de ces terroristes uniquement sur la base des informations parues dans la presse, notre système nous a livré trois suspects potentiels – dont l’un était le leader avéré de ces attaques, selon l’enquête officielle».

La méthode fait donc ses preuves a posteriori. Selon Pedro Pinto, elle pourrait également être mise en œuvre dans une optique de prévention. «En choisissant judicieusement des points de contrôle, on pourrait ainsi détecter plus vite une propagation épidémique», pense-t-il. Elle serait aussi un outil de choix pour les spécialistes du marketing viral, ces publicités qui se diffusent par Internet et les réseaux sociaux, dont il serait dès lors plus facile d’observer ou d’anticiper la circulation.