Ioana Manolescu, chercheuse à l’Inria (L’Institut national de recherche en informatique et en automatique) et enseignante à l’École polytechnique, veut mettre les bases de données au service du journalisme.

Parfois, en dessous d’une publication quelque peu douteuse sur Facebook, vient s’afficher un encart des Décodeurs du Monde, certifié « média de vérification » par la plateforme. Une polémique sur des propos controversés ? Désintox, le service de fact-checking de Libération mène l’enquête pour vous, afin de vérifier la véracité des propos tenus. La massification des contenus de désinformation et leur viralité sur les réseaux sociaux ont poussé les médias traditionnels à revêtir leur casquette de Sherlock Holmes pour discerner le vrai du faux. Difficile de faire face néanmoins à un tel flot de contenus approximatifs, tronqués, voire mensongers. L’informaticienne et chercheuse Ioana Manolescu tente pourtant de répondre à ce défi de taille.

Les algorithmes de la vérification

Pour cela, elle dispose d’un outil précieux : les bases de données. Selon elle, la création de « boites noires », regroupant un grand nombre de ressources sur un sujet donné peut faciliter le travail des journalistes. L’un des axes principaux de ses travaux de recherche consiste à tenter de modéliser le processus de vérification d’une information. En analysant un contenu et grâce aux données disponibles dans la boite noire, l’algorithme est capable de repérer les passages suspects, de croiser les données et de les mettre en perspective avec un contexte. A l’aide d’informations de référence envoyées automatiquement par la base de données, le journaliste peut finalement vérifier l’information avec plus de facilité et d’efficacité.

Le système permet aussi de repérer des chiffres, des mots-clés, voire des entités numériques (sites, profils, etc.) pour faciliter l’accès à des sources de données de référence. Conséquence directe : une recherche sur l’Insee par exemple, sera plus ciblée, rapide, et efficace. I. Manolescu explique également que « si une personne publie un contenu suspect, vous saurez tout de suite si dans le passé, cette même personne a raconté qu’il y avait du sperme de taureaux dans les hamburgers MacDonald. »

Un accueil timoré

Si ses travaux de recherche ont de quoi séduire, ils restent peu plébiscités par les médias traditionnels. « Historiquement, les journalistes ne construisent pas de bases de données. Ils se voient plus comme des écrivains que des techniciens. Ils pensent que ça ne fait pas partie de leur job » précise la chercheuse. Elle déplore l’absence presque totale de politique de gestion des ressources numériques sur le long-terme dans la majorité des grands médias français, Ouest-France étant l’exception qui confirme la règle. L’informaticienne pointe toutefois la difficulté pour les médias généralistes de créer des bases de données qui couvriraient « tout », et même des sujets qu’ils ne sont pas encore amenés à traiter. L’intransigeance quant à la protection des sources apparaît comme un obstacle de plus à la mise en place de ce système.

Si elle comprend la réticence de certains journalistes, Ioana Manolescu ne manque pas de rappeler que les bases de données sont déjà partout dans notre vie : « aujourd’hui, on utilise entre 20 et 40 fois des bases de données tous les jours ». Selon elle, l’intégration de ces fameuses « boites noires » au processus de vérification d’information par les journalistes n’enlèverait en rien la dimension humaine de cette profession. Au contraire, elle présente ses travaux de recherches comme un outil complémentaire au service d’une meilleure efficacité journalistique.