L'avenir de l'information, c'est le data journalisme. Qui n'a entendu cette affirmation ces dernières années ? On n'en discutera pas ici le bien fondé. L'avenir de l'information peut être là ou ailleurs. Mais on ne peut nier que l'utilisation de données numériques dans la recherche, la mise en forme, la publication d'informations est désormais incontournable. Comme toute pratique journalistique, elle ne peut ignorer le respect des règles éthiques.
Le retour aux documents qu'implique le journalisme de données est une bonne chose. Trop souvent les journalistes sont tentés de traiter l'information à partir de résumés ou d'extraits de textes, et de vidéos, et non à partir du texte brut ou de l’image originale. Travailler sur des données implique de travailler sur les données brutes. C'est à dire aussi refuser de les traiter si on n'a accès qu'à une partie des données.
Les données publiées par les services ad hoc des entreprise ou administrations sont déjà traitées, dans un sens qui sert leur communication. Le communiqué de presse insistera toujours sur ce que son auteur veut que le journaliste mette en avant. Se reporter aux chiffres bruts permet de choisir son angle de traitement. Qu'on pense par exemple à la présentation des résultats d'une enquête d'opinion par ceux qui l'ont commandées pour mesurer combien une masse de données peut apporter d'autres informations que celle qu'on tend au journaliste.
Mais ces colonnes de chiffres peuvent rebuter, voire être totalement incompréhensibles. La plupart des journalistes ne savent pas « faire parler » ces données. Leur analyse peut permettre de repérer des tendances qui font sens ou des signaux faibles qui alertent sur un possible sujet. La recherche de corrélation entre différentes valeurs peut initier une enquête. Les journalistes travaillent désormais avec des statisticiens, des informaticiens, des infographistes. Il leur faut trouver un langage commun apprendre à formuler leurs questions qui seront traduites en programmes qui fouillent la masse de données.
Evidemment, les données analysées doivent être clairement identifiées - le journaliste dira sourcées. Pas question de travailler sur des bases de données dont on ignore l'origine. On peut exploiter des données publiques et accessibles sur les sites des administrations, d'autres auxquelles on aura spécialement sollicité l'accès. Il faut bien sûr le préciser au public. Quand il s'agit de données non publiques - des Panama Papers aux Football leaks - il est essentiel de s'assurer de la réalité des données fournies. Même au Consortium international des journalistes d'investigation (ICIJ), quelqu'un sait quelle est la source des fuites.
Il faut également interroger la façon dont ces données ont été collectées et collationnées. Si on fait appel au public dans une opération de crowdsourcing (littéralement sources dans la foule) par exemple pour une enquête sur le coût du chauffage, il faut s'assurer que les données qui remontent sont comparables et que cet appel au public n'est pas détourné à son profit par une entreprise ou un groupe de pression.
Des corrélations peuvent également s'avérer trompeuses. L'exemple souvent cité est celui de l'analyse des agressions dans une grande ville américaine à partir des données de la police, date, heure, lieu, de l'agression etc. Le quartier de la mairie apparaissait à l'analyse des données comme un des moins sûrs. Le biais était dans la saisie des données : quand l'emplacement de l'agression n'était pas précisé, les services de police, à la case localisation, notaient systématiquement le code postal de la mairie…
Lorsqu'on traduit les données en image - graphique, courbe, cartes, etc. - le journaliste doit être attentif à ce que les présentations ne faussent pas la réalité. Les proportions doivent être respectées, les origines des courbes précisées, les échelles de temps établies scrupuleusement. Des illusions d'optiques peuvent modifier la compréhension de ce qui est représenté : des études ont montré par exemple que deux cercles de même taille peuvent être perçus différemment selon qu'ils sont entourés de cercles plus petits ou de cercle plus grands.
Dans tous les cas, le journaliste contextualisera les résultats de l'exploitation des données. Surtout, il retournera sur le terrain pour interroger la pertinence de ce que le travail sur les données lui a apporté, pour humaniser les informations mises au jour via les tableaux de chiffres ou la masse des documents, enfin pour donner la parole aux personnes qui pourraient être mises en cause.
Pierre Ganz, avril 2019