Dans le cadre de la bourse 2022-2023 de l'Edgelands Institute, Dario Rodighiero a exploré l'interaction complexe entre la surveillance, la sécurité mondiale et la vie privée dans le discours public d'aujourd'hui à l'aide d'outils de visualisation de données tels que la carte météorologique.
Photo : NOAA pour Unsplash
La surveillance est un sujet émergent dans le débat public, principalement alimenté par son utilisation controversée, visible dans les nombreux articles de presse. Par exemple, Pegasus – un logiciel espion vendu sous licence du ministère israélien de la Défense pour capturer des terroristes et des criminels – a récemment été utilisé pour espionner des journalistes et des militants des droits humains (Gupta 2023). Les États-Unis ont récemment abattu dans le Montana un ballon de surveillance prétendument envoyé par la Chine, exacerbant les tensions politiques entre les deux pays (Cooper et Wong 2023). Et la Corée du Sud a lancé avec succès sa première fusée dans l'espace pour mettre en place un réseau de satellites nationaux, qui comprendra prochainement un système de surveillance (Sang-Hun 2022). Tous ces récits tracent une frontière ténue entre les intérêts nationaux et la sécurité mondiale, étroitement liés à la vie privée, nous rappelant la difficulté d'appréhender des phénomènes complexes à partir du discours public. La surveillance ne fait pas exception.
Les développements récents dans le domaine de la visualisation de données (Lima 2011) et des outils numériques (Rogers 2013) ont ouvert de nouvelles perspectives pour répondre à des questions complexes en analysant et en visualisant de vastes ensembles de données. La méthode pédagogique de cartographie des controverses, fondée par Bruno Latour (2021) et étudiée par différents chercheurs du monde entier (Venturini et Munk 2022), a notamment suscité un intérêt pour la compréhension des débats publics en identifiant les acteurs clés et les conflits interpersonnels.
Située dans le domaine de la cartographie des controverses, la Weather Map est une méthode visuelle développée pour extraire et visualiser les acteurs les plus actifs et leur dynamique à partir de corpus d'articles de journaux (Rodighiero et Daniélou 2023). Créée grâce à l'initiative Media Cloud (Roberts et al. 2021), la Weather Map utilise la visualisation de réseau et l'analyse de texte pour cartographier tout discours public en une série de groupes d'acteurs organisés spatialement. Inspirée des cartes météorologiques synoptiques, la méthode utilise la grammaire visuelle de ces cartes pour représenter les tendances émergentes d'un vaste corpus de textes.
Pour la bourse 2022-2023 de l'Edgelands Institute, j'ai adapté le modèle Weather Map en téléchargeant, analysant et cartographiant tous les articles du New York Times dans lesquels le terme « surveillance » était mentionné au moins une fois. Les archives de Media Cloud ont fourni plus de 3 000 articles de journaux des 13 dernières années, ce qui a permis d'identifier plus de 20 000 acteurs mentionnés dans les textes. Ces informations ont été triées par fréquence et mesurées par co-citation, générant une instance cartographique pour la surveillance, dans laquelle les clusters regroupent les acteurs fréquemment mentionnés dans les mêmes articles (voir figure 1 ci-dessous).
Figure 1. Cette capture d'écran illustre l'exemple de la surveillance sur la carte météo, créée en analysant et en cartographiant plus de 3 000 articles de journaux du New York Times. La visualisation est intégrée à une interface web librement accessible sur GitHub à l'adresse suivante : https://rodighiero.github.io/Edgelands/ .
Ce que l'on peut observer sur la carte est performatif, car il varie d'un individu à l'autre (Drucker 2014). La lecture de la carte commence par l'interprétation des lignes d'altitude qui identifient les pics d'activité, indiqués par la lettre « H » en rouge, correspondant à la haute pression de la carte météorologique synoptique. La taxonomie du New York Times permet également de se familiariser avec l'espace, offrant un aperçu du contenu de zones spécifiques. Une fois un cluster potentiellement intéressant identifié, le lecteur peut zoomer grâce à l'interface interactive intégrée à la carte. Cette action déclenche un échange en remplaçant la couche d'information initiale par un ensemble d'entités. Les acteurs, ou entités dans le jargon de l'analyse de texte, représentent des individus, des lieux, des organisations et des sujets qui façonnent chaque cluster. Regroupés lorsqu'ils apparaissent souvent ensemble dans les articles de presse, les acteurs donnent une idée de la raison d'être de chaque cluster particulier.
La figure 2, par exemple, présente un cluster lié à l'immigration et aux frontières. Les sujets en gris permettent de se faire une idée du thème du cluster grâce à un modèle entraîné sur le corpus du NYT (Bhargava et al. 2017). En bleu, les acteurs « Mexique » et « Mexico » sont deux exemples de lieu, tandis que les acteurs « Garde nationale » et « Patrouille frontalière » sont deux exemples d'organisation. Sur le panneau de gauche, l'acteur « Patrouille frontalière » est sélectionné, affichant certaines caractéristiques clés comme la tendance de fréquence et la distribution annuelle ; de plus, une liste aléatoire d'URL permet au lecteur d'ouvrir les articles du NYT qui définissent la position de l'acteur sur la carte, afin de tenter de se connecter à l'information à la source. Le code couleur, qui suit la grammaire visuelle des cartes météorologiques synoptiques, est bleu lorsque la tendance de l'acteur est négative, ce qui signifie une augmentation inférieure à la moyenne des acteurs dans l'ensemble des données de surveillance.
Figure 2. L'image montre un cluster lié à l'immigration et aux frontières. Les acteurs sont représentés par leur nom et un code couleur, tandis que le panneau de gauche présente quelques détails sur un acteur sélectionné. La dominante bleue indique que ce cluster présente une tendance négative par rapport à la moyenne des acteurs apparaissant sur la carte.
La carte météorologique s'appuie sur un zoom progressif, passant de l'image globale à chaque article de journal, reliant ainsi la visualisation au corpus correspondant. La carte a une double fonction : présenter des articles individuels et une représentation exhaustive des sujets d'actualité en matière de surveillance. Parmi ces sujets, on distingue plusieurs grands débats : l'un porte sur la tension entre individu et vie privée sur le web (visible au centre de la carte), où des milliers d'entreprises profilent les internautes pour exploiter leurs données personnelles en les vendant aux gouvernements et aux industries (Warzel 2019). Un autre débat sur l'armement et les relations internationales est situé en haut à gauche de la carte (Rubin et Schmitt 2019), tandis que juste en dessous se trouve un groupe de discussions sur la surveillance spatiale et aérienne (Overbye 2016). Enfin, un autre débat clé porte sur les services de renseignement et le terrorisme (Savage et Fandos 2020) ; accessible depuis le centre en haut à droite de la carte. Ce sont les débats les plus visibles qui composent le débat public actuel sur la surveillance, du point de vue du New York Times.
Tous les groupes décrits ci-dessus sont liés à la surveillance, mais très spécifiques à certains discours. Bien que la lecture attentive et l'implication personnelle soient essentielles à la compréhension de notre monde, il est facile de passer à côté de la situation dans ce déferlement d'informations numériques. La carte météo vise à synthétiser les grands débats publics, en s'intéressant aux sous-discours et à leurs acteurs. Malgré des réalisations prometteuses, le projet présente encore des limites et nécessite des développements supplémentaires. Il est cependant essentiel de contextualiser ce projet dans le cadre de développements futurs afin d'améliorer notre capacité à lire davantage d'informations. La manière dont l'information sera accessible à l'avenir ouvre une réflexion intéressante sur la conception des plateformes, et plus particulièrement sur la gestion de la granularité des articles de presse et leur agrégation grâce à des outils visuels. L'idée de considérer les articles de presse comme une seule entité ne remplace pas la lecture attentive, mais offre une vision complémentaire où la totalité de l'information est un objet intelligible à observer à travers les alliances d'acteurs et les fils d'actualité au fil du temps. Pour reprendre les termes de Marshall McLuhan : nous avons la possibilité de repenser l'information de manière à améliorer le potentiel de la société actuelle.