Dans le cadre de la bourse 2022-2023 de l'Edgelands Institute, Dario Rodighiero a exploré l'interaction complexe entre la surveillance, la sécurité mondiale et la vie privée dans le discours public d'aujourd'hui à l'aide d'outils de visualisation de données tels que la carte météorologique.
La surveillance est un sujet émergent dans le débat public, principalement en raison de son utilisation controversée, visible dans les nombreux articles de journaux. Par exemple, Pegasus - un logiciel espion vendu sous licence par le ministère israélien de la défense pour capturer des terroristes et des criminels - a récemment été utilisé pour espionner des journalistes et des militants des droits de l'homme (Gupta 2023). Les États-Unis ont récemment abattu dans le Montana un ballon de surveillance prétendument envoyé par la Chine, ce qui a accru les tensions politiques entre les deux pays (Cooper et Wong, 2023). Enfin, la Corée du Sud a lancé avec succès dans l'espace sa première fusée pour mettre en place un réseau de satellites nationaux, qui comprendra un système de surveillance dans un avenir proche (Sang-Hun 2022). Toutes ces histoires tracent une frontière ténue entre les intérêts nationaux et la sécurité mondiale, entrelacés avec la vie privée, nous rappelant la difficulté de saisir des phénomènes complexes à partir du discours public. La surveillance ne fait pas exception.
Les récents développements dans le domaine de la visualisation des données (Lima 2011) et des outils numériques (Rogers 2013) ont ouvert de nouvelles opportunités pour répondre à des questions complexes en analysant et en visualisant de grands ensembles de données d'information. La méthode pédagogique de la cartographie des controverses - fondée par Bruno Latour (2021) et étudiée par différents chercheurs à travers le monde (Venturini et Munk 2022) - a spécifiquement suscité un intérêt pour la compréhension des débats publics en identifiant les acteurs clés et les conflits interpersonnels.
Située dans le domaine de la cartographie des controverses, la Weather Map est une méthode visuelle développée pour extraire et visualiser les acteurs les plus actifs et leur dynamique à partir de corpus d'articles de journaux (Rodighiero et Daniélou 2023). Créée à partir de l'initiative Media Cloud (Roberts et al. 2021), la Weather Map applique la visualisation de réseau et l'analyse de texte pour cartographier tout discours public en une série de groupes d'acteurs organisés dans l'espace. Inspirée des cartes météorologiques synoptiques, la méthode utilise la grammaire visuelle des cartes météorologiques synoptiques pour représenter les tendances émergentes à partir d'un large corpus de textes.
Dans le cadre de la bourse 2022-2023 de l'Institut Edgelands, j'ai adapté le modèle Weather Map en téléchargeant, analysant et cartographiant tous les articles du New York Times dans lesquels le terme "surveillance" était mentionné au moins une fois. Les archives de Media Cloud ont fourni plus de 3 000 articles de journaux des 13 dernières années, ce qui a permis d'identifier plus de 20 000 acteurs mentionnés dans le corps du texte. Ces informations ont été triées par fréquence et mesurées par co-citation, générant une instance de carte pour la surveillance dans laquelle les grappes regroupent les acteurs fréquemment mentionnés dans les mêmes articles (voir la figure 1 ci-dessous).
Figure 1. Cette capture d'écran illustre l'instance de Weather Map sur le thème de la surveillance, créée en analysant et en cartographiant plus de 3 000 articles de journaux du New York Times. La visualisation est intégrée dans une interface web qui est librement accessible sur GitHub à l'URL suivante, https://rodighiero.github.io/Edgelands/.
Ce que nous pouvons voir sur la carte est performatif car il varie d'un individu à l'autre (Drucker 2014). La lecture de la carte commence par l'interprétation des lignes d'élévation qui identifient les pics d'activité, indiqués par la lettre "H" en rouge - correspondant à l'anticyclone de la carte météorologique synoptique. La taxonomie du New York Times aide également à se familiariser avec l'espace, en donnant un aperçu du contenu de zones spécifiques. Une fois qu'il a identifié un groupe d'intérêt potentiel, le lecteur peut effectuer un zoom à l'aide de l'interface interactive qui intègre la carte. Cette action déclenche un échange en remplaçant la couche initiale d'informations par un ensemble d'entités. Les acteurs, ou entités dans le jargon de l'analyse de texte, représentent les individus, les lieux, les organisations et les sujets qui donnent forme à chaque groupe. Regroupés parce qu'ils apparaissent souvent ensemble dans les articles de journaux, les acteurs donnent une idée de la raison d'être de chaque groupe particulier.
La figure 2, par exemple, montre un cluster lié à l'immigration et aux frontières. Les sujets en gris permettent de donner une idée du sujet du cluster en utilisant un modèle entraîné sur le corpus NYT (Bhargava et al. 2017). D'autre part, en bleu, les acteurs "Mexico" et "Mexico City" sont deux exemples de lieu, tandis que les acteurs "National Guard" et "Border Patrol" sont deux exemples d'organisation. Sur le panneau de gauche, l'acteur "Border Patrol" est sélectionné, montrant quelques caractéristiques clés comme la tendance de fréquence et la distribution annuelle ; en outre, une liste aléatoire d'URL permet au lecteur d'ouvrir les articles du NYT qui définissent la position de l'acteur dans la carte, dans une tentative de connexion à l'information à la source. Le code couleur, qui suit la grammaire visuelle des cartes météorologiques synoptiques, est bleu lorsque la tendance de l'acteur est négative, c'est-à-dire inférieure à l'augmentation moyenne des acteurs dans l'ensemble des données sur la surveillance.
La figure 2 montre un groupe lié à l'immigration et aux frontières. L'image montre un groupe lié à l'immigration et aux frontières. Les acteurs sont représentés par leur nom et un code couleur, tandis que le panneau de gauche présente quelques détails sur un acteur sélectionné. Le bleu prédominant indique que ce groupe a une tendance négative par rapport à la moyenne des acteurs apparaissant sur la carte.
La carte météo s'appuie sur le mouvement de zoom de l'image complète à chaque article de journal, reliant la visualisation au corpus correspondant. La carte a une double fonction : servir des articles individuels et une représentation globale des sujets en vogue sur la surveillance. Parmi ces sujets, il est possible d'identifier différentes discussions principales : l'une concerne la tension entre l'individu et la vie privée sur le web - visible au milieu de la carte - où des milliers d'entreprises profilent les internautes pour tirer profit des données personnelles en les vendant à des gouvernements et à des industries (Warzel 2019). Une autre discussion sur les armements et les relations internationales se situe en haut à gauche de la carte (Rubin et Schmitt 2019), tandis que juste en dessous se trouve un groupe sur l'espace et la surveillance du ciel (Overbye 2016). Enfin, une autre discussion clé est liée aux services de renseignement et au terrorisme (Savage et Fandos 2020) - accessible depuis la partie centrale en haut à droite de la carte. Il s'agit là des discussions les plus visibles qui composent le débat public actuel sur la surveillance du point de vue du New York Times.
Tous les groupes décrits ci-dessus sont liés à la surveillance, mais sont très spécifiques à certains discours. Bien qu'une lecture attentive et un engagement personnel soient essentiels pour comprendre notre monde, il est facile de passer à côté de l'ensemble du tableau dans ce déluge d'informations numériques. La carte météo vise à résumer les grands débats publics, en prêtant attention aux sous-discours spécifiques et à leurs acteurs. Malgré quelques réalisations intéressantes, le projet présente encore des limites et doit être développé davantage. Toutefois, il est essentiel de replacer ce projet dans le contexte des développements futurs afin d'améliorer notre capacité à lire davantage d'informations. La manière dont l'information sera accessible à l'avenir ouvre une réflexion intéressante sur la conception des plateformes, et plus particulièrement sur la manière de gérer la granularité des articles de journaux ainsi que leur agrégation à l'aide d'outils visuels. L'idée de considérer les articles de journaux comme une seule entité ne remplace pas la lecture attentive, mais offre une vision complémentaire dans laquelle la totalité de l'information est un objet intelligible à observer à travers les alliances d'acteurs et les fils d'actualité au fil du temps. Pour reprendre les mots de Marshall McLuhan, nous avons la possibilité de repenser l'information de manière à améliorer le potentiel de la société actuelle.