• l’année dernière

Category

🗞
News
Transcription
00:00 Alors on va passer tout de suite à la présentation d'Elise Noga-Hartmann.
00:09 Vous êtes doctorante en sciences sociales computationnelles au Media Lab de Sciences
00:14 Po et au Lattice de l'ENS.
00:16 Je vous invite à...
00:18 Et donc vos travaux portent sur les dynamiques de diffusion des propos rapportés dans l'espace
00:25 public numérique et l'article que vous nous présentez s'intitule "Modéliser le paysage
00:30 médiatique français par son utilisation de la parole politique officielle".
00:34 Exactement.
00:35 Je voudrais vous remercier d'avoir organisé cette journée.
00:38 Merci à tous ceux qui sont encore là et vive d'esprit pour m'écouter.
00:41 Et merci pour la possibilité de présenter ces travaux.
00:45 Du coup, moi je vais vous parler de presse écrite en ligne et plus particulièrement
00:52 de citations.
00:53 Le point de départ de ce travail-là, c'est la notion même de citation, à quoi ça sert
00:58 et comment c'est utilisé à la fois par les politiques qui vont fournir le texte à citer
01:03 et par les médias qui vont utiliser ce texte pour répondre à plusieurs stratégies.
01:08 On a trois grandes stratégies qui sont identifiées dans la littérature.
01:12 Premièrement, la production de mots, tout simplement.
01:13 On a un article, on veut le remplir, on veut l'illustrer.
01:16 "Machin" a dit ça, et bien on va le remettre dedans parce que "machin" parle très bien
01:19 du sujet et puis de toute manière ce sont ses mots.
01:21 Donc on ne va pas non plus trop s'impliquer idéologiquement puisqu'on rejette la responsabilité
01:29 de ce qui est dit sur la personne qui est citée par la citation.
01:32 Il y a aussi une stratégie de reformulation pour s'assurer de ne pas dénaturer un discours
01:37 qui a été produit.
01:38 On peut utiliser la citation directement comme éventuellement verbatim précise ou
01:45 légèrement modifiée puisque le français fonctionne un peu étrangement là-dessus,
01:51 pour du coup reformuler, remettre en contexte et s'assurer que tout l'éventail des points
01:58 de vue est bien développé.
02:00 Et enfin, une stratégie de buzzification, si on peut dire, en tout cas d'audience,
02:06 qui a été découverte, enfin, pas découverte mais mise au jour et étudiée plutôt récemment,
02:12 de "on va utiliser la citation parce que utiliser les mots de cette personne ou utiliser
02:19 ce genre de mots-là, ça va faire vendre, ça va faire parler, ça va amener beaucoup
02:23 de flux sur le site du Média en ligne".
02:28 Et cette dernière stratégie d'audience nous ramène vraiment aux dynamiques entre
02:35 le discours et la citation, cette dynamique de co-construction de la lisibilité et de
02:40 la visibilité du monde social.
02:42 Récemment, les travaux de Magneau ont réfléchi à la généalogie de ce qu'on appelle la
02:48 petite phrase, donc une citation courte, une citation politique et une citation à but
02:53 vraiment d'audience.
02:54 Et cette petite phrase n'est en même temps que le parlementarisme.
02:57 Donc on a vraiment, dès le départ, un croisement entre la manière dont les politiques vont
03:04 structurer leur discours et la manière dont les médias vont le reprendre.
03:07 Cette co-construction ne s'effectue pas n'importe comment, elle s'effectue bien
03:13 évidemment à partir d'une position dominante.
03:15 Ce n'est pas n'importe qui qui cite et ce n'est pas n'importe qui qui est cité.
03:18 Donc dans mon étude, c'est la parole présidentielle et globalement en France, la parole qui est
03:25 la plus reprise, c'est d'abord la parole présidentielle, puis la parole gouvernementale
03:28 et la parole des députés.
03:30 Aussi, on retrouve la parole de certains dirigeants de groupes politiques, mais seulement s'ils
03:38 sont d'envergure et qu'ils n'appartiennent pas aux groupes précédemment cités.
03:41 Et cette co-construction, à partir de cette position dominante, elle participe donc de
03:48 la mise à l'agenda, puisque les politiques décident de ce qu'ils racontent, les médias
03:53 citent ce qui a été précisément décidé par les politiques et les sujets qui ont
04:02 été abordés finissent à l'agenda médiatique en tout cas.
04:07 La grande question ici à l'ARCOM, c'est de se demander, est-ce que c'est neutre ?
04:13 Alors, spoiler alert, la réponse est non.
04:16 Et donc cette étude s'interroge sur les méthodes pour comprendre comment chaque source
04:21 d'information cadre le débat public.
04:23 Et la question vraiment importante là derrière, c'est de savoir si on est capable de mettre
04:29 au jour les biais de citations.
04:32 Et pour faire ça, je m'inspire d'une étude américaine qui a réussi, je vais vous montrer
04:38 leurs résultats, à le faire sur les données américaines.
04:43 Donc eux, ils mettent au jour des différences entre évidemment démocrate et conservateur.
04:50 Et donc cette étude de Nikulaé Hall, publiée en 2015, intitulée "Quotis the structure
04:55 of political media coverage as revealed by quoting patterns", s'intéresse donc à
05:01 la mise en évidence des biais de citations.
05:02 La méthode, et désolé, ça va rentrer un peu dans le dur, en premier on crée un graphe
05:11 bipartite.
05:12 Donc un graphe bipartite, c'est un graphe qui contient des nœuds séparés en deux
05:17 groupes et tous les liens dans ce graphe vont d'un groupe vers l'autre.
05:21 Et le graphe qu'on construit ici, c'est un graphe des médias vers des clusters de
05:26 citations.
05:27 Alors dans l'article original, ils sont partis donc d'un grand nombre de médias américains
05:31 et ils sont arrivés au cluster de citations des discours officiels de Barack Obama.
05:36 Moi je fais ça avec des médias français et Emmanuel Macron du coup.
05:41 Ensuite, ce graphe est transformé en matrice, qu'on factorise par SVD, Singular Value Decomposition,
05:49 on n'est pas obligé de rentrer là-dedans.
05:50 En tout cas, on obtient trois matrices différentes qui, multipliées les unes aux autres, redonnent
05:59 cette première matrice.
06:00 Et pour faire un petit lien avec mon collègue du Media Lab, c'est très utilisé pour
06:08 les systèmes de recommandation, ce système de factorisation de matrice.
06:12 Les matrices qu'on obtient, la première et la dernière, elles vont décrire les
06:17 axes de la première matrice.
06:19 En gros, ce qui nous arrive ici, c'est que la première matrice, par ses deux premières
06:27 colonnes, va nous permettre d'assigner des coordonnées à chacun de nos médias pour
06:34 les placer dans un espace en deux dimensions.
06:36 La preuve visuelle arrive juste après, ne vous inquiétez pas.
06:40 Et enfin, les auteurs font un calcul de surprise pour caractériser les écarts intra- et inter-catégories
06:50 sur les propensions à citer de la même manière.
06:53 Cette mesure de surprise va permettre de voir si tous les médias qui sont vraiment très
06:58 conservateurs citent exactement les mêmes parties du discours d'Obama.
07:01 Parce qu'au final, l'intuition derrière cet article, c'est de dire, on se rend compte
07:07 que dans la presse, il y a des parties du discours d'Obama qui sont citées que par
07:11 les conservateurs, des parties du discours d'Obama qui sont citées que par les démocrates,
07:15 des parties qui sont citées par tout le monde.
07:17 Et donc, là derrière, il y a forcément des motivations.
07:19 Je vous la donne, histoire qu'on sache exactement de quoi on parle.
07:27 Je n'expliquerai pas en détail la formule.
07:30 Mais l'idée de la mesure de surprise, et du point de vue de la méthodologie, c'est
07:35 intéressant d'en parler, puisqu'on peut se dire, tiens, quand même, il y a forcément
07:39 plus de médias dans une catégorie que dans une autre.
07:42 Il y a forcément plus de liens quelque part.
07:43 Il y a forcément des catégories qui sont plus intéressées parce que le président
07:46 a à dire ou pas.
07:47 Dans la mesure de surprise, on s'intéresse d'abord à la propension moyenne de citations
07:52 reprises par un média d'une catégorie A, qu'ils sont également par un média d'une
07:56 catégorie B dans le Graph G, donc la matrice globale qu'on a construite.
08:00 Mais on compare ces résultats à toute une génération, toute une suite de générations
08:07 de scénarios aléatoires.
08:08 Donc, globalement, la taille, on ne la regarde pas trop et on va pouvoir observer les déviations
08:15 par rapport à ce qui se passerait si personne n'était biaisé jamais.
08:17 Et donc, les résultats de l'étude américaine, ça y est, la preuve graphique est là.
08:23 C'est un espace en deux dimensions qui classe les médias.
08:29 Donc là, on voit qu'ils ont bien obtenu une différence claire entre les médias conservateurs
08:35 et les médias démocrates et des scores de surprise qui montent les propensions à citer
08:43 de la même manière, inter- et intra-catégories.
08:46 Par exemple, ici, si on regarde première ligne, troisième colonne, on se rend compte
08:50 que les médias "declared conservative" et les médias "suspected liberal" ont des
08:55 patterns de citations extrêmement différents puisqu'on est à -9.7 d'écart et c'est
09:01 à relier à l'écart type.
09:04 Vous comprenez que 9.7, c'est une belle différence.
09:08 A contrario, les médias "suspected liberal" au sein de leur catégorie vont avoir des
09:15 patterns de citations plutôt cohérents puisqu'on a un score de 6.1.
09:19 Les données utilisées dans le cadre de ce travail sont en premier un corpus de presse
09:26 en ligne de plus de 100 titres francophones.
09:28 Donc on a un peu de tout, des journaux nationaux quotidiens, de la presse spécialisée, des
09:33 titres régionaux, des journaux étrangers francophones d'un peu partout.
09:38 C'est des articles qui sont parus entre le 1er janvier 2018 et le 31 décembre 2022,
09:45 représentant environ 17 millions d'articles, un peu plus, et 5 milliards de mots.
09:49 Et un deuxième corpus des transcriptions officielles des discours d'Emmanuel Macron,
09:57 là c'est récupéré directement sur le site vipublic.fr qui indique dans ces conditions
10:04 générales d'utilisation que les données sont ouvertes.
10:06 Si vous voulez le faire vous aussi ou juste récupérer mes données, j'ai mis le code
10:12 en ligne.
10:13 Évidemment en France on n'a pas des médias conservateurs d'un côté, démocrates de
10:21 l'autre, donc il a fallu réfléchir à un groupement différent.
10:24 Et là-dessus encore un petit lien avec mes collègues du Médialab.
10:28 Le travail de Jean-Philippe Cointet et Holl de 2021 qui s'intéressent aux catégories
10:35 qu'on peut appliquer à la presse française en ligne.
10:38 Ces catégories sont créées par rapport aux liens entre les différents médias sur
10:47 Twitter.
10:48 Donc plus il va y avoir de conversations, plus ils vont être proches les uns des autres
10:53 et puis on a tout de même des liens intercatégories.
10:55 Ce qu'on retrouve surtout, ce sont les quatre grandes catégories, donc mainstream, périphérie,
11:02 journalisme d'opinion et contre-information.
11:04 Ce sont les catégories qu'on va retrouver dans les données utilisées, à l'exception
11:09 de Parallel Universe, qui n'est pas dans les journaux observés, et la presse informatique.
11:17 Et donc les résultats de cette étude, on n'observe pas, et ça c'est la première
11:27 découverte, on n'observe pas une différence droite-gauche marquée en France sur la manière
11:33 dont la presse en ligne va citer la parole présidentielle.
11:37 On a un peu de tout mélangé, regardez, Valeurs Actuelles est à côté du Monde, très loin
11:44 de France Inter, enfin gauche-droite, c'est pas la bonne manière de lire ça.
11:50 Par contre, on peut s'intéresser aux travaux de Judson et notamment à ce qu'il expliquait
11:56 sur la professionnalisation des médias.
11:57 Le fait que plus un média va se professionnaliser, plus il va avoir une manière spécifique
12:03 de traiter la parole politique officielle, et ce mécanisme va se renforcer au fur et
12:10 à mesure de l'intégration de journalisme issu d'écoles de journalisme, à qui on apprend
12:14 à traiter cette parole politique officielle d'une manière très spécifique.
12:17 Et ça, on le retrouve un peu sur l'axe des abscisses, avec de la presse régionale, qui
12:28 va être très loin, donc l'Union l'a redonné le plus loin, un milieu entre Valeurs Actuelles
12:34 et France Inter, Le Monde, Le Parisien, Radio France, les DNA, avec des médias qui sont
12:40 vraiment connus pour leur professionnalisation.
12:44 Et puis plus on va avancer, plus on va repartir dans les médias presque ésotériques, avec
12:51 notamment Sputnik News, qui apparaît à la fin.
12:56 Sur la mesure de surprise, il y a trois grandes découvertes.
13:00 La première, c'est qu'il existe une manière de citer à la française, et cette manière
13:05 de citer, elle est dictée par l'hypercentre, et c'est donc la colonne en vert.
13:09 Tous les médias vont avoir tendance à citer de la même manière que les médias de l'hypercentre.
13:15 Il y a des incontournables de la citation politique, et visiblement, personne n'y échappe
13:21 de trop.
13:22 À l'exception des droites identitaires révolutionnaires, qui montrent vraiment des
13:29 patterns uniques, des patterns qui leur sont vraiment très très propres, et très très
13:36 loin de tout ce que les autres médias peuvent citer.
13:38 Enfin, et je terminerai par là, la troisième découverte, qui est spécifique au corpus,
13:47 et ce corpus est différent de celui qui a été utilisé dans l'étude américaine
13:51 pour un peu spécifiquement cette raison, outre le fait qu'il soit français, c'est
13:55 la présence de journaux étrangers.
13:56 Et donc, le fait que la presse étrangère, s'inspire à des patterns de citations similaires
14:04 à la presse de l'hypercentre, à la presse du centre également, donc la case verte
14:09 dans la colonne verte et la case verte un peu toute seule par là-bas, mais va avoir
14:14 tendance aussi à s'intéresser à la parole politique officielle à la manière des tabloïds.
14:19 Donc on a une presse étrangère qui a un point de vue un peu novateur, en tout cas
14:27 qui s'intéresse à d'autres choses que simplement la politique politicienne sur
14:31 la politique française.
14:32 Je vous remercie de votre attention.
14:35 [Applaudissements]

Recommandations