Passer au player
Passer au contenu principal
Rechercher
Se connecter
Regarder en plein écran
Like
Favori
Partager
Plus
Ajouter à la playlist
Signaler
Journée d'études 2024 de l'Arcom : Thibault Grison, Virginie Julliard, Yannick Zelle
Arcom
Suivre
il y a 1 an
https://www.arcom.fr/actualites/troisieme-journee-detudes-de-larcom-presentation-des-travaux-des-chercheurs-sur-les-medias-audiovisuels-et-numeriques
Catégorie
🗞
News
Transcription
Afficher la transcription complète de la vidéo
00:00
Comment est-ce possible d'avoir un cadre d'analyse pour les risques et l'évaluation des pratiques de plateformes ?
00:05
Comme on l'a vu, on peut avoir un cadre d'analyse pour les risques et l'évaluation des pratiques de plateformes.
00:12
On a besoin de données, on en a parlé en introduction.
00:15
Mais on a aussi besoin parfois d'outils pour analyser ces données.
00:19
Et c'est pour ça que je vais changer d'anglais pour la première présentation
00:23
et donner la parole à Yannick Zeller, Thibaut Grison et Virginie Julliard.
00:28
Yannick, vous êtes un scientifique de données à CERES,
00:32
le Centre d'expérimentation en méthodes numériques pour les recherches en sciences humaines et sociales.
00:37
Thibaut, vous êtes un étudiant doctoral à CELSA-GRIPIC.
00:41
Votre thèse concerne la discrimination algorithmique et la modération des contenus,
00:45
mais on va en savoir plus cet après-midi.
00:48
Et Virginie Julliard, vous êtes professeure complète à CELSA-GRIPIC, fondatrice et directrice de CERES.
00:54
Votre travail se concentre sur la représentation du genre dans les médias
00:56
et sur l'utilisation des sciences de la computerisation dans les sciences sociales.
01:00
La parole est à vous.
01:02
Merci beaucoup. Nous avons conçu cette présentation en deux langues.
01:07
Thibaut et moi parlerons en français et Yannick en anglais.
01:10
Tout d'abord, merci beaucoup à l'ARCOM pour l'organisation de cette journée
01:14
qui nous permet de présenter nos travaux.
01:17
Nous sommes une équipe de chercheurs et chercheuses en sciences de l'information et de la communication
01:28
dont les travaux de recherche portent sur les polémiques, les débats, les représentations
01:34
qui intègrent des enjeux en termes de genre, d'homophobie, de racisme, etc.
01:40
Et c'est important parce que ce dont on voudrait parler ce matin,
01:44
c'est expliquer comment en travaillant sur ce type d'objet,
01:48
on peut expérimenter aussi les limites de ce qu'il est offert ou possible de faire
01:53
quand on est chercheur et chercheuse pour travailler sur ce type de risque systémique.
01:58
Je vais très vite parce que l'intérêt est de venir sur des enjeux méthodologiques,
02:03
c'est-à-dire finalement qu'est-ce qu'on peut faire,
02:05
quels sont les verrous techniques et méthodologiques
02:08
quand on veut travailler sur notamment des réseaux sociaux.
02:11
Donc nous avons conçu une équipe de recherche qui compte un certain nombre d'ingénieurs
02:17
dont certains sont dans la salle aujourd'hui
02:20
et qui ont contribué aux travaux que l'on vous présente aujourd'hui.
02:24
CERES est une unité de service de Sorbonne Université
02:28
qui réunit donc des ingénieurs en informatique mais aussi en design.
02:33
C'est important pour ce qui concerne la restitution d'informations extrêmement complexes.
02:38
Nous avons acquis un certain nombre d'expertises
02:41
sur des réseaux comme Twitter X, Facebook, Instagram.
02:44
On a parlé tout à l'heure de Crottangle.
02:46
Crottangle présente un certain nombre de problèmes méthodologiques
02:49
dans la mesure par exemple où quand on travaille sur les militants LGBT,
02:53
la façon dont ils sont censurés par les réseaux sociaux,
02:57
et bien en réalité Crottangle pose un problème méthodologique et éthique
03:01
puisqu'il faut que l'on précise quels sont les comptes qu'on suit
03:05
et en indiquant par là à Crottangle quels sont les comptes de militants LGBT.
03:09
Donc on participe aussi à nourrir des informations sur des catégories
03:14
qui sont pourtant présentées comme étant protégées par des entreprises comme Meta.
03:19
Également nous avons commencé à travailler sur TikTok
03:23
alors avant l'ouverture de l'API et après l'ouverture de l'API
03:26
et c'est justement sur ce point que l'on voudrait vous expliquer
03:29
quels sont les avantages de l'ouverture de l'API,
03:32
quels sont ses limites et comment on peut la combiner
03:35
avec d'autres méthodes que l'on a testées avant cette ouverture.
03:41
Merci Virginie.
03:42
Alors oui effectivement en fait ce travail sur l'API de TikTok
03:47
intervient à un moment où on se demande entre 2020-2023
03:52
après un boom de téléchargement de l'application de TikTok
03:55
au moment du Covid, du confinement etc.
03:58
On se demande comment en fait faire de la recherche sur cette plateforme
04:01
qui est essentiellement caractérisée du coup par des contenus vidéo d'une part
04:05
et d'autre part une plateforme dont on ignore presque complètement
04:09
le fonctionnement en particulier algorithmique
04:12
et en fait ce qui se passe c'est qu'en 2023
04:14
au moment où TwitterX ferme l'ouverture de son API
04:19
donc une interface logicielle qui permet à des chercheurs en particulier
04:23
d'accéder à un certain nombre de données
04:26
sans la recommandation algorithmique personnalisée
04:29
donc au moment où cette ouverture de l'API se fait pour TikTok
04:32
c'est au moment où celle de Twitter se ferme.
04:34
Donc c'est un peu vu par la communauté scientifique
04:37
comme une forme d'aubaine en fait pour la recherche.
04:40
Ça intervient aussi à un moment où l'entreprise détentrice de TikTok
04:44
se positionne finalement différemment.
04:47
C'est-à-dire qu'en 2023, TikTok est menacée de bannissement
04:51
dans plusieurs pays en particulier aux Etats-Unis
04:53
où ça soulève presque un enjeu même diplomatique
04:56
et aussi sur le sol de l'Union Européenne.
04:58
En France, pour citer un exemple politique particulier
05:01
c'est aussi le moment où il y a un rapport sénatorial
05:04
qui est publié à charge contre TikTok
05:07
et justement sur l'opacité de cette plateforme.
05:10
Donc du coup cette API s'ouvre
05:12
et du coup elle intervient comme je disais
05:15
comme un nouveau positionnement
05:17
où TikTok va se positionner finalement comme
05:20
alors que c'était le mauvais élève en matière de régulation des plateformes
05:23
va se positionner finalement comme le bon élève.
05:25
Donc ça c'est assez intéressant
05:27
parce que ça relève d'un positionnement marketing
05:29
et aussi d'un positionnement en anticipation
05:32
du Digital Services Act, donc quelques mois avant finalement.
05:36
Sauf que, évidemment, on est confronté en tant que chercheurs
05:41
notamment en SHS quand on travaille sur ces plateformes-là
05:45
à déjà des premières limites.
05:46
Yannick vous en présentera d'autres juste après
05:49
avant de vous présenter la méthode que nous on a mis en place
05:52
parmi d'autres et qu'on vous propose aujourd'hui.
05:55
J'en cite quelques-unes ici pour ne pas prendre trop de temps.
05:58
La première c'est évidemment
06:01
et ça entre aussi en résonance avec le fameux article 40 du DSA
06:06
c'est que quand on passe par TikTok pour faire de la recherche
06:10
c'est TikTok qui choisit quel projet est éligible ou non
06:14
pour faire de la recherche sur cette plateforme.
06:16
Ce qui peut causer d'ailleurs un effet d'autocensure.
06:19
C'est mon cas par exemple.
06:21
Je travaille sur la modération des réseaux sociaux sur les plateformes
06:24
et donc du coup on en vient à s'autocensurer aussi
06:26
quand on travaille non pas sur des corpus extraits de la plateforme
06:29
mais quand on étudie son fonctionnement.
06:31
Une autre limite que je peux vous présenter ici aussi
06:33
c'est des injonctions fortes aussi en matière de
06:36
quelles données sont publiables ou non.
06:39
Et ça encore une fois c'est TikTok qui décide
06:41
ce qui pose tout un ensemble de questions.
06:42
Et la principale limite, et je m'arrêterai là avant de laisser la parole à Yannick
06:47
la principale limite selon moi c'est tout simplement comme je vous disais
06:50
TikTok est caractérisé comme une plateforme de vidéos.
06:53
On est des chercheurs en sciences humaines et sociales
06:55
qui travaillons sur la vidéo.
06:57
Et en fait cette API ne permet tout simplement pas de collecter de vidéos.
07:00
Donc c'est-à-dire que vous transformez le contenu vidéo
07:03
en exclusivement des métadonnées
07:06
que vous mettez dans des tableurs ou du texte.
07:09
Ce qui est fort intéressant mais qui pose des problèmes
07:12
comme dans notre cas, comme Virginie l'a évoqué
07:14
où on travaille sur des discours, des circulations, etc.
07:17
Et donc on ne peut pas étudier la vidéo ou le son.
07:19
Je laisse la parole à Yannick.
07:24
Merci beaucoup Thibault.
07:26
Merci à toutes et à tous et à l'ARCOM aussi
07:30
pour nous donner cette opportunité de présenter notre travail.
07:35
Je vais changer d'anglais maintenant parce que ma partie sera un peu technique.
07:40
Nous essayons de la garder au moins technique possible.
07:44
Mais, et c'est aussi un peu l'esprit de notre travail à Thérèse,
07:50
la partie technique est une partie nécessaire
07:55
et nous devons en parler.
07:57
Et c'est ce que je vais faire maintenant.
08:00
Donc nous avons essayé dans notre équipe
08:04
de faire le plus d'information possible sur l'API
08:08
et nous avons essayé de développer un outil
08:13
qui permet aux autres chercheurs
08:17
d'oublier le travail que nous avons déjà fait.
08:20
Donc nous avons passé l'année dernière
08:24
en travaillant avec plusieurs personnes,
08:26
vous pouvez le voir dans les noms décrits dans le papier,
08:29
pour développer un framework
08:34
pour collecter ce genre de données
08:36
qui permet de produire des résultats raisonnables
08:42
sur tous les sujets qu'on a déjà évoqués.
08:47
Comme nous l'avons dit au début de la parole,
08:49
TikTok est un nouveau média social,
08:54
il est devenu plus important dans les dernières années
08:58
et en ce qui concerne les discours publics en cours,
09:03
il va probablement augmenter dans sa importance.
09:08
Je vais essayer de vous montrer les limites techniques
09:14
que nous avons trouvées en travaillant avec l'API.
09:17
Vous les voyez ici.
09:20
Les deux points principaux que je veux vous donner
09:25
c'est que c'est extrêmement difficile
09:29
de produire des résultats raisonnables.
09:32
Si vous vous montrez vos résultats,
09:34
pour que quelqu'un d'autre puisse réaliser les mêmes résultats
09:36
et comprendre comment vous avez obtenu vos résultats,
09:39
c'est extrêmement difficile.
09:41
La façon dont les données sont désignées
09:46
fait aussi que c'est difficile
09:51
d'obtenir des relations entre différents discours.
09:58
Nous avons donc essayé de créer un framework
10:03
dans lequel l'utilisateur
10:06
doit avoir le moins de connaissances techniques possible.
10:10
Il ou elle doit donc spécifier
10:15
l'identité de l'API
10:17
que l'utilisateur obtient
10:19
quand il ou elle obtient accès à l'API par TikTok
10:23
et doit spécifier les critères de recherche
10:28
qu'il ou elle recherche.
10:32
La deuxième étape, c'est que TikTok
10:35
et c'est quelque chose que l'utilisateur
10:37
n'a pas vraiment à s'inquiéter,
10:39
fait la requête à l'API
10:44
et tous les données sont stockées dans un database SQL.
10:51
De cette façon, nous obtenons une histoire
10:54
de toutes les interactions qui ont été faites avec l'API
10:58
et cela permet ensuite d'entendre
11:02
le processus de collection
11:04
et d'entendre pourquoi l'API a réagi d'une certaine façon.
11:11
La dernière étape, qui est aussi faite par Cytalk,
11:17
c'est de pré-processer les données.
11:20
C'est-à-dire de présenter les données
11:22
d'une manière que nous considérons utile
11:24
pour beaucoup d'intérêts de recherche.
11:29
En particulier, je voudrais emphasiser
11:32
qu'on s'est concentré sur la création d'un framework
11:36
disponible pour présenter les données
11:39
dans un graphique.
11:41
C'est la vue du niveau supérieur de ce que nous avons développé.
11:51
Je serais très enthousiaste d'échanger avec vous
11:56
et d'avoir vos idées sur ce sujet
12:00
peut-être dans les discussions ou même dans le débat.
12:05
Je passe la parole à Virginie.
12:11
Merci beaucoup Yannick.
12:13
Pour résumer, avant l'ouverture de l'API,
12:16
nous avons essayé de faire à notre sauce,
12:18
si on peut dire, en scrapant des vidéos,
12:21
des contenus qui nous importaient,
12:23
sur les questions notamment de racisme,
12:25
des questions de genre.
12:27
L'image est importante, la façon dont c'est mis en scène,
12:30
le son, etc.
12:32
Et quand l'API a été ouverte,
12:34
on s'est retrouvés face à une sorte de contradiction
12:36
puisque TikTok n'autorisait pas le recours
12:39
à ces deux méthodologies.
12:41
C'est-à-dire que si on a un accès à l'API,
12:43
on n'a plus le droit de faire du scrapping.
12:45
Sauf qu'on s'aperçoit avec ces deux méthodologies
12:48
que chacune a son avantage.
12:50
Il y a une collecte systématique qui est permise par l'API
12:53
mais qui ne nous permet pas de recueillir
12:55
des informations qui nous intéressent.
12:57
Et via le scrapping, on recueille les vidéos
13:00
mais il y a des éléments, peut-être des métadonnées
13:02
qui sont moins consistantes.
13:04
Donc l'intérêt pour la recherche
13:06
pour lever ce verrou méthodologique,
13:08
c'est de faire les deux.
13:10
TikTok ne l'autorise pas,
13:12
mais heureusement les régulateurs si.
13:14
On est quand même dans une situation
13:16
un peu inconfortable parce que si on communique
13:18
sur nos résultats et que TikTok s'aperçoit
13:20
qu'on fait ça, on peut se retrouver banni
13:22
de l'accès à l'API.
13:24
Voilà peut-être des éléments de réflexion.
13:26
Merci beaucoup.
Écris le tout premier commentaire
Ajoute ton commentaire
Recommandations
29:03
|
À suivre
Journée d'études 2024 de l'Arcom : Thibault Grison, Virginie Julliard
Arcom
il y a 1 an
13:40
Journée d'études 2024 de l'Arcom : Danielle Borges
Arcom
il y a 1 an
41:47
Journée d'études 2024 de l'Arcom : Claire Balleys
Arcom
il y a 1 an
18:59
Journée d'études 2024 de l'Arcom : Nicolas Soulié
Arcom
il y a 1 an
17:16
Journée d'études 2024 de l'Arcom : Thomas Renault
Arcom
il y a 1 an
27:43
Journée d'études 2024 de l'Arcom : Mariana Grepinet
Arcom
il y a 1 an
16:40
Journée d'études 2024 de l'Arcom : Laurence Calandri
Arcom
il y a 1 an
16:16
Journée d'études 2024 de l'Arcom : Marion Seigneurin
Arcom
il y a 1 an
16:41
Journée d'études 2024 de l'Arcom : Alexandra Masciantonio
Arcom
il y a 1 an
3:18:38
Journée d'études 2024 de l'Arcom : 2ème partie
Arcom
il y a 1 an
17:42
Journée d'études de l'Arcom : Oana Goga
Arcom
il y a 1 an
0:15
Cartoon Network, la chaîne des drôles de super-héros, est disponible gratuitement sur Freebox TV du 1er au 30 novembre (canal 145) !
Free
il y a 2 mois
0:30
Marvel Iron Man et ses Amis Incroyables
Free
il y a 4 mois
1:28
La SPA de Loire-Atlantique est saturée
Télénantes
il y a 8 ans
1:43
NDDL : un accord pour l'avenir des terres agricoles
Télénantes
il y a 8 ans
1:37
Tendance: les barbiers sont partout!
Télénantes
il y a 8 ans
1:24:36
Journée d'études 2025 de l'Arcom : Des médias aux plateformes : information et participation démocratique
Arcom
il y a 7 semaines
1:16:51
Journée d'études 2025 de l'Arcom : La vérité en crise : politiques et technologies de vérification
Arcom
il y a 7 semaines
27:43
Journée d'études 2025 de l'Arcom : Keynote 1 - Désinformation et démocratie : les cas français et américains
Arcom
il y a 7 semaines
1:16:43
Journée d'études 2025 de l'Arcom : Représenter et rendre visible : enjeux de pluralisme dans les médias
Arcom
il y a 7 semaines
1:15:30
Journée d'études 2025 de l'Arcom : Les normes de la modération en ligne
Arcom
il y a 7 semaines
24:53
Journée d'études 2025 de l'Arcom : keynote 2 - Infrastructures de blocage : entre "couches inférieures" d'Internet et contrôle des contenus
Arcom
il y a 7 semaines
3:38
Journée d'études 2025 de l'Arcom : mot de clôture
Arcom
il y a 7 semaines
16:12
Journée d'études 2025 de l'Arcom : discours d'ouverture par Martin Ajdari président de l'Arcom et Nathalie Carrasco président de l'ENS Paris-Saclay
Arcom
il y a 7 semaines
26:12
Audition publique pour l'édition d'un service local de la télévision numérique terrestre (TNT) sur la zone de Rouen – Neufchâtel-en-Bray
Arcom
il y a 7 semaines
Écris le tout premier commentaire