Passer au playerPasser au contenu principal
  • il y a 2 mois
Lucie Termignon, cheffe de produit du service ‌Compar:IA au Ministère de la Culture, présente un projet inédit : comparer deux modèles d’IA en direct et voter pour la meilleure réponse.

Catégorie

🤖
Technologie
Transcription
00:00Ces données sont utiles pour observer les usages et pour potentiellement améliorer les futurs modèles sur le français
00:06et la prise en compte de la diversité culturelle française.
00:12Je suis Lucie Termignon, je travaille au ministère de la Culture sur les sujets d'IA au sein du service du numérique.
00:19Je suis intrapreneuse, chef de produit du service Comparia qu'on a lancé en octobre 2024 officiellement,
00:27mais l'investigation avait commencé en janvier 2024.
00:30Comparia, c'est un service, c'est un site internet accessible gratuitement en ligne,
00:38comparia.beta.gouv.fr, qui donne accès à une très grande diversité de modèles,
00:44à la fois open source propriétaire de différentes tailles, à l'utilisateur,
00:48qui du coup pose une question, comme s'il était sur ChatGPT ou d'autres services,
00:53et obtient la réponse pas seulement d'un modèle, mais de deux modèles anonymes.
00:57On lui demande de donner sa préférence entre les deux réponses générées,
01:02et une fois qu'il a donné sa préférence, l'identité des modèles est révélée,
01:05avec des informations sur les caractéristiques des modèles,
01:07et notamment l'impact environnemental de la conversation.
01:10Et à travers cette expérience utilisateur assez simple,
01:14Comparia répond à deux objectifs.
01:16D'un côté, sensibiliser largement l'ensemble des citoyens potentiellement français aux différents enjeux que constitue la diversité des modèles,
01:25les biais qu'ils comportent et leur impact environnemental.
01:30Et de l'autre côté, il y a un enjeu, un objectif plus tech de constitution de jeux de données,
01:37qu'on partage en open source à la communauté des acteurs à la fois académiques et industriels.
01:41Et donc ce sont toutes les questions posées par les utilisateurs et préférences exprimées par les utilisateurs
01:46qui alimentent des jeux de données et qu'on repartage en open source,
01:50qui sont très utiles à la fois pour observer les usages,
01:53et c'est des données rares parce qu'elles correspondent à des usages réels, non contraints,
01:58et exprimés en français dans 90% des cas.
02:02Donc ça, ça en fait une ressource très rare pour l'écosystème.
02:04Et ces données sont utiles pour observer les usages et pour potentiellement améliorer les futurs modèles sur le français
02:11et la prise en compte de la diversité culturelle française.
02:15C'est en français pour le moment, mais on le développe aussi à l'échelle européenne
02:20en travaillant pour le moment avec trois pays pilotes, maintenant que ça a bien fonctionné en France.
02:25Et donc tout ça apparaîtra à partir de l'automne 2025.
02:28Donc le service a été lancé en octobre 2024.
02:36Il y a eu une deuxième sorte de lancement en février 2025 pendant le sommet pour l'action sur l'IA.
02:42Et donc depuis, on a plus de 200 000 utilisateurs dans Comparia.
02:47Les jeux de données ont atteint 300 000 questions, quasi 150 000 préférences, votes des utilisateurs.
02:53Et on a des utilisations régulières à à peu près plus de 1000 questions posées par jour.
02:59Mais donc on est sur un seuil de participation assez constant
03:05et qui a tendance à être en croissance sur la durée.
03:12Le duel de l'IA, c'est un format de médiation qu'on a pensé vraiment centré autour de l'utilisation de Comparia.
03:20On savait que Comparia est utilisé dans beaucoup de contextes de formation, de sensibilisation,
03:28à la fois dans des contextes professionnels ou éducatifs, pédagogiques,
03:32mais plutôt souvent comme une introduction, un brise-glace en début d'atelier.
03:37Et c'est sur la base de ce retour, notamment de la part des équipes du Conseil national du numérique
03:43qui portait le dispositif Café IA, qu'on a décidé de proposer vraiment à toute la communauté
03:49un format de médiation qui soit animable pour différents publics,
03:56pour une durée variable à peu près 50 minutes, donc une séquence de cours,
04:00et qui dans un premier temps serait centré sur le volet de l'impact environnemental,
04:05mais qui peut être décliné si ça fonctionne bien sur des sujets des biais des modèles
04:11et sur les enjeux de souveraineté associés à ces modèles et de diversité des modèles.
04:16Et donc ce format est actuellement en phase de bêta-test pendant l'été,
04:20mais il sera lancé officiellement à la rentrée.
04:23Notre objectif, c'est qu'il soit largement utilisé, y compris par des professeurs,
04:28dans des contextes scolaires, alors que l'IA est entrée au programme
04:31pour les élèves de quatrième et de seconde, et que plus largement,
04:36n'importe quel facilitateur dans des réseaux de médiation numérique ou de sensibilisation
04:43puisse s'en emparer comme ressource pour animer des ateliers autour de ces sujets.

Recommandations