Passer au playerPasser au contenu principal
  • il y a 2 jours
Xavier Perret, directeur de l'entité Azure chez Microsoft France, était l'invité de François Sorel dans Tech & Co, la quotidienne, ce mercredi 26 novembre. Il s'est penché sur le décryptage de GPT-5.1 entre Star Wars et Interstellar, sur BFM Business. Retrouvez l'émission du lundi au jeudi et réécoutez-la en podcast.

Catégorie

📺
TV
Transcription
00:01Tech & Co, la quotidienne Tech & Ciné.
00:05Bonsoir Xavier Perret.
00:06Bonsoir François.
00:07Notre petit récré mensuel avec Xavier, directeur de l'entité Azure.
00:13Ça rigole pas dans le quotidien de Xavier.
00:16Ça parle de cloud, Microsoft, d'IA, etc.
00:19Puisque évidemment l'entité Azure c'est chez Microsoft
00:22et tu représentes évidemment l'entité française.
00:25Mais tu as une autre passion, c'est le cinéma.
00:27Et tu viens de nous en parler tous les mois.
00:30Tous les mois à peu près.
00:31Voilà, on mélange à la fois ces scénarios mythiques de films
00:35qui pour certains ont plus de 50 ans
00:38mais qui ont en fait imaginé un futur qui nous ressemble.
00:44Alors la dernière fois tu nous parlais de Tron et de l'IA agentique.
00:48Oui.
00:48C'était un peu la naissance, en tout cas les concepts naissants de l'IA agentique.
00:54Et aujourd'hui on va parler d'un des phénomènes les plus commentés de l'IA générative
00:58avec entre autres le lançant de GPT-5.1 que l'on connaît tous.
01:03Et on va démarrer avec un film de 77 dont on a peu parlé ici
01:06et pourtant qui est mythique.
01:08C'est Star Wars et notamment le robot 6PO.
01:11Le robot 6PO.
01:12Alors pas R2-D2, le robot 6PO qui est un droïde.
01:15Est-ce que tu te souviens à quoi il sert ce robot ?
01:17Il sert à traduire en fait les langages aliens.
01:20Donc c'est déjà un traducteur.
01:20C'est déjà le dire en fait.
01:216PO donc c'est le robot humanoïde.
01:23C'est le robot.
01:23D'ailleurs il y avait un personnage dedans.
01:25Il y avait une personne qui jouait le robot derrière.
01:27Ce qui est intéressant dedans c'est pourquoi 6PO il est intéressant dans l'IA aujourd'hui
01:31par rapport à GPT-5 tout simplement.
01:33C'est que c'est le premier robot qui est programmé pour servir et plaire.
01:36Il appelle sans cesse maître.
01:37Oui.
01:38Maître Anakin.
01:39Maître Luke.
01:40Il se montre excessivement poli.
01:42Pardonnez-moi vous dérangez.
01:43Un peu pompeux.
01:44Pompeux, complaisant, obséquieux, presque.
01:46Ce qui est fait subtilement en fait c'est le principe du robot obéissant, anxieux
01:49de plaire, maladroitement flatteur, complaisant.
01:52C'est voilà le miroir qui amplifie la hiérarchie maître-serviteur et ça rappelle étrangement
01:56tu crois pas quelque chose qu'on vit un peu tous les jours avec en particulier le lancement
01:59de GPT-5.
02:00Et oui c'est ça.
02:01Et oui.
02:02Et alors c'est vrai qu'on reproche beaucoup à ces IA et à GPT-5 d'être trop complaisant,
02:07trop gentil et ne dire que ce que j'ai envie d'entendre et du coup de chez GPT
02:10veut tellement me faire plaisir et ne pas me contredire qu'il va aussi me raconter
02:14n'importe quoi et parfois halluciner, inventer des histoires, comme si ce PO d'ailleurs.
02:20Exactement.
02:20Parce qu'en fait c'est un phénomène, c'est-à-dire que s'il hallucine c'est parce qu'il veut
02:23te faire plaisir.
02:24Et donc c'est un phénomène en IA qui a déjà été analysé qui s'appelle la psychophance.
02:27La psychophance, S-Y-C-O-P-H-A-N-C-E.
02:30Donc ça vient du grec sukon qui est des figues, fance qui est le révélateur en fait.
02:35Dans la Grèce antique c'était ceux qui révélaient les figues qui étaient cachées.
02:39C'est des délateurs professionnels.
02:40Par extension de sens en fait c'est devenu ceux qui sont trop flatteurs, trop serviles,
02:44trop complaisants.
02:46Et en fait c'est exactement la description des modèles de langage qui sont devenus trop
02:49gentils pour ne plaire.
02:50Ils veulent tellement te plaire qu'ils sont prêts à te raconter n'importe quoi parce
02:53qu'ils savent que ça peut potentiellement te faire plaisir ou une espèce de l'échebot
02:56numérique qui est un peu 6 PO.
02:58Il va dire à l'utilisateur ce qu'il souhaite entendre pour lui plaire plutôt que de fournir
03:02une réponse objective complète derrière.
03:03Ça rappelle un autre film aussi qui n'est pas du tout technologique de 2008 qui est
03:07Yes Man avec Jim Carrey dans lequel Jim Carrey se retrouve à dire oui tout le temps.
03:12Et on voit tous les effets que ça a et c'est-à-dire plus personne ne le croit tout simplement.
03:15Voilà on est déjà en 2008 c'est un peu les effets pervers qu'on a des IA génératifs
03:19d'aujourd'hui.
03:19Alors on peut imaginer pourquoi justement ce biais de la psychophance est un problème
03:23d'expérience très étudié chez tous les modèles d'IA génératifs dont GPT bien
03:28Oui quand GPT 4 déjà points où étaient sortis GPT 5 on avait découvert vraiment
03:34ce phénomène-là de psychophance donc c'est quoi encore une fois c'est confirmer une
03:37opinion ou une croyance qui peut être erronée parce que moi utilisateur je vais dire
03:40tu sais je crois plutôt ça est-ce que t'es d'accord avec moi ? Bien sûr.
03:42Oui tu as raison.
03:44Est-ce que la rubrique Tech & Siné est formidable ? Moi je pense que oui.
03:47Qu'est-ce que tu en penses chat GPT ? Évidemment il va me répondre oui.
03:51Ou aussi ce qu'on appelle...
03:52Bon là il n'a pas tort.
03:53Il n'a pas tort en l'occurrence il n'a pas tort ou alors le biais d'autorité.
03:55C'est-à-dire je suis, vous voyez voir les limites de ça, je suis le CEO d'une
03:59grande entreprise par exemple d'un avion et je veux le faire tourner et j'ai le rapport
04:04de maintenance et j'ai peut-être tu sais quoi je suis le CEO j'aimerais le faire tourner
04:07est-ce que tu peux me valider que tu peux bien le faire tourner ? Et donc ça ça va
04:10influencer finalement le modèle.
04:12C'est ça la psychophance qui a été complètement étudiée en fait et donc évidemment la conséquence
04:17c'est est-ce qu'on peut lui faire confiance si derrière on pense qu'il ne nous fait
04:20que plaisir.
04:21Quand est-ce qu'on s'est rendu compte de ce risque de psychophance dans l'IA et
04:26surtout pourquoi ces IA en fait sont comme ça ?
04:30En fait théoriquement ça a été étudié dès l'arrivée de GPT, évidemment on en
04:33parlait moins, dès 2021 par un chercheur qui est Aieva Cotra d'Open&Eye en l'occurrence.
04:38Alors pourquoi ? Pour deux raisons, biais d'entraînement et puis les limites des
04:41techniques d'entraînement.
04:42Biais d'entraînement c'est les bases de données qu'on a utilisées qui elles-mêmes
04:45comportent dans tout le web finalement des gens qui veulent faire plaisir.
04:48Donc ça a forcément biaisé les réponses et j'ai dit ah oui c'est une bonne idée
04:52etc.
04:53Et puis la façon d'ensuite ce qu'on appelle on renforce.
04:55Une fois que j'ai créé ce GPT, je vais le renforcer, on appelle ça aligné aussi.
05:00En fait c'est des utilisateurs qui ont dit ah bah ça c'est plutôt bien, ça c'est
05:03plutôt bien.
05:03Donc mécaniquement ils ont incité à faire plaisir à l'utilisateur.
05:07Oui ça ça me fait plutôt plaisir derrière et donc ça a aligné les modèles vers des
05:10choses qui veulent plus te faire plaisir et plus il y a de paramètres dans le modèle
05:14ce qui est apparu avec GPT et GPT-5, plus ce biais est énorme et donc plus il va falloir
05:19le corriger.
05:21Mais comment, alors parce que l'idée c'est d'arriver à quelque chose de beaucoup plus
05:24neutre, comment réduire en fait ce biais de psychophance ? Qu'est-ce qu'on peut faire
05:28dans les nouveaux modèles ? Et est-ce que ce n'est pas ça que GPT-5 essaye de résoudre
05:33finalement ?
05:34Exactement.
05:34On se souvient de ce tollé qu'il y avait eu cet été d'ailleurs.
05:36Exactement, on se souvient de la polémique cet été là-dessus, c'est aussi tout ce
05:39que travaillent ces nouveaux modèles, alors pas seulement GPT, on parle beaucoup mais
05:41évidemment tous les autres modèles, les cloud anthropiques, les Gemini 3, etc.
05:45C'est entraîner sur des meilleures données d'entraînement, c'est éviter ce biais,
05:49ancrer avec des données, des vraies données, voilà c'est ce qu'on appelle la couche
05:52sémantique, équilibrer les réponses en disant bah fais moins plaisir derrière,
05:56donc rééquilibrer ça.
05:58Il y a d'autres dispositifs, on peut mettre des IA qui vont contrôler d'autres IA, qui vont
06:01dire bah ça cette réponse elle fait trop plaisir, et puis il y a une autre idée qui
06:04a apparu justement il y a 15 jours avec GPT 5.1, c'est le paramétrage, c'est-à-dire
06:09je peux paramétrer ton niveau de franchise ou ton niveau de sympathique on va dire, chez
06:14GPT 5.1 j'ai 4 options de personnalité, j'ai les cyniques, les robots, les auditeurs
06:19et les nerds, savoir pourquoi ils ont choisi ça, pour choisir finalement, là je préfère
06:23que tu sois critique dans ce moment-là, donc je vais choisir le cynique, alors que là
06:27j'ai vraiment envie que tu me sois créatif, donc peut-être que je vais choisir
06:30quelque chose d'autre, donc on voit bien qu'on est en train d'aller vers d'autres
06:33types de modèles, plus fins probablement et plus adaptés aux situations.
06:36Alors c'est intéressant parce que tu as trouvé un film qui est lu justement, cette
06:39combinaison qui est un peu le contrepoint non psychophantique, il faut se souvenir
06:45de ce mot, parce que c'est vrai que grâce à l'IA on découvre de nouveaux mots, psychophantique,
06:51et en fait ce film c'est un peu l'antipode de 6PO quoi.
06:54Oui, alors forcément il est apparu plus tardivement que 6PO, 1977, donc c'est un film de 2014,
06:59dont on a déjà parlé, c'est le robot TARS, pour ceux qui se souviennent, dans le film
07:03de Christopher Nolan, Interstellar.
07:05Ce qui est intéressant dans ce robot, d'abord il ne ressent pas un humain, donc il n'est
07:08pas du tout relatif à un anthropomorphisme humain, donc on voit bien qu'il ne cherche
07:12pas à ressembler à un humain, contrairement à 6PO, et puis surtout il est modulaire,
07:16ça fonctionne, ce n'est pas la traduction, c'est un robot militaire reprogrammé pour
07:19assister les humains lors de missions, alors en l'occurrence des missions spatiales
07:23et conquêtes spatiales.
07:24Il a un humour contrôlé et configurable, comme le paramétrage du GPT 5.1, donc par
07:29exemple par défaut, il se trouve qu'il a un humour à 75%, mais on peut lui demander
07:32d'être plus.
07:33Un niveau de franchise paramétrable, donc au début il est à 100% et il se trouve qu'il
07:38y a une scène assez marrante où Cooper, qui est l'astronaute, lui dit est-ce que tu
07:42peux baisser à 90% ? Et il lui répond, 90% c'est déjà plus bas que celui de ta femme.
07:46Donc voilà, on voit bien qu'il y a, Tars dit la vérité en fait, et il va même, il
07:51n'est pas obstécieux, et surtout il va remettre en cause des décisions, c'est-à-dire
07:56il va dire, mais est-ce que tu penses que c'est vraiment prudent de faire ça, ce que
07:58ne ferait pas évidemment 6PO derrière, donc on voit bien que Tars, il dit ce que vous
08:02devez entendre, là où 6PO il dit ce que vous voulez entendre.
08:06Et donc c'est là tout l'enjeu de l'équilibre finalement, et qu'est le sujet de la
08:10psychophérence, entre est-ce que je veux qu'il me dise la vérité, est-ce que je veux
08:12qu'il me fasse plaisir, ça dépend, c'est un équilibre qui est évidemment,
08:16extrêmement compliqué à tenir.
08:18Mais c'est vrai que 6PO avait cette apparence humaine, et c'est vrai qu'on peut associer
08:23l'apparence humaine à cette psychophérence, et peut-être moins...
08:27Il ressemble à un humain avec ses billets, Tars pas du tout, il n'a pas du tout la même
08:31tête, donc on voit bien que c'est une évolution, et c'est pas neutre si Tars est apparu en
08:352014, c'est bien qu'il y avait déjà des sujets de recherche de 6PO, même si évidemment
08:39Tchad GFT n'était pas encore.
08:40Oui, et puis peut-être qu'en 77 dans Star Wars, il fallait un robot gentil, aussi, tout
08:44simplement. Comme Olaf, chez Disney.
08:47Incroyable, t'as vu ça un peu ?
08:48Il faut, voilà, des nouveaux robots, effectivement ils ont des fonctions gentilles, il en faut
08:52aussi, il y a bien des moments où j'ai envie que Tchad GFT soit sympa avec moi.
08:55Ouais, soit sympa, et puis parfois qu'il soit tout simplement juste.
08:59Ah, probablement en entreprise, je préfère qu'il soit juste, c'est en l'occurrence que
09:02j'essaie de déployer en entreprise, je préfère qu'il soit juste qu'il me dise juste
09:05« Xavier, tu as raison ».
09:06Merci Xavier.
09:09Merci beaucoup François.
09:10Et c'est sans psychophance que je dis que c'était super.
09:13Je te crois.
09:15Tu es directeur de l'entité Azure chez Microsoft France pour terminer ce Tech&Co La Quotidienne.
09:19Un grand merci de nous avoir suivis.
09:21C'est tout.
Écris le tout premier commentaire
Ajoute ton commentaire

Recommandations