[PODCAST] Un spécialiste de l’IA répond à nos questions

Le Parisien

Debut : 🎥 Pour ne rater aucune de nos vidéos, abonnez-vous et n'oubliez pas d'activer la cloche. https://youtube.com/@LeParisien  L’intelligence artificielle est de plus en plus présente dans notre quotidien et soulève de nombreuses questions scientifiques, éthiques et politiques. Entretien avec Olivier Cappé, directeur de recherche au CNRS.   Crédits. Direction de la rédaction : Pierre Chausse - Rédacteur en chef : Jules Lavie - Production et réalisation : L’équipe de Code Source - Musiques : François Clos, Audio Network.  Pour ne rien manquer de l’actualité du Parisien :   🔔 Suivre toute l’actualité avec notre abonnement : https://urlr.me/!abonnementleparisien   ✉️ En savoir plus sur l’actualité avec notre newsletter : https://bit.ly/new-sletters    👂 Retrouvez nos différents podcasts :   Code Source: L’actualité quotidienne du Parisien : https://bit.ly/_Codesource  Crime Story: Le podcast faits-divers du Parisien : https://bit.ly/_Crimestory  Le Sacre: Revivez le parcours d’un médaillé olympique : https://bit.ly/_Lesacre  Suivez-nous :  Instagram : https://instagram.com/leparisien/  Facebook : https://facebook.com/leparisien/  Tiktok : https://tiktok.com/@leparisien  X : https://twitter.com/@le_Parisien  Snapchat : https://snapchat.com/t/pr3nDoxv  Bluesky : https://bsky.app/profile/leparisien.fr  Threads : https://threads.net/@leparisien   #intelligenceartificielle  #IA #chatgpt #codesource

Transcript

00:01Bonjour, c'est Thibaut Lambert et vous écoutez Codesource, le podcast d'actualité du Parisien.

00:12Quel est le point commun entre tchat GPT, mon téléphone qui se déverrouille en reconnaissant mon visage,

00:18ou encore une chanson originale générée avec la voix d'un chanteur mort il y a longtemps ?

00:24Réponse, tous ces exemples font appel à l'intelligence artificielle,

00:28un terme qui revient beaucoup dans l'actualité, l'IA en abrégé est amené à prendre de plus en plus

00:34de place dans notre quotidien,

00:36mais que savons-nous vraiment de cette technologie, de son fonctionnement et de ses limites ?

00:41Si vous avez encore du mal à y voir clair quand on vous parle d'intelligence artificielle,

00:47cet épisode hors format de Codesource est fait pour vous.

00:50Notre invité du jour, Olivier Capet, vient nous résumer ce qu'il faut absolument savoir.

00:55Il est directeur de recherche au Centre National de la Recherche Scientifique, le CNRS,

01:00et travaille au département informatique de l'École Normale Supérieure.

01:12Bonjour Olivier Capet.

01:13Bonjour.

01:14Bienvenue dans Codesource, vous avez dirigé l'écriture d'un petit guide illustré de 130 pages

01:20qui s'intitule « Tout comprendre ou presque sur l'intelligence artificielle »

01:24paru en mai dernier aux éditions du CNRS.

01:27Et pour ce livre, très coloré, très facile à parcourir, on a l'impression de feuilleter un livre jeunesse,

01:33vous avez travaillé avec Claire Marc, une médiatrice scientifique et illustratrice.

01:38Et dans l'introduction, vous constatez qu'on entend énormément parler d'intelligence artificielle depuis quelques années,

01:45surtout en fait depuis que ChatGPT a été mis à disposition du grand public à la fin de l'année

01:512022.

01:51Alors d'abord, rappelez-nous en quelques mots ce qu'est ChatGPT ou ChatGPT en français.

01:58ChatGPT, donc on peut appeler ça un chatbot, donc désolé, terme anglais comme souvent dans ce domaine,

02:04un robot conversationnel, mauvaise traduction pour le coup parce que, enfin j'appellerais pas ChatGPT un robot,

02:10donc on peut aussi l'appeler agent conversationnel.

02:12C'est un système avec lequel on interagit uniquement de façon textuelle,

02:16en tout cas je parle du système de 2022, depuis ça a un peu évolué.

02:20Donc on lui pose une question, c'est pas nécessairement une question, on peut faire ce qu'on veut en

02:25fait,

02:25on peut entrer n'importe quel texte, donc ce texte en anglais c'est ce qu'on appelle prompt.

02:30Et ce texte-là, il va déclencher une réponse de la machine.

02:34Et ce qui est frappant et ce qu'a frappé les gens aussi depuis le début,

02:38c'est qu'on peut enchaîner avec une réponse à la réponse de la machine,

02:42et ça peut continuer comme ça pendant très longtemps,

02:44et ça produit une impression de conversation,

02:48en particulier parce que la machine, elle garde trace de tout ce qui s'est dit depuis le début de

02:52la conversation.

02:53Donc même si la conversation dure longtemps,

02:55on a cette impression qu'effectivement des choses qui ont été évoquées il y a assez longtemps,

02:59elles continuent à avoir une importance dans la conversation.

03:02Mais en réalité, l'intelligence artificielle, elle est beaucoup plus ancienne que ChatGPT,

03:08ça vous le dit dans le livre, ce terme, intelligence artificielle, il est apparu dans les années 50,

03:13qu'est-ce qui le désignait au départ ?

03:15Il faut se souvenir qu'au milieu des années 50, années 60,

03:20c'est l'apparition des premiers ordinateurs qui ressemblent quand même aux ordinateurs qu'on a actuellement,

03:25bien évidemment très différents, beaucoup plus grands, pas accessibles à tout le monde,

03:28mais néanmoins, ça a suscité des réflexions chez des ingénieurs, des scientifiques,

03:34sur les limites de ce nouvel outil.

03:36C'est-à-dire que ce nouvel outil, on voyait bien qu'il était capable d'effectuer des tâches,

03:40par exemple de faire des calculs.

03:44La question c'est jusqu'à quel point on peut pousser ce type d'outil

03:48pour s'approcher de tâches qui sont habituellement réalisées par des humains.

03:53Et donc on a appelé intelligence artificielle tous les efforts qui ont visé à essayer de faire effectuer

03:58par la machine des tâches qui ressemblent autant que possible à des tâches qui habituellement sont faites par des humains.

04:04Aujourd'hui, quand on parle d'intelligence artificielle, le grand public, moi par exemple,

04:08on s'imagine principalement une machine, un système informatique qui peut discuter avec nous,

04:14répondre à des questions complexes, effectuer des tâches comme composer une chanson,

04:18coloriser une image, rédiger une dissertation de philosophie.

04:21Mais vous expliquez que la machine le fait avec l'apparence de l'intelligence et pas l'intelligence.

04:28L'apparence de l'intelligence, qu'est-ce que vous entendez par là ?

04:32C'est là que le terme d'intelligence artificielle a un côté un tout petit peu trompeur.

04:35C'est que quand on parle d'intelligence, je pense que tout le monde,

04:38quand il ou elle entend parler d'intelligence, se dit là on est en train de parler de moi.

04:42Donc quand on entend parler d'intelligence artificielle, on dit tiens,

04:44peut-être que ça fonctionne de la même façon dont j'effectuerais des tâches si je devais les effectuer.

04:49La réponse n'est pas du tout ça.

04:51Donc c'est en ça qu'on peut dire que c'est une apparence,

04:53c'est-à-dire qu'on obtient des résultats qui sont similaires à ceux que peut-être un être humain

04:59pourrait obtenir,

05:00mais en aucun cas on ne va procéder de la même façon.

05:04Donc c'est en ça que c'est très différent, c'est qu'en particulier,

05:07je ne cherche pas à dire que les résultats obtenus, par exemple, ne sont pas impressionnants,

05:13mais il faut les regarder en ne se disant pas qu'ils ont été produits par un être humain.

05:17Non, la vérité c'est que pour obtenir ce résultat-là,

05:21des techniques ont été utilisées qui sont tout à fait incomparables

05:25avec la façon dont un être humain pourrait essayer d'envisager de faire la même tasque.

05:29Et du coup, cette impression parfois trompeuse qu'on peut avoir,

05:32que le système connaît tout sur tout,

05:34elle est surtout apparente quand on pose des questions qui en fait sont des questions liées à l'érudition.

05:39Donc, par exemple, je ne sais pas si là, vous me demandez à brûle-pourpoint comment fonctionne un moteur de

05:45voiture,

05:45je ne sais pas parce que ça ne m'intéresse pas tellement, je n'ai jamais regardé,

05:48je n'ai pas fait des études là-dessus, je ne sais pas.

05:51Après, je sais par contre qu'en cherchant sur Internet, je vais trouver des sites qui expliquent ça.

05:56Et là, du coup, la comparaison avec l'être humain, elle est simple.

06:00C'est tout simplement que moi, même si j'avais accès à toutes ces informations,

06:04admettons que j'ai envie moi aussi d'être une personne particulièrement qui sait beaucoup de choses,

06:10je peux commencer à lire des livres.

06:12Mais le problème que je vais avoir au bout d'un moment, c'est me souvenir de tous ces livres

06:16que j'ai lus.

06:16Donc peut-être que dans tous ces livres que j'ai lus, il y en avait un qui parlait de

06:20la maintenance automobile

06:22et c'est celui dont je devrais me souvenir à ce moment-là.

06:24Mais le problème, c'est que ma capacité mémoire ne me permet pas de me souvenir de ce livre-là.

06:28La supériorité des systèmes bâtis avec de l'intelligence artificielle,

06:34elle repose surtout sur une certaine capacité de mémorisation de cet ensemble d'informations

06:40qui est tout à fait hors de portée à tout être humain, clairement.

06:45Et ce que vous dites dans votre livre, c'est qu'on a l'impression que ce chat est intelligent,

06:49notamment parce qu'il donne l'impression de savoir plein de choses

06:53et il peut nous répondre de manière très cohérente, de façon presque humaine.

06:57Mais en réalité, son système a été très longuement entraîné pour donner ce résultat.

07:02Ce qui a été observé, en fait, c'est que pour que ça fonctionne,

07:07alors qu'est-ce que ça veut dire fonctionne ?

07:08Disons qu'à minima, pour que ça produise des textes qui ont l'air corrects

07:11et qui sont corrects d'ailleurs en très très grande majorité,

07:14donc corrects du point de vue du langage, du respect de la syntaxe et des conventions,

07:19de la langue, pour arriver à ce résultat-là, en fait, il fallait avoir suffisamment de données d'apprentissage.

07:25C'est-à-dire, la grosse différence entre les premiers efforts qui sont tracés,

07:29qu'on peut retrouver dans la littérature et maintenant,

07:31c'est que les premiers efforts, si on les utilisait juste pour générer des phrases,

07:36en fait, on voyait tout de suite qu'il y avait quelque chose qui clochait.

07:38C'est-à-dire, soit la phrase n'était pas correcte grammaticalement,

07:40soit elle ne voulait absolument rien dire, on avait du mal à lui donner un sens,

07:45et progressivement, en prenant plus de données et des modèles plus grandes,

07:50de taille plus grande, donc avec un plus grand nombre de degrés de liberté,

07:53un plus grand nombre de paramètres appris,

07:54on est arrivé à un seuil où finalement, à minima,

07:58ce que les systèmes actuels produisent, c'est des phrases qui sont tout le temps correctes.

08:02Et ça, c'est un effet qui n'apparaît que quand la taille du modèle est suffisant

08:07et quand le nombre de données est suffisant.

08:08Donc ça veut dire que tout à l'heure, quand je parlais d'utiliser des centaines de millions de textes,

08:13les gens ne font pas ça par plaisir pour montrer qu'ils sont forts.

08:16C'est simplement que s'ils faisaient à partir de beaucoup moins de textes,

08:19de mille fois moins,

08:21ça ne produirait plus des phrases qui ont l'air cohérentes, tout simplement.

08:25C'est ce qui a permis à l'intelligence artificielle et les systèmes comme ChatGPT

08:29de livrer des résultats bluffants ces dernières années,

08:33c'est-à-dire cette accumulation de données par rapport aux années 2010 ou 2000, par exemple ?

08:38Tout à fait, beaucoup plus de données, des progrès techniques dans l'architecture.

08:43Donc ce qu'on appelle l'architecture, c'est la façon dont on construit les modèles.

08:46Donc il faut imaginer que ces modèles, ils sont compliqués.

08:49Donc on essaye de les décrire un peu dans le livre.

08:51Toujours plus de données, des modèles de plus en plus grands.

08:54Ça veut dire aussi de plus en plus de calculs.

08:56Donc l'autre ingrédient, pour répondre à votre question,

08:58qu'est-ce qui a changé, on va dire, depuis 10 ou 15 ans ?

09:01C'est la réalisation que pour faire tout ça, on avait besoin de moyens de calculs importants.

09:06Et le fait d'obtenir ces moyens de calculs, avec là aussi des avancées,

09:11par exemple sur les architectures de calculs qui sont appropriées

09:14pour effectuer ces calculs le plus rapidement possible.

09:17Autre point important, Olivier Capet, avant qu'on passe à la suite,

09:19vous rappelez qu'il ne faut pas voir l'intelligence artificielle

09:22comme un ordinateur qui saurait tout faire.

09:26C'est plutôt, en résumé, la somme de plein de machines indépendantes

09:30qui accomplissent des tâches spécifiques, c'est ça ?

09:33Oui, en tout cas, l'idée qui est importante, c'est le fait que

09:37les systèmes doivent être entraînés à partir de données

09:40qui ont un rapport avec ce qu'on veut faire avec.

09:42Donc c'est assez vague dit comme ça, mais pour donner un exemple qui est très clair,

09:46Tchad GPT, il est très très fort, il sait faire des choses avec du texte

09:50depuis 2022, dans les versions récentes, il sait faire des choses avec des images.

09:54Mais si vous lui dites, voilà, hier je suis allé faire un examen médical

09:59et je me pose la question de savoir ce que je dois m'inquiéter,

10:02Tchad GPT, il n'a aucune raison de savoir répondre à cette question-là

10:05parce que personne ne l'a jamais entraîné à essayer d'obtenir des bons résultats

10:10sur ce type de tâches.

10:12Autre exemple qu'on pourrait donner, maintenant, on entend assez régulièrement parler

10:16parce que ça pose des problèmes, notamment économiques,

10:19au milieu artistique, de logiciels qui permettent de générer de la musique.

10:24Si on a entraîné un système avec juste quelques petits exemples de musique,

10:29on ne va pas obtenir de la musique qui ressemble à de la musique.

10:31Donc pour obtenir de la musique qui ressemble à de la musique,

10:34fatalement, il faut avoir eu accès à un grand volume de musique enregistré

10:40et il faut avoir entraîné le système à partir de ces données.

10:44Et par exemple, si on veut être capable de produire de la musique en disant,

10:47oui, mais moi j'aime le jazz et donc je voudrais de la musique qui ressemble à du jazz,

10:53fatalement, il faut que ces données, elles aient été étiquetées avec des informations

10:56qui vont aider le système à déterminer qu'est-ce que c'est de la musique qui ressemble à du

11:00jazz

11:00et qu'est-ce que c'est de la musique qui n'y ressemble pas à du jazz.

11:02Pour résumer, il y a un système qui est fort en musique, un système qui est fort en texte,

11:07un système qui est très fort pour analyser de l'imagerie médicale,

11:12mais ces systèmes ne communiquent pas forcément entre eux.

11:14Non. Pour obtenir des bons résultats sur des tâches spécifiques,

11:19on est obligé de spécialiser les outils sur ces tâches en fait.

11:23On va dire que l'idée est que j'ai des systèmes qui sont entraînés à partir de données

11:28qui sont spécifiques aux problèmes que j'essaye de résoudre

11:31et non pas un système unique qui essaye de résoudre tous les problèmes à la fois.

11:35Bien. Ceci étant posé, vous allez maintenant nous aider à comprendre

11:39comment fonctionnent quelques systèmes d'IA qu'on utilise très souvent dans notre quotidien.

11:44On ne pourra pas être exhaustif, alors j'ai choisi trois champs d'application

11:48qu'on va prendre les uns après les autres.

11:50La reconnaissance faciale, la médecine, et on terminera par l'IA qui crée des musiques,

11:56des images, des vidéos à partir d'une consigne.

11:58C'est ce qu'on appelle l'IA générative.

12:01Commençons donc d'abord par la reconnaissance faciale.

12:04Comment un ordinateur apprend-il à reconnaître un visage, un individu, dans une vidéo, dans une image ?

12:10Il faut beaucoup de données étiquetées, c'est-à-dire qu'il faut des données

12:16pour lesquelles on est sûr que différentes images représentent bien le même individu.

12:20Donc il faut avoir des données qui ont été validées, soit par la façon dont on les a acquises,

12:24soit par des humains qui ont validé que les données sont bien étiquetées comme elles devraient l'être.

12:29Et après on entraîne un système, on va utiliser des propriétés qui sont importantes dans l'image,

12:33en particulier des propriétés qu'on appelle d'invariance, pour parler en termes plus clairs pour les gens.

12:39Quand je cadre une photo, si c'est le même personnage, mais que la photo n'est pas cadrée de

12:43la même façon,

12:43ou si je recadre la photo, je verrai toujours le même personnage.

12:47Le personnage, je dois pouvoir le déplacer un peu vers la gauche, un peu vers la droite, un peu en

12:51haut, en bas,

12:51et ça doit rester le même personnage.

12:55Et de même que si je zoome, c'est aussi le même personnage.

12:58Je vois des détails, peut-être que je ne voyais pas quand je n'avais pas zoomé,

13:01mais c'est toujours le même personnage.

13:03Donc cette idée que pour être efficace, le système devrait être en mesure de prendre en compte ces invariants,

13:08et après on va les entraîner sur un grand nombre de données.

13:12Et donc on voit bien que si on veut que cette évaluation statistique, elle soit valide,

13:17et si on veut être très certain du résultat, il faut faire un essai sur un grand nombre d'exemples.

13:22Et donc ça pose fatalement une question qui, dans nos sociétés, se heurte à une certaine difficulté,

13:29et qui est une difficulté qui n'est pas de nature technique, mais qui est plutôt de nature politique,

13:33ou de nature liée au droit humain, qui est, est-ce qu'on a envie que des sociétés, des États,

13:40par exemple pour entraîner des systèmes comme ça, ou pour répondre à la question de leur fiabilité de façon très

13:45précise,

13:47et des bases de données qui contiennent des millions de photos d'individus étiquetés.

13:53De temps en temps, il faut quand même se poser la question de savoir où on va avec l'utilisation

13:57de ces techniques-là,

13:58et est-ce qu'on a vraiment envie d'aller dans certaines directions ou pas.

14:01Je reprends un peu l'exemple que vous avez utilisé, celui de la reconnaissance faciale,

14:05qui consiste par exemple à déverrouiller son téléphone.

14:08Ça c'est quelque chose de très courant.

14:10Quand on paramètre cette reconnaissance faciale, cet outil sur le téléphone,

14:14on a juste à poser son visage pendant quelques secondes,

14:17et après, le téléphone, quelle que soit la situation où on se trouve,

14:21le degré de lumière, parfois même s'il manque des lunettes,

14:25ou si on a une coupe de cheveux différente, il reconnaît quand même notre visage.

14:28Donc comment il s'y prend dans ces cas-là ?

14:31Il n'a pas beaucoup d'exemples pourtant ?

14:33Non. Alors là, le secret, qui est un secret aussi un peu sur le texte,

14:39c'est qu'il n'a pas beaucoup d'exemples sur vous,

14:43parce que vous n'avez pas envie que le système soit entraîné spécifiquement sur vous pendant des heures.

14:48Donc vous ne voulez pas mettre toutes sortes de déguisements, par exemple,

14:51et vous photographier devant votre téléphone pour qu'il ait tous les déguisements possibles.

14:56Donc effectivement, il n'a pas forcément beaucoup de photos vous concernant,

15:00mais là, l'idée qu'il faut avoir en tête,

15:02c'est une idée qui est importante en fait pour le texte aussi,

15:05c'est que la question qu'on pose,

15:08même si elle est personnelle,

15:09elle est rarement aussi originale qu'on ne le croit.

15:11Peut-être que quand je me suis photographié avec mon téléphone,

15:14je n'avais pas mes lunettes,

15:15et pourtant, il va me reconnaître alors que j'ai mes lunettes.

15:17Ça, ça vient tout simplement du fait que, certes,

15:19il n'a pas de photos de moi avec et sans de lunettes,

15:21par contre, des photos de personnages avec et sans leurs lunettes,

15:25ou des photos de personnages divers et variés,

15:27certains qui me ressemblent, l'autre qui ne me ressemble pas,

15:29avec un chapeau, sans chapeau,

15:32regardant bien droit dans la caméra,

15:33ou tournant un petit peu la tête,

15:34ça, il en a beaucoup.

15:36Et que du coup, la question d'imaginer

15:38qu'est-ce que ça va changer par rapport à la référence

15:40qui est la photo que vous avez rentrée dans le téléphone portable,

15:45il a beaucoup de données qui peuvent l'aider à comprendre

15:47ce que ça va changer,

15:48parce que, tout simplement, il a beaucoup de visages

15:49qui ne sont pas le vôtre,

15:50mais dans lequel ce type d'effet est présent.

15:53C'est ça, c'est-à-dire que cette technologie,

15:54elle a été entraînée sur des tonnes de visages,

15:58elle a enregistré des tonnes de caractéristiques,

16:00et donc, elle peut détecter ce qui ne change jamais sur un visage

16:03et les accessoires, par exemple.

16:04Tout à fait, et elle peut aussi être robuste.

16:08Alors, on voit bien que, de temps en temps,

16:10ça ne marche pas.

16:11Voilà, de temps en temps, ça ne marche pas.

16:13Donc, ça veut dire qu'il y a quand même certaines limites,

16:15mais pour que ça soit aussi robuste que possible,

16:17il a été aussi important, par exemple,

16:20d'avoir des photos qui sont mal cadrées,

16:21parce que, de temps en temps, ça peut très bien arriver

16:24que vous ne soyez pas tout à fait en face de l'appareil.

16:27Donc, les déformations typiques

16:29que vont causer le fait de ne pas être tout à fait

16:31en face de l'appareil,

16:32d'être dans une drôle de position,

16:33donc, vous voyez, comme les caméras sont assez grand-angle,

16:37quand il y a une drôle de position,

16:38le visage, il est très déformé.

16:39Donc, toutes ces choses-là,

16:40elles étaient présentes dans les données.

16:41Donc, encore une fois,

16:43l'utilisation, encore une fois,

16:44de grandes quantités données

16:46sur la reconnaissance faciale sur son téléphone,

16:48c'est considéré comme une technique assez fiable.

16:51Une écrasante majorité de cas,

16:52il va donner la bonne réponse.

16:54La reconnaissance d'images,

16:55elle est aussi utilisée en médecine.

16:58C'est le champ d'implication

16:59que je voulais maintenant évoquer avec vous,

17:00rapidement.

17:01Qu'est-ce que l'intelligence artificielle

17:03a apporté à la médecine,

17:05et je pense notamment au secteur de la radiologie ?

17:07Alors ça, ce sont des techniques

17:09qui sont déjà très utilisées.

17:10C'est-à-dire que,

17:12quand vous allez passer un examen médical

17:15avec une forme d'imagerie ou d'une autre,

17:18beaucoup des techniques dont on parle sont utilisées.

17:20Ça peut être utilisé à un niveau très bas,

17:22simplement pour reconstruire l'image,

17:24parce que, bien évidemment,

17:26in fine, on voit quelque chose

17:27qui ressemble à une photo,

17:28mais on sait bien que,

17:29quand on est passé,

17:30qu'on a été faire un IRM,

17:31il n'y a pas quelqu'un

17:32qui a pris une photo

17:33de l'intérieur des organes.

17:34C'est plus compliqué.

17:35Donc là, il peut y avoir

17:36l'utilisation de techniques

17:38proches de celles dont on parle

17:40pour reconstruire

17:42ce qu'on va voir comme étant une image

17:43à partir des données de départ,

17:45mais aussi pour faire des choses sur l'image,

17:47et en particulier pour faire

17:48des mesures automatiques,

17:52par exemple des mesures

17:53qui sont quantitatives.

17:56Mesurer un volume,

17:57mesurer un organe,

18:00quantifier le degré de ressemblance

18:02d'une texture à une texture

18:04qui pourrait être potentiellement dangereuse,

18:06ce n'est pas si facile que ça.

18:07Et donc, du coup,

18:08ça, ça fournit typiquement

18:09un ensemble de sorties

18:12que le médecin voit

18:13en même temps qu'il voit l'image

18:15et qu'ils peuvent l'aider

18:16à prendre la décision.

18:17Actuellement, l'intelligence artificielle,

18:19elle aide à lire, par exemple,

18:22des résultats,

18:24parfois même mieux

18:26que ce que les médecins,

18:27les humains, peuvent le faire

18:28avec une précision étonnante.

18:30Pour autant,

18:31elle ne peut pas deviner des maladies

18:34et poser un traitement,

18:35proposer un traitement, par exemple.

18:37Non, pas vraiment.

18:38C'est-à-dire que ça,

18:39effectivement,

18:41c'est une étape

18:42qui serait très compliquée.

18:43Et encore une fois,

18:44pour mesurer pourquoi

18:45c'est très compliqué,

18:47il faudrait avoir des exemples.

18:49C'est-à-dire qu'au fond,

18:50c'est des techniques

18:50qui sont apprises

18:51à partir d'exemples.

18:52Donc, si la tâche

18:53est celle dont je parlais avant,

18:54c'est-à-dire mesurer des organes,

18:56qu'est-ce qu'il faut ?

18:57Il faut avoir plein d'images

18:58tirées d'imagerie médicale.

19:00Dans les données médicales,

19:01il y a un point qui est compliqué,

19:02c'est que toutes les personnes

19:03sont différentes.

19:04Donc, une image du corps humain,

19:06ça ressemble, bien évidemment,

19:07ça ressemble toujours

19:08un petit peu

19:08d'un individu à un autre,

19:10mais il y a beaucoup

19:10de différences individuelles.

19:12Et il y a aussi des différences

19:13qui sont liées au matériel.

19:15Donc, quand on dit un IRM,

19:16en réalité,

19:17il y a des fournisseurs

19:18de matériel

19:19qui permettent de faire des IRM.

19:20Et selon que vous avez passé

19:22votre IRM

19:22dans un laboratoire

19:24équipé de tel ou tel matériel,

19:25tout ça, c'est un peu différent.

19:27Donc, le système,

19:28à la base, par exemple,

19:29s'il essaye de mesurer

19:30la taille des organes,

19:31il doit avoir été entraîné

19:32à partir d'images

19:34acquises avec beaucoup de personnes,

19:36beaucoup de systèmes d'imagerie,

19:37si on veut qu'ils soient

19:39robustes aux différences

19:40entre les différents

19:41systèmes d'imagerie,

19:42et sur lesquels

19:43on a désigné les organes

19:44et on les a,

19:46par exemple,

19:46un opérateur humain

19:47a dit, voilà,

19:48ça c'est le foie

19:49et voilà les limites du foie.

19:51Si on voulait répondre

19:52à la question que vous me posez,

19:53c'est-à-dire,

19:53voilà les éléments,

19:54quel est le diagnostic ?

19:55Il faudrait qu'on ait appris

19:57à partir de beaucoup

19:58d'éléments similaires

20:00qui seraient,

20:01voilà,

20:01quel était l'élément,

20:02voilà,

20:03quel était le diagnostic.

20:04Donc, je ne dis pas

20:04que c'est impossible,

20:05je ne dis pas

20:05que ça ne peut pas se produire

20:07dans un futur très lointain,

20:09mais je dis que pour l'instant,

20:10on en est véritablement

20:12extrêmement loin.

20:13Oui, donc ça demanderait

20:14beaucoup de données,

20:16un entraînement intensif,

20:17un peu comme tous

20:18les systèmes d'IA

20:19avant qu'ils ne deviennent

20:20performants.

20:21Le dernier cas pratique

20:23que je voulais aborder

20:24avec vous,

20:25c'est celui de l'IA

20:26qu'on appelle générative.

20:27En clair,

20:28ce sont les systèmes

20:29utilisés pour créer

20:30des médias

20:31ou des contenus artistiques,

20:32des images,

20:33des musiques,

20:34des vidéos

20:34à partir d'une consigne.

20:36Par exemple,

20:37on dit à la machine,

20:38est-ce que tu peux,

20:39à partir de cette photo de moi,

20:40me faire apparaître

20:41dans un tableau

20:42comme si j'avais été peint

20:44par un artiste de renom ?

20:45Là encore,

20:47est-ce que vous pouvez

20:47nous expliquer,

20:48grosso modo,

20:49comment ça fonctionne ?

20:50Il y a des choses

20:50qui sont un peu spécifiques

20:51à ce type d'utilisation

20:52qui seraient par exemple

20:54quelque chose

20:54qui est assez simple

20:55qui correspond à cette idée

20:57qu'on pourrait appeler

20:58transfert de style.

21:00C'est-à-dire,

21:01j'ai une image,

21:01par exemple,

21:02qui représente un portrait

21:04de quelqu'un

21:04que j'ai pris moi-même

21:05avec mon téléphone

21:07et pour des raisons récréatives

21:09pour n'importe quel but,

21:10j'ai envie de la faire

21:10ressembler à autre chose,

21:11par exemple,

21:12un tableau à une peinture

21:14comme on voit

21:14dans certains musées

21:16ou des impressionnistes.

21:18Donc,

21:18j'ai cette image

21:18et je voudrais

21:19qu'elle ressemble

21:19à un tableau peint

21:20par un impressionniste.

21:22Ça,

21:22typiquement,

21:23pour le faire,

21:23toujours pareil,

21:24il faut des images

21:25qui ressemblent

21:26à des images

21:26de départ,

21:28donc des images typiques

21:29qui sont les images

21:30qu'on prend dans la vie

21:31de tous les jours

21:31avec son téléphone,

21:33des images

21:34de tableau impressionniste.

21:36Le type de choses

21:37qui vont aider,

21:38c'est toujours pareil,

21:39c'est quand on va

21:39prendre une image,

21:40en fait,

21:40on ne va pas se focaliser

21:43sur tous les détails

21:44de la même façon

21:45et on peut imaginer

21:46que quand on prend

21:46une image

21:47dans laquelle il y a un personnage,

21:48surtout le personnage

21:48qui est important.

21:49Donc,

21:49ça veut dire que peut-être

21:50les tableaux,

21:51parce que dans certains tableaux,

21:52ce n'est pas si clair que ça,

21:53il va falloir aussi

21:55les étiqueter

21:56en disant,

21:56voilà,

21:57là,

21:57c'est un personnage,

21:58ça,

21:58c'est un fond,

21:59ça,

21:59c'est la nature,

22:00etc.

22:00et peut-être

22:01les images de départ

22:03aussi les étiqueter

22:04comme ça.

22:06Et après,

22:07on va essayer

22:08de chercher

22:09dans ces modèles

22:10quels sont les aspects

22:11qui sont le plus responsables

22:13de la production

22:14de certains aspects

22:15de l'image,

22:15par exemple,

22:16on peut imaginer

22:17que pour avoir donné

22:19l'impression

22:19que votre image

22:20est un tableau impressionniste,

22:21ce qui compte beaucoup,

22:22c'est les couleurs,

22:22par exemple,

22:23parce que la principale différence

22:24entre une image prise

22:25avec votre smartphone

22:26qui représente la vie

22:27de tous les jours

22:28et un tableau impressionniste,

22:29c'est essentiellement,

22:31déjà,

22:31un registre de couleurs

22:32qui est très différent.

22:34Et du coup,

22:34on va essayer

22:34d'apprendre,

22:36encore une fois,

22:37toujours pareil,

22:38un modèle

22:39qui va associer

22:40le registre de couleurs

22:41qu'on trouve le plus souvent

22:42dans les images

22:42de la vie courante

22:43avec le registre de couleurs

22:45qui est celui

22:45qu'on trouve

22:46dans les images

22:47qui sont,

22:48par exemple,

22:48tableaux impressionnistes

22:49si le but

22:49c'est tableaux impressionnistes.

22:50Est-ce qu'on peut dire

22:52que ces systèmes d'IA

22:54qui génèrent de la musique,

22:55des images,

22:57des textes,

22:57des poèmes,

22:58même parfois,

22:59sont des artistes ?

23:01Non,

23:02alors ça,

23:02on en parle dans le livre,

23:03je ne pense pas

23:04et je pense que surtout,

23:06il prospère

23:07sur quelque chose

23:08qui est très problématique.

23:09Donc,

23:10par exemple,

23:10il y a quelques temps,

23:11il y a eu

23:11une de ces applications

23:12où on se prend,

23:13enfin,

23:14une de ces utilisations,

23:15on va dire,

23:16qui est devenue populaire,

23:17c'est je me prends en photo

23:18avec mon téléphone

23:19ou je prends mes amis

23:20en photo avec le téléphone

23:21et j'essaye de transformer ça

23:23en images qui pourraient avoir été captées

23:26ou provenir des films du studio Ghibi,

23:30le studio de Miyazaki,

23:32parce que c'est des films très populaires.

23:34Donc,

23:34ça veut dire que le système,

23:37forcément,

23:38il a entrainé à partir de données

23:40qui, en fait,

23:40sont des données protégées

23:42par des droits d'auteur.

23:43Ça n'empêche que

23:44il y a effectivement

23:45un flou actuel

23:48qui est que,

23:48bien que le film de Miyazaki,

23:51par exemple,

23:52soit protégé par un droit d'auteur,

23:53on sait très bien

23:54qu'il y a des morceaux de cette oeuvre

23:55qui traînent partout,

23:57notamment,

23:57on en trouve plein d'extraits

23:59sur YouTube,

24:00des extraits très courts

24:01qui durent quelques minutes

24:01et donc,

24:02ça veut dire que tous ces extraits,

24:03ils ont pu être utilisés

24:05pour entraîner le système

24:07et donc,

24:08in fine,

24:08vous voyez que pour répondre

24:09à la question de savoir

24:10si tout ça,

24:10ça produit de l'art,

24:12si on était,

24:13on se plaçait un petit peu plus

24:15du côté des personnes

24:16qui ont fourni,

24:18on va dire,

24:18les données de départ,

24:19ben eux,

24:20ils vous diraient,

24:21ben non,

24:21ça c'est pas de l'art,

24:22ça s'appelle du plagiat,

24:23ça veut dire qu'on a essentiellement

24:24entraîné des systèmes

24:25à essayer de reproduire

24:27des caractéristiques

24:28d'oeuvre-existence

24:30sans s'être vraiment prévalu

24:34du consentement des auteurs

24:36et donc,

24:37c'est vrai que

24:38si c'est pour montrer

24:39à ses amis,

24:40c'est normal,

24:40c'est un usage qui est prévu,

24:42par contre,

24:43l'utiliser

24:43à des fins commerciales

24:45ou même

24:46la publier

24:47sur des réseaux sociaux

24:49par exemple

24:50pour la diffuser,

24:51ça,

24:53chacun doit un petit peu

24:54se poser des questions

24:55avant de faire ça

24:56et de se dire,

24:56voilà,

24:56est-ce que c'est une bonne idée,

24:57est-ce qu'en faisant ça,

24:58j'ai une utilisation

24:59tout à fait responsable

25:00des outils ?

25:01Dans le livre,

25:02vous dites qu'il est peu probable

25:03que ces systèmes

25:06soient à l'origine,

25:07enfin,

25:07créent un courant artistique

25:09en fait,

25:09parce qu'ils font

25:10par rapport à l'existant.

25:12Disons que,

25:12voilà,

25:13là,

25:13on arrive dans les points

25:14un petit peu

25:15qui sont les angles morts

25:16de ce type de technique.

25:17Ce type de technique,

25:18elles sont quand même

25:20entraînées à partir

25:21de données existantes.

25:22Si vous demandez

25:23au système

25:24d'être créatif,

25:25par exemple,

25:26voilà,

25:26vous lui posez

25:26un vrai problème.

25:27Qu'est-ce que ça veut dire

25:28être créatif ?

25:29Donc, par exemple,

25:30s'il y a un système

25:30qui produit des textes,

25:31il lui demandait

25:31d'être créatif,

25:33les éléments

25:33qu'il peut utiliser,

25:34c'est tous les textes

25:36qui parlent

25:36de la créativité

25:38qu'il a vus,

25:39ou le terme créatif,

25:40créativité,

25:41parce que pour ces systèmes-là,

25:42c'est très facile

25:42de reconnaître

25:43que créatif,

25:44créativité,

25:44tous ces mots-là

25:46appartiennent

25:46à un même registre.

25:48Donc,

25:48il va utiliser

25:49tous ces textes,

25:49mais là,

25:50raté,

25:51parce que finalement,

25:51un texte

25:52où on parle

25:53de créatif

25:54ou de créativité,

25:55c'est pas forcément

25:55un texte

25:56qui en lui-même

25:56est très créatif.

25:58Olivier Capet,

25:59dans tous les grands cas

26:00que nous venons d'évoquer,

26:01ces systèmes ont besoin

26:02donc de données massives,

26:04de beaucoup d'entraînements,

26:05ça on l'a vu,

26:06mais aussi de ressources.

26:08On n'aura pas le temps

26:09d'aborder cette question

26:10dans ce podcast,

26:11mais vous y consacrez

26:12un chapitre

26:12dans votre livre.

26:14L'IA demande

26:15beaucoup d'électricité

26:16pour faire fonctionner,

26:18mais aussi refroidir

26:19les appareils

26:20en surchauffe

26:21à force de faire

26:22des milliards de calculs.

26:23Et donc,

26:24l'impact environnemental

26:26de ce secteur

26:26n'est pas neutre,

26:27il me semblait

26:28important de l'évoquer.

26:29Il me reste une question

26:31à vous poser

26:32et celle-ci,

26:32elle concerne

26:33l'avenir de l'IA.

26:34Est-ce qu'un jour,

26:35au vu de la vitesse

26:36à laquelle ces machines

26:37peuvent apprendre,

26:39les systèmes

26:39d'intelligence artificielle

26:41seront capables

26:42de comprendre,

26:43de réaliser

26:43n'importe quelle tâche

26:44intellectuelle

26:45qu'un humain pourrait faire ?

26:46Je pense que la réponse

26:48honnête est

26:48je ne sais pas.

26:50Il faut bien avoir confiance

26:51que tous les utilisateurs

26:52de ce type de système

26:53chaque jour,

26:54il faut nice

26:54des données d'entraînement

26:55parce que par exemple,

26:56à côté des réponses,

26:58vous avez des petits drapeaux

26:59j'aime, j'aime pas.

27:00Et donc,

27:01si l'utilisateur a dit

27:02j'aime,

27:02ça veut dire ça,

27:03c'est une bonne réponse.

27:04Il faut essayer

27:04d'encourager le système

27:05à avoir ce type de réponse.

27:06S'il a dit

27:06qu'il n'est pas content

27:07ou si dans son interaction,

27:08il dit mais non,

27:09on ne sait pas du tout

27:10ce que je veux,

27:11tu t'es trompé,

27:12ça veut dire que la réponse

27:13était mauvaise.

27:13Donc, bien évidemment,

27:16réentraîner sur ces problèmes-là,

27:17essayer de développer

27:18des nouvelles techniques

27:18pour améliorer

27:19sur ce type de données-là,

27:21ça améliore globalement

27:22les systèmes.

27:22Mais ça les améliore

27:23dans des directions particulières.

27:25Est-ce qu'on peut

27:26en déduire et penser

27:27qu'être amélioré

27:28dans des directions particulières,

27:30par exemple,

27:30savoir mieux faire les calculs

27:31si initialement,

27:32on ne savait pas bien les faire,

27:33est-ce que ça va améliorer

27:35dans toutes les directions ?

27:36La réponse, là,

27:38par contre,

27:38est un énorme point d'interrogation.

27:40Donc, l'intelligence surhumaine

27:42d'un ordinateur,

27:43ça, c'est pas possible.

27:44Ça, a priori,

27:45on n'y est pas.

27:46Pour moi,

27:46cette question-là,

27:47c'est un petit peu

27:47comme si vous me demandiez

27:48de comparer un avion

27:50à un oiseau

27:51et que vous aviez envie

27:52de me faire dire

27:53qu'un avion,

27:54c'est mieux qu'un oiseau.

27:55Certes, un avion,

27:56c'est mieux qu'un oiseau

27:56par certains aspects.

27:57Ça peut transporter

27:58300 personnes

27:59ou 600 peut-être,

28:00même pour les plus gros.

28:01Mais en même temps,

28:02c'est pas la même chose.

28:03Et donc, même si ça produit

28:04des effets qui peuvent

28:05se ressembler,

28:06ça vole dans le ciel,

28:07ça vole pas du tout

28:08de la même façon.

28:09Quand on regarde des oiseaux,

28:10on peut avoir des idées

28:11pour améliorer les avions.

28:13La comparaison est intéressante.

28:15Mais la question de savoir

28:16si à la fin,

28:18l'avion fait mieux

28:19que l'oiseau,

28:19en fait,

28:20elle n'a pas de réponse

28:21parce qu'en réalité,

28:22l'oiseau,

28:23c'est une créature qui existe.

28:24Elle ne va pas s'arrêter

28:25d'exister.

28:26Et l'avion,

28:27il fait mieux par certains aspects,

28:28il fait moins bien par d'autres.

28:29Si on parle de consommation énergétique,

28:31l'avion,

28:32il fait moins bien que l'oiseau

28:33parce que l'oiseau,

28:33il n'a pas besoin de carburant.

28:35C'est un peu la raison

28:36pour laquelle

28:36je n'ai pas envie

28:37de répondre à cette question.

28:38C'est peut-être

28:39que, in fine,

28:41les systèmes répondront

28:43de façon bien meilleure

28:44que la moyenne des individus humains

28:47a des questions.

28:49Mais, après,

28:50à quel prix ?

28:50C'est-à-dire,

28:51il va falloir dépenser

28:52combien d'énergie

28:53pour que ça soit le cas ?

28:54Est-ce que ça sera un bienfait

28:56pour les gens ?

28:56Est-ce que les gens

28:57considéreront que

28:58tout ça,

28:58ça apporte des choses

28:59qui sont intéressantes,

29:00qui améliorent la vie

29:01ou qui améliorent

29:02tout un tas d'aspects

29:03qui sont importants ?

29:04Ou est-ce qu'au contraire,

29:05ils se diront

29:05voilà, ça ne va pas du tout,

29:07ça nous a privé

29:08du plaisir

29:08de faire certaines choses ?

29:09Donc, c'est pour ça

29:10que je ne suis pas du tout

29:12choqué par l'idée

29:14capable de faire

29:15avec ce qu'on obtient

29:16avec une machine.

29:17Mais, par contre,

29:18déclarer que c'est mieux,

29:20pour moi,

29:20c'est un peu une erreur.

29:23Merci Olivier Capet

29:24et je conseille

29:25la lecture de votre livre

29:26pour en apprendre davantage.

29:28Je rappelle son titre

29:29« Tout comprendre

29:30ou presque

29:31sur l'intelligence artificielle »

29:33publié aux éditions

29:34du CNRS.

29:35Merci beaucoup.

29:36Vous pouvez soutenir

29:37Codesource,

29:38le podcast d'actualité

29:39du Parisien

29:40en laissant des pouces en l'air

29:41et des commentaires

29:42sur YouTube,

29:43des petites étoiles

29:44sur votre plateforme

29:45d'écoute préférée.

29:46C'est ce qui nous aide

29:46à remonter dans les classements

29:48et ne ratez pas non plus

29:49Crime Story,

29:50notre podcast fait divers

29:52avec une nouvelle affaire criminelle

29:54à retrouver chaque samedi.

29:56Merci à tous.

29:57Merci à tous.

Catégorie

Transcription

Commentaires

Recommandations