Passer au playerPasser au contenu principal
Debut : 🎥 Pour ne rater aucune de nos vidéos, abonnez-vous et n'oubliez pas d'activer la cloche. https://youtube.com/@LeParisien

L’intelligence artificielle est de plus en plus présente dans notre quotidien et soulève de nombreuses questions scientifiques, éthiques et politiques. Entretien avec Olivier Cappé, directeur de recherche au CNRS.

Crédits. Direction de la rédaction : Pierre Chausse - Rédacteur en chef : Jules Lavie - Production et réalisation : L’équipe de Code Source - Musiques : François Clos, Audio Network.

Pour ne rien manquer de l’actualité du Parisien :

🔔 Suivre toute l’actualité avec notre abonnement : https://urlr.me/!abonnementleparisien

✉️ En savoir plus sur l’actualité avec notre newsletter : https://bit.ly/new-sletters

👂 Retrouvez nos différents podcasts :

Code Source: L’actualité quotidienne du Parisien : https://bit.ly/_Codesource
Crime Story: Le podcast faits-divers du Parisien : https://bit.ly/_Crimestory
Le Sacre: Revivez le parcours d’un médaillé olympique : https://bit.ly/_Lesacre

Suivez-nous :
Instagram : https://instagram.com/leparisien/
Facebook : https://facebook.com/leparisien/
Tiktok : https://tiktok.com/@leparisien
X : https://twitter.com/@le_Parisien
Snapchat : https://snapchat.com/t/pr3nDoxv
Bluesky : https://bsky.app/profile/leparisien.fr
Threads : https://threads.net/@leparisien

#intelligenceartificielle #IA #chatgpt #codesource

Catégorie

🗞
News
Transcription
00:01Bonjour, c'est Thibaut Lambert et vous écoutez Codesource, le podcast d'actualité du Parisien.
00:12Quel est le point commun entre tchat GPT, mon téléphone qui se déverrouille en reconnaissant mon visage,
00:18ou encore une chanson originale générée avec la voix d'un chanteur mort il y a longtemps ?
00:24Réponse, tous ces exemples font appel à l'intelligence artificielle,
00:28un terme qui revient beaucoup dans l'actualité, l'IA en abrégé est amené à prendre de plus en plus
00:34de place dans notre quotidien,
00:36mais que savons-nous vraiment de cette technologie, de son fonctionnement et de ses limites ?
00:41Si vous avez encore du mal à y voir clair quand on vous parle d'intelligence artificielle,
00:47cet épisode hors format de Codesource est fait pour vous.
00:50Notre invité du jour, Olivier Capet, vient nous résumer ce qu'il faut absolument savoir.
00:55Il est directeur de recherche au Centre National de la Recherche Scientifique, le CNRS,
01:00et travaille au département informatique de l'École Normale Supérieure.
01:12Bonjour Olivier Capet.
01:13Bonjour.
01:14Bienvenue dans Codesource, vous avez dirigé l'écriture d'un petit guide illustré de 130 pages
01:20qui s'intitule « Tout comprendre ou presque sur l'intelligence artificielle »
01:24paru en mai dernier aux éditions du CNRS.
01:27Et pour ce livre, très coloré, très facile à parcourir, on a l'impression de feuilleter un livre jeunesse,
01:33vous avez travaillé avec Claire Marc, une médiatrice scientifique et illustratrice.
01:38Et dans l'introduction, vous constatez qu'on entend énormément parler d'intelligence artificielle depuis quelques années,
01:45surtout en fait depuis que ChatGPT a été mis à disposition du grand public à la fin de l'année
01:512022.
01:51Alors d'abord, rappelez-nous en quelques mots ce qu'est ChatGPT ou ChatGPT en français.
01:58ChatGPT, donc on peut appeler ça un chatbot, donc désolé, terme anglais comme souvent dans ce domaine,
02:04un robot conversationnel, mauvaise traduction pour le coup parce que, enfin j'appellerais pas ChatGPT un robot,
02:10donc on peut aussi l'appeler agent conversationnel.
02:12C'est un système avec lequel on interagit uniquement de façon textuelle,
02:16en tout cas je parle du système de 2022, depuis ça a un peu évolué.
02:20Donc on lui pose une question, c'est pas nécessairement une question, on peut faire ce qu'on veut en
02:25fait,
02:25on peut entrer n'importe quel texte, donc ce texte en anglais c'est ce qu'on appelle prompt.
02:30Et ce texte-là, il va déclencher une réponse de la machine.
02:34Et ce qui est frappant et ce qu'a frappé les gens aussi depuis le début,
02:38c'est qu'on peut enchaîner avec une réponse à la réponse de la machine,
02:42et ça peut continuer comme ça pendant très longtemps,
02:44et ça produit une impression de conversation,
02:48en particulier parce que la machine, elle garde trace de tout ce qui s'est dit depuis le début de
02:52la conversation.
02:53Donc même si la conversation dure longtemps,
02:55on a cette impression qu'effectivement des choses qui ont été évoquées il y a assez longtemps,
02:59elles continuent à avoir une importance dans la conversation.
03:02Mais en réalité, l'intelligence artificielle, elle est beaucoup plus ancienne que ChatGPT,
03:08ça vous le dit dans le livre, ce terme, intelligence artificielle, il est apparu dans les années 50,
03:13qu'est-ce qui le désignait au départ ?
03:15Il faut se souvenir qu'au milieu des années 50, années 60,
03:20c'est l'apparition des premiers ordinateurs qui ressemblent quand même aux ordinateurs qu'on a actuellement,
03:25bien évidemment très différents, beaucoup plus grands, pas accessibles à tout le monde,
03:28mais néanmoins, ça a suscité des réflexions chez des ingénieurs, des scientifiques,
03:34sur les limites de ce nouvel outil.
03:36C'est-à-dire que ce nouvel outil, on voyait bien qu'il était capable d'effectuer des tâches,
03:40par exemple de faire des calculs.
03:44La question c'est jusqu'à quel point on peut pousser ce type d'outil
03:48pour s'approcher de tâches qui sont habituellement réalisées par des humains.
03:53Et donc on a appelé intelligence artificielle tous les efforts qui ont visé à essayer de faire effectuer
03:58par la machine des tâches qui ressemblent autant que possible à des tâches qui habituellement sont faites par des humains.
04:04Aujourd'hui, quand on parle d'intelligence artificielle, le grand public, moi par exemple,
04:08on s'imagine principalement une machine, un système informatique qui peut discuter avec nous,
04:14répondre à des questions complexes, effectuer des tâches comme composer une chanson,
04:18coloriser une image, rédiger une dissertation de philosophie.
04:21Mais vous expliquez que la machine le fait avec l'apparence de l'intelligence et pas l'intelligence.
04:28L'apparence de l'intelligence, qu'est-ce que vous entendez par là ?
04:32C'est là que le terme d'intelligence artificielle a un côté un tout petit peu trompeur.
04:35C'est que quand on parle d'intelligence, je pense que tout le monde,
04:38quand il ou elle entend parler d'intelligence, se dit là on est en train de parler de moi.
04:42Donc quand on entend parler d'intelligence artificielle, on dit tiens,
04:44peut-être que ça fonctionne de la même façon dont j'effectuerais des tâches si je devais les effectuer.
04:49La réponse n'est pas du tout ça.
04:51Donc c'est en ça qu'on peut dire que c'est une apparence,
04:53c'est-à-dire qu'on obtient des résultats qui sont similaires à ceux que peut-être un être humain
04:59pourrait obtenir,
05:00mais en aucun cas on ne va procéder de la même façon.
05:04Donc c'est en ça que c'est très différent, c'est qu'en particulier,
05:07je ne cherche pas à dire que les résultats obtenus, par exemple, ne sont pas impressionnants,
05:13mais il faut les regarder en ne se disant pas qu'ils ont été produits par un être humain.
05:17Non, la vérité c'est que pour obtenir ce résultat-là,
05:21des techniques ont été utilisées qui sont tout à fait incomparables
05:25avec la façon dont un être humain pourrait essayer d'envisager de faire la même tasque.
05:29Et du coup, cette impression parfois trompeuse qu'on peut avoir,
05:32que le système connaît tout sur tout,
05:34elle est surtout apparente quand on pose des questions qui en fait sont des questions liées à l'érudition.
05:39Donc, par exemple, je ne sais pas si là, vous me demandez à brûle-pourpoint comment fonctionne un moteur de
05:45voiture,
05:45je ne sais pas parce que ça ne m'intéresse pas tellement, je n'ai jamais regardé,
05:48je n'ai pas fait des études là-dessus, je ne sais pas.
05:51Après, je sais par contre qu'en cherchant sur Internet, je vais trouver des sites qui expliquent ça.
05:56Et là, du coup, la comparaison avec l'être humain, elle est simple.
06:00C'est tout simplement que moi, même si j'avais accès à toutes ces informations,
06:04admettons que j'ai envie moi aussi d'être une personne particulièrement qui sait beaucoup de choses,
06:10je peux commencer à lire des livres.
06:12Mais le problème que je vais avoir au bout d'un moment, c'est me souvenir de tous ces livres
06:16que j'ai lus.
06:16Donc peut-être que dans tous ces livres que j'ai lus, il y en avait un qui parlait de
06:20la maintenance automobile
06:22et c'est celui dont je devrais me souvenir à ce moment-là.
06:24Mais le problème, c'est que ma capacité mémoire ne me permet pas de me souvenir de ce livre-là.
06:28La supériorité des systèmes bâtis avec de l'intelligence artificielle,
06:34elle repose surtout sur une certaine capacité de mémorisation de cet ensemble d'informations
06:40qui est tout à fait hors de portée à tout être humain, clairement.
06:45Et ce que vous dites dans votre livre, c'est qu'on a l'impression que ce chat est intelligent,
06:49notamment parce qu'il donne l'impression de savoir plein de choses
06:53et il peut nous répondre de manière très cohérente, de façon presque humaine.
06:57Mais en réalité, son système a été très longuement entraîné pour donner ce résultat.
07:02Ce qui a été observé, en fait, c'est que pour que ça fonctionne,
07:07alors qu'est-ce que ça veut dire fonctionne ?
07:08Disons qu'à minima, pour que ça produise des textes qui ont l'air corrects
07:11et qui sont corrects d'ailleurs en très très grande majorité,
07:14donc corrects du point de vue du langage, du respect de la syntaxe et des conventions,
07:19de la langue, pour arriver à ce résultat-là, en fait, il fallait avoir suffisamment de données d'apprentissage.
07:25C'est-à-dire, la grosse différence entre les premiers efforts qui sont tracés,
07:29qu'on peut retrouver dans la littérature et maintenant,
07:31c'est que les premiers efforts, si on les utilisait juste pour générer des phrases,
07:36en fait, on voyait tout de suite qu'il y avait quelque chose qui clochait.
07:38C'est-à-dire, soit la phrase n'était pas correcte grammaticalement,
07:40soit elle ne voulait absolument rien dire, on avait du mal à lui donner un sens,
07:45et progressivement, en prenant plus de données et des modèles plus grandes,
07:50de taille plus grande, donc avec un plus grand nombre de degrés de liberté,
07:53un plus grand nombre de paramètres appris,
07:54on est arrivé à un seuil où finalement, à minima,
07:58ce que les systèmes actuels produisent, c'est des phrases qui sont tout le temps correctes.
08:02Et ça, c'est un effet qui n'apparaît que quand la taille du modèle est suffisant
08:07et quand le nombre de données est suffisant.
08:08Donc ça veut dire que tout à l'heure, quand je parlais d'utiliser des centaines de millions de textes,
08:13les gens ne font pas ça par plaisir pour montrer qu'ils sont forts.
08:16C'est simplement que s'ils faisaient à partir de beaucoup moins de textes,
08:19de mille fois moins,
08:21ça ne produirait plus des phrases qui ont l'air cohérentes, tout simplement.
08:25C'est ce qui a permis à l'intelligence artificielle et les systèmes comme ChatGPT
08:29de livrer des résultats bluffants ces dernières années,
08:33c'est-à-dire cette accumulation de données par rapport aux années 2010 ou 2000, par exemple ?
08:38Tout à fait, beaucoup plus de données, des progrès techniques dans l'architecture.
08:43Donc ce qu'on appelle l'architecture, c'est la façon dont on construit les modèles.
08:46Donc il faut imaginer que ces modèles, ils sont compliqués.
08:49Donc on essaye de les décrire un peu dans le livre.
08:51Toujours plus de données, des modèles de plus en plus grands.
08:54Ça veut dire aussi de plus en plus de calculs.
08:56Donc l'autre ingrédient, pour répondre à votre question,
08:58qu'est-ce qui a changé, on va dire, depuis 10 ou 15 ans ?
09:01C'est la réalisation que pour faire tout ça, on avait besoin de moyens de calculs importants.
09:06Et le fait d'obtenir ces moyens de calculs, avec là aussi des avancées,
09:11par exemple sur les architectures de calculs qui sont appropriées
09:14pour effectuer ces calculs le plus rapidement possible.
09:17Autre point important, Olivier Capet, avant qu'on passe à la suite,
09:19vous rappelez qu'il ne faut pas voir l'intelligence artificielle
09:22comme un ordinateur qui saurait tout faire.
09:26C'est plutôt, en résumé, la somme de plein de machines indépendantes
09:30qui accomplissent des tâches spécifiques, c'est ça ?
09:33Oui, en tout cas, l'idée qui est importante, c'est le fait que
09:37les systèmes doivent être entraînés à partir de données
09:40qui ont un rapport avec ce qu'on veut faire avec.
09:42Donc c'est assez vague dit comme ça, mais pour donner un exemple qui est très clair,
09:46Tchad GPT, il est très très fort, il sait faire des choses avec du texte
09:50depuis 2022, dans les versions récentes, il sait faire des choses avec des images.
09:54Mais si vous lui dites, voilà, hier je suis allé faire un examen médical
09:59et je me pose la question de savoir ce que je dois m'inquiéter,
10:02Tchad GPT, il n'a aucune raison de savoir répondre à cette question-là
10:05parce que personne ne l'a jamais entraîné à essayer d'obtenir des bons résultats
10:10sur ce type de tâches.
10:12Autre exemple qu'on pourrait donner, maintenant, on entend assez régulièrement parler
10:16parce que ça pose des problèmes, notamment économiques,
10:19au milieu artistique, de logiciels qui permettent de générer de la musique.
10:24Si on a entraîné un système avec juste quelques petits exemples de musique,
10:29on ne va pas obtenir de la musique qui ressemble à de la musique.
10:31Donc pour obtenir de la musique qui ressemble à de la musique,
10:34fatalement, il faut avoir eu accès à un grand volume de musique enregistré
10:40et il faut avoir entraîné le système à partir de ces données.
10:44Et par exemple, si on veut être capable de produire de la musique en disant,
10:47oui, mais moi j'aime le jazz et donc je voudrais de la musique qui ressemble à du jazz,
10:53fatalement, il faut que ces données, elles aient été étiquetées avec des informations
10:56qui vont aider le système à déterminer qu'est-ce que c'est de la musique qui ressemble à du
11:00jazz
11:00et qu'est-ce que c'est de la musique qui n'y ressemble pas à du jazz.
11:02Pour résumer, il y a un système qui est fort en musique, un système qui est fort en texte,
11:07un système qui est très fort pour analyser de l'imagerie médicale,
11:12mais ces systèmes ne communiquent pas forcément entre eux.
11:14Non. Pour obtenir des bons résultats sur des tâches spécifiques,
11:19on est obligé de spécialiser les outils sur ces tâches en fait.
11:23On va dire que l'idée est que j'ai des systèmes qui sont entraînés à partir de données
11:28qui sont spécifiques aux problèmes que j'essaye de résoudre
11:31et non pas un système unique qui essaye de résoudre tous les problèmes à la fois.
11:35Bien. Ceci étant posé, vous allez maintenant nous aider à comprendre
11:39comment fonctionnent quelques systèmes d'IA qu'on utilise très souvent dans notre quotidien.
11:44On ne pourra pas être exhaustif, alors j'ai choisi trois champs d'application
11:48qu'on va prendre les uns après les autres.
11:50La reconnaissance faciale, la médecine, et on terminera par l'IA qui crée des musiques,
11:56des images, des vidéos à partir d'une consigne.
11:58C'est ce qu'on appelle l'IA générative.
12:01Commençons donc d'abord par la reconnaissance faciale.
12:04Comment un ordinateur apprend-il à reconnaître un visage, un individu, dans une vidéo, dans une image ?
12:10Il faut beaucoup de données étiquetées, c'est-à-dire qu'il faut des données
12:16pour lesquelles on est sûr que différentes images représentent bien le même individu.
12:20Donc il faut avoir des données qui ont été validées, soit par la façon dont on les a acquises,
12:24soit par des humains qui ont validé que les données sont bien étiquetées comme elles devraient l'être.
12:29Et après on entraîne un système, on va utiliser des propriétés qui sont importantes dans l'image,
12:33en particulier des propriétés qu'on appelle d'invariance, pour parler en termes plus clairs pour les gens.
12:39Quand je cadre une photo, si c'est le même personnage, mais que la photo n'est pas cadrée de
12:43la même façon,
12:43ou si je recadre la photo, je verrai toujours le même personnage.
12:47Le personnage, je dois pouvoir le déplacer un peu vers la gauche, un peu vers la droite, un peu en
12:51haut, en bas,
12:51et ça doit rester le même personnage.
12:55Et de même que si je zoome, c'est aussi le même personnage.
12:58Je vois des détails, peut-être que je ne voyais pas quand je n'avais pas zoomé,
13:01mais c'est toujours le même personnage.
13:03Donc cette idée que pour être efficace, le système devrait être en mesure de prendre en compte ces invariants,
13:08et après on va les entraîner sur un grand nombre de données.
13:12Et donc on voit bien que si on veut que cette évaluation statistique, elle soit valide,
13:17et si on veut être très certain du résultat, il faut faire un essai sur un grand nombre d'exemples.
13:22Et donc ça pose fatalement une question qui, dans nos sociétés, se heurte à une certaine difficulté,
13:29et qui est une difficulté qui n'est pas de nature technique, mais qui est plutôt de nature politique,
13:33ou de nature liée au droit humain, qui est, est-ce qu'on a envie que des sociétés, des États,
13:40par exemple pour entraîner des systèmes comme ça, ou pour répondre à la question de leur fiabilité de façon très
13:45précise,
13:47et des bases de données qui contiennent des millions de photos d'individus étiquetés.
13:53De temps en temps, il faut quand même se poser la question de savoir où on va avec l'utilisation
13:57de ces techniques-là,
13:58et est-ce qu'on a vraiment envie d'aller dans certaines directions ou pas.
14:01Je reprends un peu l'exemple que vous avez utilisé, celui de la reconnaissance faciale,
14:05qui consiste par exemple à déverrouiller son téléphone.
14:08Ça c'est quelque chose de très courant.
14:10Quand on paramètre cette reconnaissance faciale, cet outil sur le téléphone,
14:14on a juste à poser son visage pendant quelques secondes,
14:17et après, le téléphone, quelle que soit la situation où on se trouve,
14:21le degré de lumière, parfois même s'il manque des lunettes,
14:25ou si on a une coupe de cheveux différente, il reconnaît quand même notre visage.
14:28Donc comment il s'y prend dans ces cas-là ?
14:31Il n'a pas beaucoup d'exemples pourtant ?
14:33Non. Alors là, le secret, qui est un secret aussi un peu sur le texte,
14:39c'est qu'il n'a pas beaucoup d'exemples sur vous,
14:43parce que vous n'avez pas envie que le système soit entraîné spécifiquement sur vous pendant des heures.
14:48Donc vous ne voulez pas mettre toutes sortes de déguisements, par exemple,
14:51et vous photographier devant votre téléphone pour qu'il ait tous les déguisements possibles.
14:56Donc effectivement, il n'a pas forcément beaucoup de photos vous concernant,
15:00mais là, l'idée qu'il faut avoir en tête,
15:02c'est une idée qui est importante en fait pour le texte aussi,
15:05c'est que la question qu'on pose,
15:08même si elle est personnelle,
15:09elle est rarement aussi originale qu'on ne le croit.
15:11Peut-être que quand je me suis photographié avec mon téléphone,
15:14je n'avais pas mes lunettes,
15:15et pourtant, il va me reconnaître alors que j'ai mes lunettes.
15:17Ça, ça vient tout simplement du fait que, certes,
15:19il n'a pas de photos de moi avec et sans de lunettes,
15:21par contre, des photos de personnages avec et sans leurs lunettes,
15:25ou des photos de personnages divers et variés,
15:27certains qui me ressemblent, l'autre qui ne me ressemble pas,
15:29avec un chapeau, sans chapeau,
15:32regardant bien droit dans la caméra,
15:33ou tournant un petit peu la tête,
15:34ça, il en a beaucoup.
15:36Et que du coup, la question d'imaginer
15:38qu'est-ce que ça va changer par rapport à la référence
15:40qui est la photo que vous avez rentrée dans le téléphone portable,
15:45il a beaucoup de données qui peuvent l'aider à comprendre
15:47ce que ça va changer,
15:48parce que, tout simplement, il a beaucoup de visages
15:49qui ne sont pas le vôtre,
15:50mais dans lequel ce type d'effet est présent.
15:53C'est ça, c'est-à-dire que cette technologie,
15:54elle a été entraînée sur des tonnes de visages,
15:58elle a enregistré des tonnes de caractéristiques,
16:00et donc, elle peut détecter ce qui ne change jamais sur un visage
16:03et les accessoires, par exemple.
16:04Tout à fait, et elle peut aussi être robuste.
16:08Alors, on voit bien que, de temps en temps,
16:10ça ne marche pas.
16:11Voilà, de temps en temps, ça ne marche pas.
16:13Donc, ça veut dire qu'il y a quand même certaines limites,
16:15mais pour que ça soit aussi robuste que possible,
16:17il a été aussi important, par exemple,
16:20d'avoir des photos qui sont mal cadrées,
16:21parce que, de temps en temps, ça peut très bien arriver
16:24que vous ne soyez pas tout à fait en face de l'appareil.
16:27Donc, les déformations typiques
16:29que vont causer le fait de ne pas être tout à fait
16:31en face de l'appareil,
16:32d'être dans une drôle de position,
16:33donc, vous voyez, comme les caméras sont assez grand-angle,
16:37quand il y a une drôle de position,
16:38le visage, il est très déformé.
16:39Donc, toutes ces choses-là,
16:40elles étaient présentes dans les données.
16:41Donc, encore une fois,
16:43l'utilisation, encore une fois,
16:44de grandes quantités données
16:46sur la reconnaissance faciale sur son téléphone,
16:48c'est considéré comme une technique assez fiable.
16:51Une écrasante majorité de cas,
16:52il va donner la bonne réponse.
16:54La reconnaissance d'images,
16:55elle est aussi utilisée en médecine.
16:58C'est le champ d'implication
16:59que je voulais maintenant évoquer avec vous,
17:00rapidement.
17:01Qu'est-ce que l'intelligence artificielle
17:03a apporté à la médecine,
17:05et je pense notamment au secteur de la radiologie ?
17:07Alors ça, ce sont des techniques
17:09qui sont déjà très utilisées.
17:10C'est-à-dire que,
17:12quand vous allez passer un examen médical
17:15avec une forme d'imagerie ou d'une autre,
17:18beaucoup des techniques dont on parle sont utilisées.
17:20Ça peut être utilisé à un niveau très bas,
17:22simplement pour reconstruire l'image,
17:24parce que, bien évidemment,
17:26in fine, on voit quelque chose
17:27qui ressemble à une photo,
17:28mais on sait bien que,
17:29quand on est passé,
17:30qu'on a été faire un IRM,
17:31il n'y a pas quelqu'un
17:32qui a pris une photo
17:33de l'intérieur des organes.
17:34C'est plus compliqué.
17:35Donc là, il peut y avoir
17:36l'utilisation de techniques
17:38proches de celles dont on parle
17:40pour reconstruire
17:42ce qu'on va voir comme étant une image
17:43à partir des données de départ,
17:45mais aussi pour faire des choses sur l'image,
17:47et en particulier pour faire
17:48des mesures automatiques,
17:52par exemple des mesures
17:53qui sont quantitatives.
17:56Mesurer un volume,
17:57mesurer un organe,
18:00quantifier le degré de ressemblance
18:02d'une texture à une texture
18:04qui pourrait être potentiellement dangereuse,
18:06ce n'est pas si facile que ça.
18:07Et donc, du coup,
18:08ça, ça fournit typiquement
18:09un ensemble de sorties
18:12que le médecin voit
18:13en même temps qu'il voit l'image
18:15et qu'ils peuvent l'aider
18:16à prendre la décision.
18:17Actuellement, l'intelligence artificielle,
18:19elle aide à lire, par exemple,
18:22des résultats,
18:24parfois même mieux
18:26que ce que les médecins,
18:27les humains, peuvent le faire
18:28avec une précision étonnante.
18:30Pour autant,
18:31elle ne peut pas deviner des maladies
18:34et poser un traitement,
18:35proposer un traitement, par exemple.
18:37Non, pas vraiment.
18:38C'est-à-dire que ça,
18:39effectivement,
18:41c'est une étape
18:42qui serait très compliquée.
18:43Et encore une fois,
18:44pour mesurer pourquoi
18:45c'est très compliqué,
18:47il faudrait avoir des exemples.
18:49C'est-à-dire qu'au fond,
18:50c'est des techniques
18:50qui sont apprises
18:51à partir d'exemples.
18:52Donc, si la tâche
18:53est celle dont je parlais avant,
18:54c'est-à-dire mesurer des organes,
18:56qu'est-ce qu'il faut ?
18:57Il faut avoir plein d'images
18:58tirées d'imagerie médicale.
19:00Dans les données médicales,
19:01il y a un point qui est compliqué,
19:02c'est que toutes les personnes
19:03sont différentes.
19:04Donc, une image du corps humain,
19:06ça ressemble, bien évidemment,
19:07ça ressemble toujours
19:08un petit peu
19:08d'un individu à un autre,
19:10mais il y a beaucoup
19:10de différences individuelles.
19:12Et il y a aussi des différences
19:13qui sont liées au matériel.
19:15Donc, quand on dit un IRM,
19:16en réalité,
19:17il y a des fournisseurs
19:18de matériel
19:19qui permettent de faire des IRM.
19:20Et selon que vous avez passé
19:22votre IRM
19:22dans un laboratoire
19:24équipé de tel ou tel matériel,
19:25tout ça, c'est un peu différent.
19:27Donc, le système,
19:28à la base, par exemple,
19:29s'il essaye de mesurer
19:30la taille des organes,
19:31il doit avoir été entraîné
19:32à partir d'images
19:34acquises avec beaucoup de personnes,
19:36beaucoup de systèmes d'imagerie,
19:37si on veut qu'ils soient
19:39robustes aux différences
19:40entre les différents
19:41systèmes d'imagerie,
19:42et sur lesquels
19:43on a désigné les organes
19:44et on les a,
19:46par exemple,
19:46un opérateur humain
19:47a dit, voilà,
19:48ça c'est le foie
19:49et voilà les limites du foie.
19:51Si on voulait répondre
19:52à la question que vous me posez,
19:53c'est-à-dire,
19:53voilà les éléments,
19:54quel est le diagnostic ?
19:55Il faudrait qu'on ait appris
19:57à partir de beaucoup
19:58d'éléments similaires
20:00qui seraient,
20:01voilà,
20:01quel était l'élément,
20:02voilà,
20:03quel était le diagnostic.
20:04Donc, je ne dis pas
20:04que c'est impossible,
20:05je ne dis pas
20:05que ça ne peut pas se produire
20:07dans un futur très lointain,
20:09mais je dis que pour l'instant,
20:10on en est véritablement
20:12extrêmement loin.
20:13Oui, donc ça demanderait
20:14beaucoup de données,
20:16un entraînement intensif,
20:17un peu comme tous
20:18les systèmes d'IA
20:19avant qu'ils ne deviennent
20:20performants.
20:21Le dernier cas pratique
20:23que je voulais aborder
20:24avec vous,
20:25c'est celui de l'IA
20:26qu'on appelle générative.
20:27En clair,
20:28ce sont les systèmes
20:29utilisés pour créer
20:30des médias
20:31ou des contenus artistiques,
20:32des images,
20:33des musiques,
20:34des vidéos
20:34à partir d'une consigne.
20:36Par exemple,
20:37on dit à la machine,
20:38est-ce que tu peux,
20:39à partir de cette photo de moi,
20:40me faire apparaître
20:41dans un tableau
20:42comme si j'avais été peint
20:44par un artiste de renom ?
20:45Là encore,
20:47est-ce que vous pouvez
20:47nous expliquer,
20:48grosso modo,
20:49comment ça fonctionne ?
20:50Il y a des choses
20:50qui sont un peu spécifiques
20:51à ce type d'utilisation
20:52qui seraient par exemple
20:54quelque chose
20:54qui est assez simple
20:55qui correspond à cette idée
20:57qu'on pourrait appeler
20:58transfert de style.
21:00C'est-à-dire,
21:01j'ai une image,
21:01par exemple,
21:02qui représente un portrait
21:04de quelqu'un
21:04que j'ai pris moi-même
21:05avec mon téléphone
21:07et pour des raisons récréatives
21:09pour n'importe quel but,
21:10j'ai envie de la faire
21:10ressembler à autre chose,
21:11par exemple,
21:12un tableau à une peinture
21:14comme on voit
21:14dans certains musées
21:16ou des impressionnistes.
21:18Donc,
21:18j'ai cette image
21:18et je voudrais
21:19qu'elle ressemble
21:19à un tableau peint
21:20par un impressionniste.
21:22Ça,
21:22typiquement,
21:23pour le faire,
21:23toujours pareil,
21:24il faut des images
21:25qui ressemblent
21:26à des images
21:26de départ,
21:28donc des images typiques
21:29qui sont les images
21:30qu'on prend dans la vie
21:31de tous les jours
21:31avec son téléphone,
21:33des images
21:34de tableau impressionniste.
21:36Le type de choses
21:37qui vont aider,
21:38c'est toujours pareil,
21:39c'est quand on va
21:39prendre une image,
21:40en fait,
21:40on ne va pas se focaliser
21:43sur tous les détails
21:44de la même façon
21:45et on peut imaginer
21:46que quand on prend
21:46une image
21:47dans laquelle il y a un personnage,
21:48surtout le personnage
21:48qui est important.
21:49Donc,
21:49ça veut dire que peut-être
21:50les tableaux,
21:51parce que dans certains tableaux,
21:52ce n'est pas si clair que ça,
21:53il va falloir aussi
21:55les étiqueter
21:56en disant,
21:56voilà,
21:57là,
21:57c'est un personnage,
21:58ça,
21:58c'est un fond,
21:59ça,
21:59c'est la nature,
22:00etc.
22:00et peut-être
22:01les images de départ
22:03aussi les étiqueter
22:04comme ça.
22:06Et après,
22:07on va essayer
22:08de chercher
22:09dans ces modèles
22:10quels sont les aspects
22:11qui sont le plus responsables
22:13de la production
22:14de certains aspects
22:15de l'image,
22:15par exemple,
22:16on peut imaginer
22:17que pour avoir donné
22:19l'impression
22:19que votre image
22:20est un tableau impressionniste,
22:21ce qui compte beaucoup,
22:22c'est les couleurs,
22:22par exemple,
22:23parce que la principale différence
22:24entre une image prise
22:25avec votre smartphone
22:26qui représente la vie
22:27de tous les jours
22:28et un tableau impressionniste,
22:29c'est essentiellement,
22:31déjà,
22:31un registre de couleurs
22:32qui est très différent.
22:34Et du coup,
22:34on va essayer
22:34d'apprendre,
22:36encore une fois,
22:37toujours pareil,
22:38un modèle
22:39qui va associer
22:40le registre de couleurs
22:41qu'on trouve le plus souvent
22:42dans les images
22:42de la vie courante
22:43avec le registre de couleurs
22:45qui est celui
22:45qu'on trouve
22:46dans les images
22:47qui sont,
22:48par exemple,
22:48tableaux impressionnistes
22:49si le but
22:49c'est tableaux impressionnistes.
22:50Est-ce qu'on peut dire
22:52que ces systèmes d'IA
22:54qui génèrent de la musique,
22:55des images,
22:57des textes,
22:57des poèmes,
22:58même parfois,
22:59sont des artistes ?
23:01Non,
23:02alors ça,
23:02on en parle dans le livre,
23:03je ne pense pas
23:04et je pense que surtout,
23:06il prospère
23:07sur quelque chose
23:08qui est très problématique.
23:09Donc,
23:10par exemple,
23:10il y a quelques temps,
23:11il y a eu
23:11une de ces applications
23:12où on se prend,
23:13enfin,
23:14une de ces utilisations,
23:15on va dire,
23:16qui est devenue populaire,
23:17c'est je me prends en photo
23:18avec mon téléphone
23:19ou je prends mes amis
23:20en photo avec le téléphone
23:21et j'essaye de transformer ça
23:23en images qui pourraient avoir été captées
23:26ou provenir des films du studio Ghibi,
23:30le studio de Miyazaki,
23:32parce que c'est des films très populaires.
23:34Donc,
23:34ça veut dire que le système,
23:37forcément,
23:38il a entrainé à partir de données
23:40qui, en fait,
23:40sont des données protégées
23:42par des droits d'auteur.
23:43Ça n'empêche que
23:44il y a effectivement
23:45un flou actuel
23:48qui est que,
23:48bien que le film de Miyazaki,
23:51par exemple,
23:52soit protégé par un droit d'auteur,
23:53on sait très bien
23:54qu'il y a des morceaux de cette oeuvre
23:55qui traînent partout,
23:57notamment,
23:57on en trouve plein d'extraits
23:59sur YouTube,
24:00des extraits très courts
24:01qui durent quelques minutes
24:01et donc,
24:02ça veut dire que tous ces extraits,
24:03ils ont pu être utilisés
24:05pour entraîner le système
24:07et donc,
24:08in fine,
24:08vous voyez que pour répondre
24:09à la question de savoir
24:10si tout ça,
24:10ça produit de l'art,
24:12si on était,
24:13on se plaçait un petit peu plus
24:15du côté des personnes
24:16qui ont fourni,
24:18on va dire,
24:18les données de départ,
24:19ben eux,
24:20ils vous diraient,
24:21ben non,
24:21ça c'est pas de l'art,
24:22ça s'appelle du plagiat,
24:23ça veut dire qu'on a essentiellement
24:24entraîné des systèmes
24:25à essayer de reproduire
24:27des caractéristiques
24:28d'oeuvre-existence
24:30sans s'être vraiment prévalu
24:34du consentement des auteurs
24:36et donc,
24:37c'est vrai que
24:38si c'est pour montrer
24:39à ses amis,
24:40c'est normal,
24:40c'est un usage qui est prévu,
24:42par contre,
24:43l'utiliser
24:43à des fins commerciales
24:45ou même
24:46la publier
24:47sur des réseaux sociaux
24:49par exemple
24:50pour la diffuser,
24:51ça,
24:53chacun doit un petit peu
24:54se poser des questions
24:55avant de faire ça
24:56et de se dire,
24:56voilà,
24:56est-ce que c'est une bonne idée,
24:57est-ce qu'en faisant ça,
24:58j'ai une utilisation
24:59tout à fait responsable
25:00des outils ?
25:01Dans le livre,
25:02vous dites qu'il est peu probable
25:03que ces systèmes
25:06soient à l'origine,
25:07enfin,
25:07créent un courant artistique
25:09en fait,
25:09parce qu'ils font
25:10par rapport à l'existant.
25:12Disons que,
25:12voilà,
25:13là,
25:13on arrive dans les points
25:14un petit peu
25:15qui sont les angles morts
25:16de ce type de technique.
25:17Ce type de technique,
25:18elles sont quand même
25:20entraînées à partir
25:21de données existantes.
25:22Si vous demandez
25:23au système
25:24d'être créatif,
25:25par exemple,
25:26voilà,
25:26vous lui posez
25:26un vrai problème.
25:27Qu'est-ce que ça veut dire
25:28être créatif ?
25:29Donc, par exemple,
25:30s'il y a un système
25:30qui produit des textes,
25:31il lui demandait
25:31d'être créatif,
25:33les éléments
25:33qu'il peut utiliser,
25:34c'est tous les textes
25:36qui parlent
25:36de la créativité
25:38qu'il a vus,
25:39ou le terme créatif,
25:40créativité,
25:41parce que pour ces systèmes-là,
25:42c'est très facile
25:42de reconnaître
25:43que créatif,
25:44créativité,
25:44tous ces mots-là
25:46appartiennent
25:46à un même registre.
25:48Donc,
25:48il va utiliser
25:49tous ces textes,
25:49mais là,
25:50raté,
25:51parce que finalement,
25:51un texte
25:52où on parle
25:53de créatif
25:54ou de créativité,
25:55c'est pas forcément
25:55un texte
25:56qui en lui-même
25:56est très créatif.
25:58Olivier Capet,
25:59dans tous les grands cas
26:00que nous venons d'évoquer,
26:01ces systèmes ont besoin
26:02donc de données massives,
26:04de beaucoup d'entraînements,
26:05ça on l'a vu,
26:06mais aussi de ressources.
26:08On n'aura pas le temps
26:09d'aborder cette question
26:10dans ce podcast,
26:11mais vous y consacrez
26:12un chapitre
26:12dans votre livre.
26:14L'IA demande
26:15beaucoup d'électricité
26:16pour faire fonctionner,
26:18mais aussi refroidir
26:19les appareils
26:20en surchauffe
26:21à force de faire
26:22des milliards de calculs.
26:23Et donc,
26:24l'impact environnemental
26:26de ce secteur
26:26n'est pas neutre,
26:27il me semblait
26:28important de l'évoquer.
26:29Il me reste une question
26:31à vous poser
26:32et celle-ci,
26:32elle concerne
26:33l'avenir de l'IA.
26:34Est-ce qu'un jour,
26:35au vu de la vitesse
26:36à laquelle ces machines
26:37peuvent apprendre,
26:39les systèmes
26:39d'intelligence artificielle
26:41seront capables
26:42de comprendre,
26:43de réaliser
26:43n'importe quelle tâche
26:44intellectuelle
26:45qu'un humain pourrait faire ?
26:46Je pense que la réponse
26:48honnête est
26:48je ne sais pas.
26:50Il faut bien avoir confiance
26:51que tous les utilisateurs
26:52de ce type de système
26:53chaque jour,
26:54il faut nice
26:54des données d'entraînement
26:55parce que par exemple,
26:56à côté des réponses,
26:58vous avez des petits drapeaux
26:59j'aime, j'aime pas.
27:00Et donc,
27:01si l'utilisateur a dit
27:02j'aime,
27:02ça veut dire ça,
27:03c'est une bonne réponse.
27:04Il faut essayer
27:04d'encourager le système
27:05à avoir ce type de réponse.
27:06S'il a dit
27:06qu'il n'est pas content
27:07ou si dans son interaction,
27:08il dit mais non,
27:09on ne sait pas du tout
27:10ce que je veux,
27:11tu t'es trompé,
27:12ça veut dire que la réponse
27:13était mauvaise.
27:13Donc, bien évidemment,
27:16réentraîner sur ces problèmes-là,
27:17essayer de développer
27:18des nouvelles techniques
27:18pour améliorer
27:19sur ce type de données-là,
27:21ça améliore globalement
27:22les systèmes.
27:22Mais ça les améliore
27:23dans des directions particulières.
27:25Est-ce qu'on peut
27:26en déduire et penser
27:27qu'être amélioré
27:28dans des directions particulières,
27:30par exemple,
27:30savoir mieux faire les calculs
27:31si initialement,
27:32on ne savait pas bien les faire,
27:33est-ce que ça va améliorer
27:35dans toutes les directions ?
27:36La réponse, là,
27:38par contre,
27:38est un énorme point d'interrogation.
27:40Donc, l'intelligence surhumaine
27:42d'un ordinateur,
27:43ça, c'est pas possible.
27:44Ça, a priori,
27:45on n'y est pas.
27:46Pour moi,
27:46cette question-là,
27:47c'est un petit peu
27:47comme si vous me demandiez
27:48de comparer un avion
27:50à un oiseau
27:51et que vous aviez envie
27:52de me faire dire
27:53qu'un avion,
27:54c'est mieux qu'un oiseau.
27:55Certes, un avion,
27:56c'est mieux qu'un oiseau
27:56par certains aspects.
27:57Ça peut transporter
27:58300 personnes
27:59ou 600 peut-être,
28:00même pour les plus gros.
28:01Mais en même temps,
28:02c'est pas la même chose.
28:03Et donc, même si ça produit
28:04des effets qui peuvent
28:05se ressembler,
28:06ça vole dans le ciel,
28:07ça vole pas du tout
28:08de la même façon.
28:09Quand on regarde des oiseaux,
28:10on peut avoir des idées
28:11pour améliorer les avions.
28:13La comparaison est intéressante.
28:15Mais la question de savoir
28:16si à la fin,
28:18l'avion fait mieux
28:19que l'oiseau,
28:19en fait,
28:20elle n'a pas de réponse
28:21parce qu'en réalité,
28:22l'oiseau,
28:23c'est une créature qui existe.
28:24Elle ne va pas s'arrêter
28:25d'exister.
28:26Et l'avion,
28:27il fait mieux par certains aspects,
28:28il fait moins bien par d'autres.
28:29Si on parle de consommation énergétique,
28:31l'avion,
28:32il fait moins bien que l'oiseau
28:33parce que l'oiseau,
28:33il n'a pas besoin de carburant.
28:35C'est un peu la raison
28:36pour laquelle
28:36je n'ai pas envie
28:37de répondre à cette question.
28:38C'est peut-être
28:39que, in fine,
28:41les systèmes répondront
28:43de façon bien meilleure
28:44que la moyenne des individus humains
28:47a des questions.
28:49Mais, après,
28:50à quel prix ?
28:50C'est-à-dire,
28:51il va falloir dépenser
28:52combien d'énergie
28:53pour que ça soit le cas ?
28:54Est-ce que ça sera un bienfait
28:56pour les gens ?
28:56Est-ce que les gens
28:57considéreront que
28:58tout ça,
28:58ça apporte des choses
28:59qui sont intéressantes,
29:00qui améliorent la vie
29:01ou qui améliorent
29:02tout un tas d'aspects
29:03qui sont importants ?
29:04Ou est-ce qu'au contraire,
29:05ils se diront
29:05voilà, ça ne va pas du tout,
29:07ça nous a privé
29:08du plaisir
29:08de faire certaines choses ?
29:09Donc, c'est pour ça
29:10que je ne suis pas du tout
29:12choqué par l'idée
29:14capable de faire
29:15avec ce qu'on obtient
29:16avec une machine.
29:17Mais, par contre,
29:18déclarer que c'est mieux,
29:20pour moi,
29:20c'est un peu une erreur.
29:23Merci Olivier Capet
29:24et je conseille
29:25la lecture de votre livre
29:26pour en apprendre davantage.
29:28Je rappelle son titre
29:29« Tout comprendre
29:30ou presque
29:31sur l'intelligence artificielle »
29:33publié aux éditions
29:34du CNRS.
29:35Merci beaucoup.
29:36Vous pouvez soutenir
29:37Codesource,
29:38le podcast d'actualité
29:39du Parisien
29:40en laissant des pouces en l'air
29:41et des commentaires
29:42sur YouTube,
29:43des petites étoiles
29:44sur votre plateforme
29:45d'écoute préférée.
29:46C'est ce qui nous aide
29:46à remonter dans les classements
29:48et ne ratez pas non plus
29:49Crime Story,
29:50notre podcast fait divers
29:52avec une nouvelle affaire criminelle
29:54à retrouver chaque samedi.
29:56Merci à tous.
29:57Merci à tous.
Commentaires

Recommandations