Passer au playerPasser au contenu principal
  • il y a 5 mois
Ce jeudi 11 septembre, la reproduction de notre voix le plus fidèlement possible par l'IA a été abordée par Anthony Morel, dans Culture IA, dans l'émission Good Morning Business sur BFM Business. Retrouvez l'émission du lundi au vendredi et réécoutez la en podcast.

Catégorie

📺
TV
Transcription
00:00Good Morning Business, Culture IA
00:02Anthony Morel, vous êtes en plateau avec nous, mais vous auriez pu rester chez vous
00:07puisque vous avez créé un clone virtuel de vous-même.
00:10Oui, c'est ça. Enfin, de ma voix, en tout cas, j'ai créé un clone vocal
00:13que je vais vous faire écouter et puis on va voir ce que vous en pensez.
00:18Salut, c'est le clone vocal d'Anthony Morel qui vous parle.
00:21Une intelligence artificielle a reproduit ma voix le plus fidèlement possible.
00:25Franchement, vous trouvez ça comment ?
00:27Alors, vous trouvez ça comment ?
00:28Ah non, vous parlez plus vite et de manière robotique.
00:31Alors, c'est ça. Moi, il y a un petit côté robotique.
00:32C'est dur de juger sa propre voix, donc j'ai du mal à...
00:34Je l'ai fait écouter à quelques personnes.
00:36On retrouve quand même le timbre et l'intonation.
00:38C'est clair.
00:38Mais je suis d'accord que sur le rendu, il y a un côté un peu trop robotique,
00:42un peu trop propre, entre guillemets, pour que ce soit réaliste.
00:46Donc, ça veut dire qu'il y a encore des progrès à faire.
00:48Je trouve que le résultat est quand même vraiment pas mal,
00:50sachant que pour obtenir ça, il a fallu seulement 10 secondes de ma voix.
00:54C'est-à-dire qu'avec un échantillon vocal extrêmement court...
00:55Vous n'avez pas registré toute la phrase ?
00:57Non, c'est ça. En fait, le truc, c'est que j'ai juste donné...
00:59Alors là, c'est une entreprise française qui a eu la gentillesse de me proposer ça,
01:02qui s'appelle silence-silence.ai.
01:04Mais si vous voulez tester à la maison, il y a des outils grand public
01:06comme Agen, Eleven Labs, qui fonctionnent bien, Chatterbox également.
01:10Donc, le principe, c'est que vous donnez un petit échantillon de votre voix.
01:14Alors, plus il est long, normalement, plus la qualité du rendu sera bonne à la fin.
01:19Et donc, en fait, l'IA va disséquer votre voix et ensuite va la recomposer.
01:22Et là, ce qui se passe, c'est qu'il suffit que je tape du texte au clavier
01:25et je vais avoir ma voix qui prononce le texte à la volée.
01:29C'est-à-dire que la génération de sons se fait de manière instantanée.
01:32C'est ce qui explique aussi que ce ne soit pas complètement parfait.
01:35Alors, c'est vrai, c'est encore un petit peu robotique.
01:37L'IA aussi un petit peu de mal quand vous lui demandez, par exemple,
01:40d'être ironique, sarcastique.
01:42Enfin, pour tout ce qui est sentiments, c'est un peu compliqué.
01:45Mais globalement, le résultat ne cesse de s'améliorer.
01:47Et encore une fois, c'est à partir de tout petits échantillons
01:49qu'on est capable de générer comme ça des voix virtuelles.
01:51Mais les débouchés, c'est médical typiquement
01:54ou vous comptez vraiment arrêter de venir bosser ?
01:56Non, alors peut-être pas tout de suite, mais oui, médical.
01:59Alors, il y a plein de débouchés en réalité.
02:00Médical, oui, c'est-à-dire que le premier débouché,
02:02ça va être de rendre leur voix à ceux qui l'ont perdue.
02:04Il y a plein de gens qui reçoivent la phonie,
02:07soit des maladies neurodégénératives qui font qu'on va perdre sa voix.
02:10Et quand on perd sa voix, on perd aussi une partie de son identité.
02:12Et bien là, vous allez pouvoir, à partir d'un simple extrait sonore,
02:15reproduire la voix.
02:16Et la personne, en tapant au clavier, en fait, on va l'entendre.
02:18Sachant que l'idée de cette start-up, c'est à terme de pouvoir intégrer ça
02:22dans des casques, voire dans des implants neuronaux à très long terme,
02:25et des casques qui vont analyser les signaux électriques envoyés par le cerveau.
02:28Et en fait, en pensant à une phrase, on pourrait la prononcer à voix haute.
02:31Donc, ça va quand même très, très loin.
02:32Mais après, ça va être aussi, je ne sais pas, moi, faire lire un livre audio
02:36avec la voix des parents pour ses enfants ou avec la voix de son acteur préféré,
02:40un prof qui va pouvoir doubler ses cours en anglais avec sa propre voix.
02:44Je vais discuter avec un interlocuteur en japonais
02:46et je vais avoir la traduction avec sa voix en français.
02:50Enfin, il y a énormément, énormément de débouchés potentiels.
02:52Dans les jeux vidéo aussi, où je vais pouvoir créer un personnage à mon image
02:55avec ma voix et c'est lui qui sera dans le jeu vidéo.
02:58Donc, en termes d'immersion, ça va renforcer les choses.
03:00Donc, il y a plein d'industries qui vont pouvoir, en fait,
03:02s'emparer de ces technologies de clones vocaux.
03:04Mais par contre, je me demande si vos parents, ils ont fait la différence.
03:07Alors, c'était vous ou pas vous ?
03:08Je ne l'ai pas fait tester à mes parents.
03:09Je pense qu'ils auraient entendu la différence quand même.
03:12Mais maintenant…
03:13Ça ouvre la voix quand même à un certain nombre d'usurpations.
03:15Il y a eu des cas.
03:16Il y a déjà eu des cyber arnaques, des cyber escroqueries
03:19où des grands-parents se sont fait avoir en pensant entendre la voix
03:23de leur petit-fils qui leur demande un virement bancaire.
03:25Parce qu'en général, c'est comme ça que ça se passe, évidemment.
03:27Il y a aussi les fameuses arnaques au président dans les entreprises
03:29où vous avez l'impression d'être en train de discuter avec votre manager
03:32ou votre directeur financier.
03:34On vous demande de réaliser un virement bancaire
03:36parce qu'on vient de signer un énorme contrat.
03:38Sauf qu'en réalité, il n'y a personne de l'autre côté.
03:40Et c'est une arnaque.
03:40C'est juste un clone vocal de votre directeur financier.
03:43Donc voilà, il va falloir prendre en compte cette nouvelle donne.
03:45Le fait que la frontière entre le vrai et le faux
03:47devient de plus en plus floue,
03:49même si ce n'est pas encore complètement parfait.
Commentaires

Recommandations