Passer au playerPasser au contenu principal
Pour en savoir plus sur la façon de faire tourner de l'IA en local, sur votre propre PC c’est par ici https://www.nvidia.com/fr-fr/ai-on-rtx/
Vidéo sponsorisée par Nvidia. Merci à Nvidia de soutenir la chaîne Youtube de Numerama

Générer des images par IA directement sur votre PC, sans passer par un service ou un serveur, c’est possible, c’est gratuit et c’est facile ! A l’aide de ComfyUI vous pouvez générer en quelques minutes des images réalistes ou retoucher des images simplement en rentrant des prompts. Prérequis hardware, installation, configuration et explication du fonctionnement de l’interface, on vous explique tout !

Découvrez la gamme de PC RTX IA en RTX Série 50 by Materiel.net : https://www.materiel.net/n6450/nvidia-rtx-ia/?a_aid=5e2af2cae1466&data1=2025-pcai-nvidia-defendintelligence&utm_source=multi&utm_medium=pt&utm_campaign=2025-pcai-nvidia-defendintelligence

Avec les PC Materiel.net, l'IA devient votre nouvel assistant. Entrez dans une nouvelle ère de productivité avec les solutions d'IA basées sur les technologies de NVIDIA

⏰ Sommaire
00:00 - Générer des images en local, c’est possible !
00:46 - C’est quoi Comfy UI ?
01:25 - Quelle config pour générer des images ?
02:13 - Installation et configuration de Comfy UI
03:06 - Comprendre l’interface de Comfy UI
05:32 - On génère notre première image
06:13 - Que fait la carte graphique dans tout ça ?
07:48 - On teste différents prompts
09:07 - Derniers conseils pratiques

📝 L'article par ici ► https://www.numerama.com/tech/2176519-comfyui-comment-generer-facilement-des-images-ou-des-videos-avec-une-carte-graphique-nvidia-rtx.html

---

🔔 Abonnez-vous à notre chaîne ► https://youtube.com/c/numerama

🚩 Retrouvez toutes nos playlists ► https://www.youtube.com/c/numerama/playlists

---

Rejoignez-nous :
💻 Notre site ► http://www.numerama.com/
🐦 X ► https://x.com/numerama
📸 Instagram ► https://www.instagram.com/numerama
📱TikTok ► https://www.tiktok.com/@numerama
🔷 Facebook ► https://www.facebook.com/Numerama/
🎙️ Twitch ► https://www.twitch.tv/numerama

🟡 + rapide, + pratique, + exclusif : découvrir numerama+ ► https://www.numerama.com/numeramaplus/
---

Réalisation : Naël Fontaine
Montage : Alfred Tertrais
Avec : Théotim Raguet

---
#Materielnet #NVIDIA #RTXAI

Catégorie

🤖
Technologie
Transcription
00:00Depuis quelques années, la génération d'images par IA s'est développée avec des services comme Dali ou Midjourney
00:04ou encore les IA grands publics accessibles depuis un navigateur comme ChatGPT ou Gemini 3 avec Nano Banana.
00:09Et ces outils ont tous un point commun, tout se passe dans le cloud.
00:12Tes idées, tes visuels, tes promptes, ils partent tous sur des serveurs externes.
00:16Et on va pas se mentir, c'est pas idéal si tu cherches du contrôle, de la confidentialité ou simplement
00:20une plus grande liberté créative.
00:21Et si tu pouvais garder tout ton travail en local sur ta machine à condition d'avoir une bonne carte
00:26graphique ?
00:26C'est possible et tu vas voir que ça va changer beaucoup de choses.
00:29Grâce à ConfiUI et Flux 2, combinés à une carte graphique Nvidia GeForce RTX de dernière génération,
00:34tu peux générer des images impressionnantes, réalistes, sur ton propre PC.
00:38Et ça sans abonnement, sans cloud et sans contrainte externe.
00:40D'ailleurs, on remercie Nvidia, en t'épargne les présentations je pense que tu les connais,
00:44d'être partenaire de cette vidéo et de nous permettre de faire ce format.
00:47Si tu connais déjà ConfiUI, tu peux avancer un petit peu plus loin dans la vidéo.
00:50Mais si c'est la première fois que t'en entend parler, je t'explique tout.
00:53ConfiUI, c'est littéralement une usine qui sert à générer des images et des vidéos par IA
00:57avec une interface un petit peu particulière.
00:59Surtout, c'est un logiciel totalement open source.
01:02Ce qu'il faut retenir, c'est qu'elle ne ressemble pas du tout à l'interface habituelle prompt image
01:06qu'on retrouve sur les IA sur les navigateurs.
01:09L'interface de ConfiUI, elle fonctionne en node.
01:11Ce sont des blocs visuels que tu vas assembler comme un circuit.
01:13Et chaque bloc a une fonction, donc le texte, l'aléatoire, l'encodage, le rendu.
01:17Et en fait, tu as la main sur tout le processus de ce que va générer l'IA,
01:21étape par étape, directement devant toi.
01:22Et vraiment, tu gardes le contrôle car c'est toi qui gère tout.
01:25Ce qu'il faut savoir, c'est que ConfiUI, c'est juste une interface, rien de plus.
01:29Pour qu'elle génère des images, elle a besoin d'un modèle.
01:31Et justement, je te parlais de Flux 2 tout à l'heure, et bien c'est ça le modèle.
01:34Il a été entraîné sur d'immenses quantités d'images
01:36et à partir de ses bases de données et de son apprentissage,
01:39il est capable de créer des images à partir d'un simple texte.
01:42La version de Flux 2 qu'on va utiliser pour ce tuto,
01:44elle est optimisée pour fonctionner sur une bonne carte graphique Nvidia RTX de dernière génération.
01:49Pour générer des images, il y a besoin de puissance de calcul et de VRAM,
01:53la mémoire de ta carte graphique.
01:54C'est elle qui stocke et aligne tous les calculs en parallèle
01:57et traite des milliers d'opérations en même temps pour générer une image propre.
01:59Je te recommande d'avoir au moins 12Go de VRAM sur ta carte graphique
02:02pour générer des images avec ConfiUI.
02:04Ici, nous, on est plutôt bien puisqu'on a une grosse carte graphique,
02:08GeForce RTX 5080 avec 16Go de VRAM.
02:12Autant dire qu'on est confort.
02:13ConfiUI, ça existe depuis un moment,
02:14mais pendant longtemps, c'était un truc de Power User.
02:16Il fallait installer Python, Git, tout configurer à la main,
02:20passer par l'invite de commande Windows pour configurer certains accès.
02:23Bref, c'était pas hyper accessible.
02:24Aujourd'hui, c'est plus simple.
02:26ConfiUI propose sur son site un fichier exécutable.
02:28Tu le télécharges, tu l'ouvres et il va t'installer tout ce qu'il faut en arrière-plan.
02:31La première chose à faire quand ConfiUI est lancée,
02:33va dans tes paramètres et remets l'interface en anglais.
02:35La langue française n'est en fait qu'une mauvaise traduction automatique de l'anglais.
02:38Une fois que c'est fait, tu arrives dans l'interface.
02:40C'est à ce moment-là qu'on va télécharger et installer un modèle.
02:42Dans ConfiUI, tu as accès à une grande bibliothèque de modèles.
02:44Certains sont gratuits et open source, comme notre flux de dev,
02:47d'autres payants, et certains sont spécialisés dans un certain type
02:50de génération d'images, de vidéos ou d'intégration d'objets par IA.
02:53Pour notre flux de, c'est facile, on le sélectionne dans la liste,
02:56on lance le téléchargement, attention parce que c'est plusieurs dizaines de gigaoctets,
02:59et une fois que c'est terminé, notre modèle apparaît comme disponible dans notre interface.
03:03Voilà, ConfiUI est installé, Flux2 est prêt.
03:05Maintenant, je vais t'expliquer comment ça marche.
03:07Par défaut, ConfiUI lance une interface préconstruite pour apprendre son fonctionnement,
03:11et tu vois le machin, c'est le bordel, il y a des blocs partout et des liens qui les
03:15relient dans tous les sens,
03:16bref, je vais pas rentrer dans les détails, mais en fait, tout est très logique ici.
03:19Tu te souviens quand je disais que ConfiUI était une usine ?
03:21Eh bien, c'est exactement ça.
03:23Déjà, dans notre exemple, tout est organisé en étapes.
03:25La première, c'est le modèle, et le plus important.
03:27C'est lui qui interprète les commandes, que l'on entre,
03:29puis dessine en fonction de son apprentissage et de sa base de données.
03:32Dans le Diffusion Model, on va charger le cerveau principal de l'IA,
03:35ici Flux2DevFP8, c'est lui qui sait comment dessiner.
03:39Le FP8 indique une version optimisée pour économiser de la mémoire vidéo de la carte graphique Nvidia.
03:44À côté, on a un traducteur, il cherche le modèle de langage,
03:47ici basé sur Mistral3Small,
03:49qui va comprendre votre texte et le transformer en concept mathématique pour l'IA.
03:53Et enfin, LoadVAE, le Décodeur.
03:55Ce bloc sert à traduire le résultat final en pixels visibles, JPEG ou PNG.
03:59Alors, ça a l'air compliqué comme ça,
04:00mais en fait, ici, c'est ConfiUI qui a tout téléchargé, installé et préconfiguré lui-même.
04:05Moi, j'ai rien touché, j'ai juste demandé à utiliser Flux2Dev.
04:07Une fois qu'on a chargé le cerveau, la deuxième étape, c'est d'entrer ce que l'on veut.
04:11L'étape 2, c'est le champ de prompt.
04:12Le mieux, ici, c'est d'écrire son prompt en anglais.
04:15Avec Mistral installé dans notre configuration de base,
04:17on peut même entrer du code JSON.
04:19Le champ FluxGuidance, juste en dessous, là, c'est un réglage spécifique à Flux.
04:22Il contrôle à quel point l'IA doit écouter le prompt.
04:24Plus la valeur est haute, plus il interprétera le prompt strictement.
04:27Plus il est bas, plus il prendra de liberté.
04:29On le laisse à 4, mais on vous conseille de jouer avec pour avoir des images plus créatives.
04:32La troisième étape est optionnelle.
04:34Elle permet d'ajouter des images de référence sur laquelle se baser.
04:36Si on cherche des images dans ces boxes,
04:38il faut demander spécifiquement dans le prompt de s'y référer.
04:40Le modèle va ensuite utiliser toute ou partie de la structure de l'image
04:43pour en générer une nouvelle.
04:44On n'est pas obligé de l'utiliser.
04:46Si je fais CTRL-B, je coupe le lien vers ce bloc
04:48et ConfiUI ne le prendra pas en compte lors de la génération de l'image.
04:51Une fois qu'on a mis un cerveau, qu'on a entré une commande
04:54et qu'on y a mis des images de référence,
04:55il ne reste plus qu'à configurer la taille de notre image.
04:58Et la dernière étape est le Custom Sampler,
05:00là où tous les calculs sont effectués.
05:01Il y a beaucoup de paramètres ici, mais on va se concentrer sur les deux plus importants.
05:05Random Noise qui génère une seed,
05:06ou graine de hasard en bon français.
05:09C'est ce qui rend chaque génération d'images unique.
05:12Changez-la avec des chiffres hasard
05:13et vous aurez une image légèrement différente à chaque fois.
05:15En revanche, gardez-la si l'image vous plaît
05:17et que vous voulez modifier seulement certains paramètres.
05:19Clux de Scheduler qui s'occupe quant à lui
05:21de gérer les étapes de construction de l'image.
05:23Il indique 20 étapes,
05:24ce qui signifie que l'IA va affiner l'image 20 fois
05:26avant de donner le résultat final.
05:27Plus vous mettez d'étapes,
05:28plus votre image va mettre de temps à se générer,
05:30mais elle sera plus aboutie.
05:31Voilà, c'était long,
05:32mais vous le voyez, c'est plutôt logique.
05:34Bon, et maintenant, on est prêt,
05:35on va pouvoir générer nos images.
05:37Bon, on va commencer simplement.
05:38Je vais copier-coller un prompt test
05:39que j'ai trouvé chez les développeurs de Flux 2.
05:41Ici, on a trouvé un tigre mouillé sous une feuille de bananier.
05:43Pour ça, je rentre un prompt très simple.
05:45Et puis, j'appuie sur Run.
05:47La génération d'images en 20 étapes
05:48demande en moyenne entre 2 et 3 minutes.
05:50Pendant ce temps, vous le voyez bien
05:51sur le gestionnaire des tâches Windows,
05:52la carte graphique carbure.
05:53Mais concrètement, qu'est-ce qu'elle fabrique ?
05:55Elle ne dessine pas pixel par pixel comme un peintre.
05:58En réalité, elle joue au sculpteur,
05:59mais avec des mathématiques.
06:00Pour ConfiUI, votre image de départ,
06:02c'est du bruit pur.
06:03Imaginez la neige sur une vieille télé cathodique.
06:05L'IA, notre modèle Flux 2,
06:06a appris à repérer des formes dans ce brouillard.
06:08À chaque étape, on en a demandé 20 ici,
06:10elle va retirer un peu de bruit
06:11pour faire apparaître le tigre couche par couche.
06:13Et c'est là que la magie de Nvidia opère.
06:15Pour faire ça, le PC ne doit pas résoudre
06:17une seule équation complexe,
06:18mais des milliards de petites opérations simultanées.
06:20C'est la différence fondamentale
06:22entre un processeur simple
06:23et une carte graphique.
06:24Le processeur, c'est un génie des maths,
06:25mais il travaille seul.
06:26Il résout les problèmes les uns à la suite des autres.
06:29La carte graphique RTX, elle,
06:30c'est une armée de mathématiciens.
06:32Elle possède des milliers de cœurs,
06:33les fameux cœurs CUDA,
06:34qui travaillent tous en même temps.
06:36Ici, grâce à la VRAM de la carte graphique
06:37et à sa puissance brute,
06:39on transforme du bruit numérique en photoréaliste
06:40directement depuis chez soi.
06:42En fait, Nvidia ne se contente pas seulement
06:43de faire des cartes puissantes,
06:44mais fait aussi en sorte que ces cartes
06:46soient plus efficaces d'un point de vue logiciel.
06:47Et l'un des concepts clés là-dedans,
06:49c'est la quantisation.
06:53Jusqu'à présent, pour faire fonctionner une IAA,
06:55les cartes graphiques utilisaient
06:56des formats de données très larges.
06:58Un peu comme si elles utilisaient
06:59un camion de déménagement
07:00pour transporter un tabouret.
07:02Ok, ça rentre,
07:03mais il reste quand même
07:03beaucoup de place à l'arrière.
07:04Avec les GeForce RTX
07:05et leur nouveau cœur Tensor,
07:07on passe à l'ère du format de données FP4.
07:09L'idée n'est pas de calculer moins bien,
07:11mais de calculer plus efficacement.
07:12Le format FP4 permet de condenser l'information.
07:15Imaginez que l'on garde des données
07:16strictement essentielles
07:17à la création de l'image,
07:19sans données superflues
07:19qui ralentissent le calcul.
07:21C'est une forme de compression intelligente.
07:23Comme chaque opération dure 4 fois moins de temps,
07:25les Kurt Tensor peuvent en exécuter
07:26beaucoup plus en même temps.
07:27Du coup, le résultat,
07:28c'est qu'on divise la consommation
07:29de mémoire par 2 ou par 4,
07:31et on double la vitesse de génération
07:32tout en gardant la même qualité visuelle
07:34à la fin.
07:34C'est ça, la force de la quantisation.
07:36Et bien voilà,
07:37après 2 minutes de génération,
07:38on a bien notre photo,
07:39on retrouve notre tigre
07:41sous une feuille de bananier
07:42dans une jungle sous la pluie,
07:43dans un cadre resserré.
07:44Donc on a tous les critères
07:45qu'on avait demandé dans notre prompt.
07:47Là-dessus, le résultat est assez impressionnant.
07:49Pour un deuxième test,
07:50on va essayer d'être
07:50un petit peu plus créatif.
07:52Cette fois-ci,
07:52je vais demander à Flux2
07:53de prendre cette image de référence.
07:55Donc ici, c'est une femme
07:55qui n'existe pas.
07:56Et en fait, ce qu'on va lui demander,
07:57c'est d'ajouter un chapeau de cow-boy
07:59à cette femme
08:00et de la mettre dans une ambiance
08:01coucher de soleil
08:01au niveau de la luminosité.
08:03Et en décor,
08:04on va la placer dans un ranch.
08:05On va voir ce que Flux2 nous propose.
08:06Donc après quelques minutes de génération,
08:08voilà le résultat.
08:09On repère bien les éléments
08:11que j'ai demandé à ajouter sur la photo,
08:12à savoir le chapeau de cow-boy,
08:14le coucher de soleil
08:15qui est assez bien réalisé,
08:16ainsi que le décor de ranch.
08:17On retrouve bien le visage d'origine
08:19sur la photo,
08:20avec néanmoins les cheveux
08:21qui ont un petit peu changé.
08:22Mais sinon, on reconnaît bien la personne
08:23et c'est très.
08:24Peut-être petit défaut,
08:25c'est qu'on manque d'imperfections.
08:26Donc la peau est devenue trop lisse
08:27et le visage perd en naturel.
08:29À savoir qu'on peut rajouter
08:30des notes dans notre workflow
08:31afin d'ajouter des imperfections
08:33et avoir un résultat
08:33qui correspond un peu plus
08:34à nos attentes
08:35ou quelque chose de plus naturel.
08:36Mais ici, on va se contenter
08:37du workflow de base
08:38que nous propose Flux2.
08:39Pour un dernier exemple,
08:40il faut savoir que Flux2
08:41en fait est très fort en une chose,
08:42c'est mettre des mots
08:43dans des images.
08:44Là, par exemple,
08:45on va essayer de mettre
08:46le mot Numérama
08:46sur une devanture
08:47de restaurant japonais.
08:48On va voir ce que le modèle
08:49nous propose.
08:50Voilà, après quelques minutes
08:51de génération,
08:52on a enfin le résultat
08:53et on le voit,
08:54Flux2 a réussi
08:55à bien retranscrire Numérama
08:56sur la devanture
08:57de ce restaurant asiatique.
08:58Il a été remplacé,
08:59ce qui a été écrit à l'origine,
09:00par Numérama.
09:01Il a refait l'éclairage
09:02pour bien illuminer
09:02la nouvelle devanture.
09:03Il a même été un petit peu créatif
09:04au niveau de la police
09:05pour bien s'adapter
09:06à la thématique du restaurant.
09:11Le conseil, c'est quand même
09:11d'aller faire un tour sur Reddit
09:12ou d'aller regarder
09:13les tonnes de vidéos
09:14qu'on peut retrouver sur YouTube
09:15pour aller plus loin sur le sujet.
09:16Allez, hop, petit tips
09:17bien pratique
09:17si tu veux apprendre par l'usage,
09:19si tu importes une image
09:20créée avec ConfigUI
09:21directement dans ConfigUI
09:22et si le créateur
09:23a laissé les métadonnées
09:24dans son fichier,
09:25alors toute l'arborescence
09:26permettant la création
09:27de ce fichier apparaît.
09:28Je remercie encore Nvidia
09:28d'avoir sponsorisé cette vidéo.
09:30C'est grâce à des partenariats
09:31comme ça qu'on peut vous proposer
09:32du contenu toutes les semaines
09:33sur notre chaîne YouTube.
09:34J'espère que la vidéo
09:35vous a plu et vous a aidé
09:36et on se retrouve bientôt
09:37pour un nouveau tutorama.
Commentaires

Recommandations