Le guide SIMPLE pour générer des images incroyable en local sur ton PC (ComfyUI + FLUX 2)

Numerama

Pour en savoir plus sur la façon de faire tourner de l'IA en local, sur votre propre PC c’est par ici  https://www.nvidia.com/fr-fr/ai-on-rtx/ Vidéo sponsorisée par Nvidia. Merci à Nvidia de soutenir la chaîne Youtube de Numerama   Générer des images par IA directement sur votre PC, sans passer par un service ou un serveur, c’est possible, c’est gratuit et c’est facile ! A l’aide de ComfyUI vous pouvez générer en quelques minutes des images réalistes ou retoucher des images simplement en rentrant des prompts. Prérequis hardware, installation, configuration et explication du fonctionnement de l’interface, on vous explique tout !  Découvrez la gamme de PC RTX IA en RTX Série 50 by Materiel.net : https://www.materiel.net/n6450/nvidia-rtx-ia/?a_aid=5e2af2cae1466&data1=2025-pcai-nvidia-defendintelligence&utm_source=multi&utm_medium=pt&utm_campaign=2025-pcai-nvidia-defendintelligence  Avec les PC Materiel.net, l'IA devient votre nouvel assistant. Entrez dans une nouvelle ère de productivité avec les solutions d'IA basées sur les technologies de NVIDIA   ⏰ Sommaire 00:00 - Générer des images en local, c’est possible ! 00:46 - C’est quoi Comfy UI ? 01:25 - Quelle config pour générer des images ? 02:13 - Installation et configuration de Comfy UI 03:06 - Comprendre l’interface de Comfy UI 05:32 - On génère notre première image 06:13 - Que fait la carte graphique dans tout ça ? 07:48 - On teste différents prompts 09:07 - Derniers conseils pratiques  📝 L'article par ici ► https://www.numerama.com/tech/2176519-comfyui-comment-generer-facilement-des-images-ou-des-videos-avec-une-carte-graphique-nvidia-rtx.html  ---  🔔 Abonnez-vous à notre chaîne ► https://youtube.com/c/numerama  🚩 Retrouvez toutes nos playlists ► https://www.youtube.com/c/numerama/playlists  ---  Rejoignez-nous : 💻 Notre site ► http://www.numerama.com/ 🐦 X ► https://x.com/numerama 📸 Instagram ► https://www.instagram.com/numerama 📱TikTok ► https://www.tiktok.com/@numerama 🔷 Facebook ► https://www.facebook.com/Numerama/ 🎙️ Twitch ► https://www.twitch.tv/numerama  🟡 + rapide, + pratique, + exclusif : découvrir numerama+ ► https://www.numerama.com/numeramaplus/ ---  Réalisation : Naël Fontaine Montage : Alfred Tertrais Avec : Théotim Raguet  --- #Materielnet #NVIDIA #RTXAI

Transcript

00:00Depuis quelques années, la génération d'images par IA s'est développée avec des services comme Dali ou Midjourney

00:04ou encore les IA grands publics accessibles depuis un navigateur comme ChatGPT ou Gemini 3 avec Nano Banana.

00:09Et ces outils ont tous un point commun, tout se passe dans le cloud.

00:12Tes idées, tes visuels, tes promptes, ils partent tous sur des serveurs externes.

00:16Et on va pas se mentir, c'est pas idéal si tu cherches du contrôle, de la confidentialité ou simplement

00:20une plus grande liberté créative.

00:21Et si tu pouvais garder tout ton travail en local sur ta machine à condition d'avoir une bonne carte

00:26graphique ?

00:26C'est possible et tu vas voir que ça va changer beaucoup de choses.

00:29Grâce à ConfiUI et Flux 2, combinés à une carte graphique Nvidia GeForce RTX de dernière génération,

00:34tu peux générer des images impressionnantes, réalistes, sur ton propre PC.

00:38Et ça sans abonnement, sans cloud et sans contrainte externe.

00:40D'ailleurs, on remercie Nvidia, en t'épargne les présentations je pense que tu les connais,

00:44d'être partenaire de cette vidéo et de nous permettre de faire ce format.

00:47Si tu connais déjà ConfiUI, tu peux avancer un petit peu plus loin dans la vidéo.

00:50Mais si c'est la première fois que t'en entend parler, je t'explique tout.

00:53ConfiUI, c'est littéralement une usine qui sert à générer des images et des vidéos par IA

00:57avec une interface un petit peu particulière.

00:59Surtout, c'est un logiciel totalement open source.

01:02Ce qu'il faut retenir, c'est qu'elle ne ressemble pas du tout à l'interface habituelle prompt image

01:06qu'on retrouve sur les IA sur les navigateurs.

01:09L'interface de ConfiUI, elle fonctionne en node.

01:11Ce sont des blocs visuels que tu vas assembler comme un circuit.

01:13Et chaque bloc a une fonction, donc le texte, l'aléatoire, l'encodage, le rendu.

01:17Et en fait, tu as la main sur tout le processus de ce que va générer l'IA,

01:21étape par étape, directement devant toi.

01:22Et vraiment, tu gardes le contrôle car c'est toi qui gère tout.

01:25Ce qu'il faut savoir, c'est que ConfiUI, c'est juste une interface, rien de plus.

01:29Pour qu'elle génère des images, elle a besoin d'un modèle.

01:31Et justement, je te parlais de Flux 2 tout à l'heure, et bien c'est ça le modèle.

01:34Il a été entraîné sur d'immenses quantités d'images

01:36et à partir de ses bases de données et de son apprentissage,

01:39il est capable de créer des images à partir d'un simple texte.

01:42La version de Flux 2 qu'on va utiliser pour ce tuto,

01:44elle est optimisée pour fonctionner sur une bonne carte graphique Nvidia RTX de dernière génération.

01:49Pour générer des images, il y a besoin de puissance de calcul et de VRAM,

01:53la mémoire de ta carte graphique.

01:54C'est elle qui stocke et aligne tous les calculs en parallèle

01:57et traite des milliers d'opérations en même temps pour générer une image propre.

01:59Je te recommande d'avoir au moins 12Go de VRAM sur ta carte graphique

02:02pour générer des images avec ConfiUI.

02:04Ici, nous, on est plutôt bien puisqu'on a une grosse carte graphique,

02:08GeForce RTX 5080 avec 16Go de VRAM.

02:12Autant dire qu'on est confort.

02:13ConfiUI, ça existe depuis un moment,

02:14mais pendant longtemps, c'était un truc de Power User.

02:16Il fallait installer Python, Git, tout configurer à la main,

02:20passer par l'invite de commande Windows pour configurer certains accès.

02:23Bref, c'était pas hyper accessible.

02:24Aujourd'hui, c'est plus simple.

02:26ConfiUI propose sur son site un fichier exécutable.

02:28Tu le télécharges, tu l'ouvres et il va t'installer tout ce qu'il faut en arrière-plan.

02:31La première chose à faire quand ConfiUI est lancée,

02:33va dans tes paramètres et remets l'interface en anglais.

02:35La langue française n'est en fait qu'une mauvaise traduction automatique de l'anglais.

02:38Une fois que c'est fait, tu arrives dans l'interface.

02:40C'est à ce moment-là qu'on va télécharger et installer un modèle.

02:42Dans ConfiUI, tu as accès à une grande bibliothèque de modèles.

02:44Certains sont gratuits et open source, comme notre flux de dev,

02:47d'autres payants, et certains sont spécialisés dans un certain type

02:50de génération d'images, de vidéos ou d'intégration d'objets par IA.

02:53Pour notre flux de, c'est facile, on le sélectionne dans la liste,

02:56on lance le téléchargement, attention parce que c'est plusieurs dizaines de gigaoctets,

02:59et une fois que c'est terminé, notre modèle apparaît comme disponible dans notre interface.

03:03Voilà, ConfiUI est installé, Flux2 est prêt.

03:05Maintenant, je vais t'expliquer comment ça marche.

03:07Par défaut, ConfiUI lance une interface préconstruite pour apprendre son fonctionnement,

03:11et tu vois le machin, c'est le bordel, il y a des blocs partout et des liens qui les

03:15relient dans tous les sens,

03:16bref, je vais pas rentrer dans les détails, mais en fait, tout est très logique ici.

03:19Tu te souviens quand je disais que ConfiUI était une usine ?

03:21Eh bien, c'est exactement ça.

03:23Déjà, dans notre exemple, tout est organisé en étapes.

03:25La première, c'est le modèle, et le plus important.

03:27C'est lui qui interprète les commandes, que l'on entre,

03:29puis dessine en fonction de son apprentissage et de sa base de données.

03:32Dans le Diffusion Model, on va charger le cerveau principal de l'IA,

03:35ici Flux2DevFP8, c'est lui qui sait comment dessiner.

03:39Le FP8 indique une version optimisée pour économiser de la mémoire vidéo de la carte graphique Nvidia.

03:44À côté, on a un traducteur, il cherche le modèle de langage,

03:47ici basé sur Mistral3Small,

03:49qui va comprendre votre texte et le transformer en concept mathématique pour l'IA.

03:53Et enfin, LoadVAE, le Décodeur.

03:55Ce bloc sert à traduire le résultat final en pixels visibles, JPEG ou PNG.

03:59Alors, ça a l'air compliqué comme ça,

04:00mais en fait, ici, c'est ConfiUI qui a tout téléchargé, installé et préconfiguré lui-même.

04:05Moi, j'ai rien touché, j'ai juste demandé à utiliser Flux2Dev.

04:07Une fois qu'on a chargé le cerveau, la deuxième étape, c'est d'entrer ce que l'on veut.

04:11L'étape 2, c'est le champ de prompt.

04:12Le mieux, ici, c'est d'écrire son prompt en anglais.

04:15Avec Mistral installé dans notre configuration de base,

04:17on peut même entrer du code JSON.

04:19Le champ FluxGuidance, juste en dessous, là, c'est un réglage spécifique à Flux.

04:22Il contrôle à quel point l'IA doit écouter le prompt.

04:24Plus la valeur est haute, plus il interprétera le prompt strictement.

04:27Plus il est bas, plus il prendra de liberté.

04:29On le laisse à 4, mais on vous conseille de jouer avec pour avoir des images plus créatives.

04:32La troisième étape est optionnelle.

04:34Elle permet d'ajouter des images de référence sur laquelle se baser.

04:36Si on cherche des images dans ces boxes,

04:38il faut demander spécifiquement dans le prompt de s'y référer.

04:40Le modèle va ensuite utiliser toute ou partie de la structure de l'image

04:43pour en générer une nouvelle.

04:44On n'est pas obligé de l'utiliser.

04:46Si je fais CTRL-B, je coupe le lien vers ce bloc

04:48et ConfiUI ne le prendra pas en compte lors de la génération de l'image.

04:51Une fois qu'on a mis un cerveau, qu'on a entré une commande

04:54et qu'on y a mis des images de référence,

04:55il ne reste plus qu'à configurer la taille de notre image.

04:58Et la dernière étape est le Custom Sampler,

05:00là où tous les calculs sont effectués.

05:01Il y a beaucoup de paramètres ici, mais on va se concentrer sur les deux plus importants.

05:05Random Noise qui génère une seed,

05:06ou graine de hasard en bon français.

05:09C'est ce qui rend chaque génération d'images unique.

05:12Changez-la avec des chiffres hasard

05:13et vous aurez une image légèrement différente à chaque fois.

05:15En revanche, gardez-la si l'image vous plaît

05:17et que vous voulez modifier seulement certains paramètres.

05:19Clux de Scheduler qui s'occupe quant à lui

05:21de gérer les étapes de construction de l'image.

05:23Il indique 20 étapes,

05:24ce qui signifie que l'IA va affiner l'image 20 fois

05:26avant de donner le résultat final.

05:27Plus vous mettez d'étapes,

05:28plus votre image va mettre de temps à se générer,

05:30mais elle sera plus aboutie.

05:31Voilà, c'était long,

05:32mais vous le voyez, c'est plutôt logique.

05:34Bon, et maintenant, on est prêt,

05:35on va pouvoir générer nos images.

05:37Bon, on va commencer simplement.

05:38Je vais copier-coller un prompt test

05:39que j'ai trouvé chez les développeurs de Flux 2.

05:41Ici, on a trouvé un tigre mouillé sous une feuille de bananier.

05:43Pour ça, je rentre un prompt très simple.

05:45Et puis, j'appuie sur Run.

05:47La génération d'images en 20 étapes

05:48demande en moyenne entre 2 et 3 minutes.

05:50Pendant ce temps, vous le voyez bien

05:51sur le gestionnaire des tâches Windows,

05:52la carte graphique carbure.

05:53Mais concrètement, qu'est-ce qu'elle fabrique ?

05:55Elle ne dessine pas pixel par pixel comme un peintre.

05:58En réalité, elle joue au sculpteur,

05:59mais avec des mathématiques.

06:00Pour ConfiUI, votre image de départ,

06:02c'est du bruit pur.

06:03Imaginez la neige sur une vieille télé cathodique.

06:05L'IA, notre modèle Flux 2,

06:06a appris à repérer des formes dans ce brouillard.

06:08À chaque étape, on en a demandé 20 ici,

06:10elle va retirer un peu de bruit

06:11pour faire apparaître le tigre couche par couche.

06:13Et c'est là que la magie de Nvidia opère.

06:15Pour faire ça, le PC ne doit pas résoudre

06:17une seule équation complexe,

06:18mais des milliards de petites opérations simultanées.

06:20C'est la différence fondamentale

06:22entre un processeur simple

06:23et une carte graphique.

06:24Le processeur, c'est un génie des maths,

06:25mais il travaille seul.

06:26Il résout les problèmes les uns à la suite des autres.

06:29La carte graphique RTX, elle,

06:30c'est une armée de mathématiciens.

06:32Elle possède des milliers de cœurs,

06:33les fameux cœurs CUDA,

06:34qui travaillent tous en même temps.

06:36Ici, grâce à la VRAM de la carte graphique

06:37et à sa puissance brute,

06:39on transforme du bruit numérique en photoréaliste

06:40directement depuis chez soi.

06:42En fait, Nvidia ne se contente pas seulement

06:43de faire des cartes puissantes,

06:44mais fait aussi en sorte que ces cartes

06:46soient plus efficaces d'un point de vue logiciel.

06:47Et l'un des concepts clés là-dedans,

06:49c'est la quantisation.

06:53Jusqu'à présent, pour faire fonctionner une IAA,

06:55les cartes graphiques utilisaient

06:56des formats de données très larges.

06:58Un peu comme si elles utilisaient

06:59un camion de déménagement

07:00pour transporter un tabouret.

07:02Ok, ça rentre,

07:03mais il reste quand même

07:03beaucoup de place à l'arrière.

07:04Avec les GeForce RTX

07:05et leur nouveau cœur Tensor,

07:07on passe à l'ère du format de données FP4.

07:09L'idée n'est pas de calculer moins bien,

07:11mais de calculer plus efficacement.

07:12Le format FP4 permet de condenser l'information.

07:15Imaginez que l'on garde des données

07:16strictement essentielles

07:17à la création de l'image,

07:19sans données superflues

07:19qui ralentissent le calcul.

07:21C'est une forme de compression intelligente.

07:23Comme chaque opération dure 4 fois moins de temps,

07:25les Kurt Tensor peuvent en exécuter

07:26beaucoup plus en même temps.

07:27Du coup, le résultat,

07:28c'est qu'on divise la consommation

07:29de mémoire par 2 ou par 4,

07:31et on double la vitesse de génération

07:32tout en gardant la même qualité visuelle

07:34à la fin.

07:34C'est ça, la force de la quantisation.

07:36Et bien voilà,

07:37après 2 minutes de génération,

07:38on a bien notre photo,

07:39on retrouve notre tigre

07:41sous une feuille de bananier

07:42dans une jungle sous la pluie,

07:43dans un cadre resserré.

07:44Donc on a tous les critères

07:45qu'on avait demandé dans notre prompt.

07:47Là-dessus, le résultat est assez impressionnant.

07:49Pour un deuxième test,

07:50on va essayer d'être

07:50un petit peu plus créatif.

07:52Cette fois-ci,

07:52je vais demander à Flux2

07:53de prendre cette image de référence.

07:55Donc ici, c'est une femme

07:55qui n'existe pas.

07:56Et en fait, ce qu'on va lui demander,

07:57c'est d'ajouter un chapeau de cow-boy

07:59à cette femme

08:00et de la mettre dans une ambiance

08:01coucher de soleil

08:01au niveau de la luminosité.

08:03Et en décor,

08:04on va la placer dans un ranch.

08:05On va voir ce que Flux2 nous propose.

08:06Donc après quelques minutes de génération,

08:08voilà le résultat.

08:09On repère bien les éléments

08:11que j'ai demandé à ajouter sur la photo,

08:12à savoir le chapeau de cow-boy,

08:14le coucher de soleil

08:15qui est assez bien réalisé,

08:16ainsi que le décor de ranch.

08:17On retrouve bien le visage d'origine

08:19sur la photo,

08:20avec néanmoins les cheveux

08:21qui ont un petit peu changé.

08:22Mais sinon, on reconnaît bien la personne

08:23et c'est très.

08:24Peut-être petit défaut,

08:25c'est qu'on manque d'imperfections.

08:26Donc la peau est devenue trop lisse

08:27et le visage perd en naturel.

08:29À savoir qu'on peut rajouter

08:30des notes dans notre workflow

08:31afin d'ajouter des imperfections

08:33et avoir un résultat

08:33qui correspond un peu plus

08:34à nos attentes

08:35ou quelque chose de plus naturel.

08:36Mais ici, on va se contenter

08:37du workflow de base

08:38que nous propose Flux2.

08:39Pour un dernier exemple,

08:40il faut savoir que Flux2

08:41en fait est très fort en une chose,

08:42c'est mettre des mots

08:43dans des images.

08:44Là, par exemple,

08:45on va essayer de mettre

08:46le mot Numérama

08:46sur une devanture

08:47de restaurant japonais.

08:48On va voir ce que le modèle

08:49nous propose.

08:50Voilà, après quelques minutes

08:51de génération,

08:52on a enfin le résultat

08:53et on le voit,

08:54Flux2 a réussi

08:55à bien retranscrire Numérama

08:56sur la devanture

08:57de ce restaurant asiatique.

08:58Il a été remplacé,

08:59ce qui a été écrit à l'origine,

09:00par Numérama.

09:01Il a refait l'éclairage

09:02pour bien illuminer

09:02la nouvelle devanture.

09:03Il a même été un petit peu créatif

09:04au niveau de la police

09:05pour bien s'adapter

09:06à la thématique du restaurant.

09:11Le conseil, c'est quand même

09:11d'aller faire un tour sur Reddit

09:12ou d'aller regarder

09:13les tonnes de vidéos

09:14qu'on peut retrouver sur YouTube

09:15pour aller plus loin sur le sujet.

09:16Allez, hop, petit tips

09:17bien pratique

09:17si tu veux apprendre par l'usage,

09:19si tu importes une image

09:20créée avec ConfigUI

09:21directement dans ConfigUI

09:22et si le créateur

09:23a laissé les métadonnées

09:24dans son fichier,

09:25alors toute l'arborescence

09:26permettant la création

09:27de ce fichier apparaît.

09:28Je remercie encore Nvidia

09:28d'avoir sponsorisé cette vidéo.

09:30C'est grâce à des partenariats

09:31comme ça qu'on peut vous proposer

09:32du contenu toutes les semaines

09:33sur notre chaîne YouTube.

09:34J'espère que la vidéo

09:35vous a plu et vous a aidé

09:36et on se retrouve bientôt

09:37pour un nouveau tutorama.

Catégorie

Transcription

Commentaires

Recommandations