- il y a 2 jours
Dans ce tuto, on revient sur le dernier modèle image IA de Chat GPT Image 2.0 , et on fait un vrai test en profondeur. On va pour celà à travers les exemples le comparer avec Nano Banana 2 et voir si il mérite son statut de nouveau leader des modèles images IA dans les Benchmarks.
Catégorie
🤖
TechnologieTranscription
00:02chat gpt image 2.0 vient de sortir et d'après les premiers benchmark il semble bien repasser
00:09devant nano banana 2 bon comme d'habitude les matchs par que c'est bien mais les vrais tests
00:14c'est mieux et dans cette vidéo on va faire à peu près 40 tests concrets et comparer chaque
00:19résultat avec nano banana 2 pour voir laquelle désir est la plus forte selon les usages pour
00:25structurer tout ça on va se baser sur les nouveautés mises en place à part open ai que j'ai
00:30regroupé
00:30en plusieurs grandes thématiques donc comme ça si tu le souhaites tu pourras te balader dans les
00:34chapitres de la vidéo l'objectif simple savoir si chat gpt image 2 est vraiment meilleur et surtout
00:40dans quel cas il fait vraiment la différence et aussi petit bonus en fin de vidéo on fera quelques
00:45utilisations virales de gpt image 2.0 qui ressortent ces derniers temps sur les réseaux mais tout d'abord
00:51petit rappel pour utiliser chat gpt image 2.0 il suffit de se rendre sur chat gpt et d'aller
00:58dans le
00:58petit créer une image ici à l'image de gemini on nous propose quelques thèmes déjà prédéfinis
01:05pour rappel sur gemini donc on peut directement appliquer les styles qui sont proposés quand on
01:10va aussi sur créer une image la différence notable ici c'est que maintenant sur gemini qu'on soit en
01:16pro
01:16ou en raisonnement ça sera nano banana 2 qui sera utilisé pour créer des images alors que sur
01:21chat gpt on aura deux modèles images qui seront proposés en allant ici on aura le modèle astint ou
01:27le modèle thinking le modèle thinking permettra de rajouter un raisonnement supplémentaire à la
01:32création des images et donc logiquement une meilleure compréhension des prompt donc c'est ce modèle là
01:37qu'on va utiliser pour la vidéo on aura aussi l'occasion d'y revenir mais si sur gemini on
01:41doit préciser via
01:42la barre de prompt le ratio qu'on souhaite sur chat gpt images deux options soit laisser l'IA
01:48décider ou soit choisir parmi les ratios suivants on aura l'occasion d'y revenir pour les tests standard
01:54on restera en automatique enfin avant de commencer deux possibilités sur ces modèles images écrire un
02:00prompt et générer ou si on souhaite ajouter des fichiers extérieurs comme des photos ou des pdf pour
02:05pouvoir générer ou modifier une image la même chose sur gemini ici alors intéressons nous à la première série
02:11de tests avec le rendu du texte la mise en page et l'amélioration du multilang c'est donc un
02:16des gros
02:17points forts sur ce nouveau gpt image 2.0 c'est bien sûr le rang du texte on est maintenant
02:22à une
02:23précision de 99% pour le texte contre environ 60 à 70% quand on était sur le modèle 1
02:29.5 ce qui fait
02:30que pour mon exemple 1 j'ai demandé tout simplement une infographie de la seconde guerre mondiale et le
02:36résultat sur gpt image 2.0 est impressionnant il faut souligner aussi que sur nano banana 2 aucun souci
02:46non plus bien que j'ai eu par exemple ici deux fois le drapeau de l'urss qui a été
02:51répété comme pareil
02:52ici deux fois le drapeau du japon et à noter que intéressant du côté de gpt 2.0 c'est
02:58le drapeau de
02:59guerre du japon qui a été choisi pour illustrer l'axe mais en soit que ça soit l'un ou
03:03l'autre sur
03:04l'infographie nano banana 2 était déjà très très fort gpt se met au niveau on pourra noter aussi
03:09peut-être une différence de style qui va se répéter au fur et à mesure des exemples qu'on va
03:14présenter
03:14on est toujours un petit peu plus dans le dessin chez google alors que chez open ai on est plus
03:19dans
03:20l'illustration photo réaliste voir les schémas ensuite j'ai voulu faire un diagramme cette fois
03:26ci au niveau du cerveau humain et là encore une différence de style entre les deux donc ici on est
03:32bien sûr gpt image 2.0 et ici sur nano banana 2 les informations sont correctes bien que pour le
03:40coup
03:40ici sur nano banana 2 il essaye de me détailler un petit peu plus en rajoutant par exemple le corps
03:44qu'elle eux les deux restent au niveau mais si on sort maintenant des exemples éducatifs pour
03:50ajouter à cette génération de texte une mise en page plus dense comme les affiches les menus les
03:55couvertures de magazine ou les packaging et j'ai commencé le premier exemple ici en emplonant tout
04:00simplement une photo de moi et en demandant d'imaginer une couverture de vogue la photo de
04:04base la voilà c'est celle que j'utiliserai pour la majorité de mes exemples où j'ai besoin de
04:09m'incruster dedans et comme on peut voir elle était parfaitement repris avec l'ensemble des détails mais
04:13ce qui est sympa surtout c'est que au niveau du texte il n'y a aucune faute tout est
04:18bien pensé et
04:19tout est bien détaillé sur gemini voilà le résultat il m'a rajouté mon nom en plus donc ça c
04:25'est quand même le
04:25petit plus par contre au niveau de la photo on est un petit peu moins ressemblant que celle ci donc
04:30là
04:30quand même je préfère le travail qui a été fait par gpt images ensuite je lui ai demandé toujours avec
04:36la même photo de me simuler une une d'un magazine comme l'équipe où je signerai au real madrid
04:42et
04:42là j'étais très surpris parce que vraiment sur gpt images ça fait le travail et en plus ça va
04:47dans le
04:48détail sur l'ensemble des autres fenêtres aucune faute dans le texte et puis surtout par exemple si j'ai
04:54zidane le ral a toujours une place à part alcaraz en demi-finale ou encore le psg décroche le titre
05:00après une saison bon par contre ici les joueurs du psg c'est pas parfait mais quand même c'est
05:05assez
05:05impressionnant et sur nano banana voilà ce que j'ai obtenu donc c'est assez sympa le côté signature
05:10avec florentino pérez le président du real par contre au niveau du texte si on va dans les détails
05:15c'est là qu'on voit que eh bien il ya une petite différence tout n'est pas parfait et
05:20si le titre est bon
05:21les sous titres ou les textes à côté ça pêche un peu en continuant sur le texte j'ai demandé
05:25la
05:25génération d'un menu avec six crêpes salé six crêpes sucrées et les boissons avec une formule midi à 15
05:31euros ça c'est le résultat de gpt image 2 tout est parfait les illustrations sont belles on a quelque
05:38chose de très classique mais de très joli quand même et sur gmini on a toujours ce petit côté
05:43illustration qui est vraiment propre à nano banana 2 avec par contre quelques irrégularités des fois on a
05:48l'illustration de la crêpe des fois on l'a pas on n'a pas les prix sur les boissons
05:52par exemple donc
05:53voilà c'est loin d'être mauvais il ya une petite mise en ambiance par rapport à gpt qui fait
05:57plus
05:57le travail froidement mais qui encore une fois un petit peu plus régulier dans la mise en page
06:02cohérente et les informations présentes là un petit peu plus dur je lui ai demandé une génération
06:07d'une bande dessinée avec deux personnages pipo et figo un chat et un chien quand les prénoncent très
06:13similaire et en fait je lui ai dit de me trouver une histoire marrant de la mise en scène de
06:19leur
06:19naufrage sur une île déserte avec des petits gags le résultat de gpt image 2 il est vraiment très bien
06:24à chaque fois un gag selon les différents vignettes et les deux personnages cohérents au fur et à mesure
06:30avec leurs différentes personnalités et ils trouvent le trésor à la fin et voilà ce que j'ai eu avec
06:35nano
06:35banana 2 et encore une fois le style on voit tout de suite que c'est gemini par rapport à
06:39open ai
06:40mais ce qui me dérange c'est que même si c'est très très beau et bien tout de suite
06:43là où gpt
06:44il n'a pas pris le risque de nommer les animaux pour pas les confondre à travers les vignettes ici
06:49on a l'erreur où le chien appelle le chat pipo et le chat appelle le chien pipo donc on
06:55a un petit
06:55souci de cohérence pareil au niveau du texte nano banana essaye de le remplir des fois point gpt même
07:00si dans le style je préfère nano banana encore plus dur là j'ai demandé la génération d'une fenêtre
07:05twitch comme si salma atman était en train de découvrir le nouveau gta et que le chat était
07:12bien affiché en français ça c'est un exemple que j'avais vu sur le net et je suis vraiment
07:17bluffé
07:17sur la cohérence des détails et la hiérarchisation des textes pour que ça soit vraiment très très beau
07:24aussi le jeu vidéo on voit que on est donc dans vie city on a la carte gta qui est
07:29ici la voiture
07:30sam altman qui est en train de jouer avec son pseudo qui s'affiche et le chat en français avec
07:34les
07:34pseudo et les différents commentaires le planning on voit aussi le à propos de sam altman au niveau
07:40des détails et de la configuration rien à dire sur gemini j'ai dû uploader une photo de moi parce
07:44qu'il n'a pas voulu prendre sam altman ça va être ça aussi la différence on va être moins
07:49restreint sur
07:49gpt image 2.0 qu'avec gemini ou dès qu'on a une personnalité connue ça va pas fonctionner attention
07:55ça veut pas dire que sur gpt image ça fonctionne à tous les coups mais en tout cas il y
07:59aura plus de
07:59facilité et ici donc il m'a pris en train de jouer à gta mais on voit qu'au niveau
08:03du texte ça manque
08:04d'originalité ça se répète beaucoup pareil ici le texte incorrect donc il ya vraiment une différence
08:10de qualité sur le rendu du texte entre les deux modèles et donc une première différence confirmée
08:15un petit désordre que j'avais voulu faire c'était uploader une photo de moi et mettre en selle le
08:19montage
08:20que j'étais en train de faire sur la vidéo donc ça c'est le résultat avec gpt image 2
08:24.0 où je suis bien en
08:25train de faire la vidéo sur le sujet assez sympa avec le décor studio et sur gemini on avait quelque
08:31chose dessus de très sympa quand même mais là le texte m'a été mis en anglais bon honnêtement les
08:35deux sur ce texte sont bien mais la plus intéressant j'ai uploadé une simple basket puma que j'ai
08:41trouvé
08:41sur amazon et j'ai demandé de réaliser une publicité agressive pour les réseaux voilà ce que m'a proposé
08:47gpt image 2.0 assez génial là où sur nano banana 2 c'est pas trop mal mais je trouve
08:53que la basket est
08:54moins mise en avant pareil pour le texte ici ça me parle pas trop et je pense j'aurais des
08:58meilleurs
08:58résultats avec nano banana pro parce que le 2 il a tendance à en rajouter un petit peu au niveau
09:03des
09:04détails sans trop les maîtriser vraiment rajouter des choses pour rajouter des choses comme le texte
09:09ici il est beaucoup trop long alors que le visuel sur gpt image est vraiment séduisant pour se finir sur
09:14ce test de composition je lui ai demandé de me créer une affiche de cinéma à partir de plusieurs images
09:19donc j'ai repris les images du film d'animation que j'ai fait il n'y a pas longtemps
09:23qui s'appelle
09:23taco en lui disant voici six images de mon film d'animation qui s'appelle taco qui met en scène
09:28le détective coureau fait une affiche en t'inspirant de ces images voilà le résultat de gpt image 2.0
09:35qui
09:36reprend superbement l'ensemble des images que j'ai uploadé pour pouvoir essayer de les mettre dans
09:40un cadre assez sympa avec le titre retravaillé et même les petits détails de distribution ici très
09:47très cool on commence à voir quelque chose que je crains avec ce modèle c'est que quand on lui
09:51demande de générer dans un style autre que le photoréalisme c'est quand même assez sombre je
09:55trouve et voilà ce qu'il m'a proposé sur gemini assez sympa un petit peu plus fouillis avec les
10:00problèmes de date à la fin mais un style artistique qui dénature vachement moins par rapport aux photos
10:06de base que j'ai uploadé si je les reprends ici on voit bien que sur gemini eh bien on
10:11est beaucoup
10:11plus proche de ces photos de base que sur gpt image que même s'il les reprend bien il apporte
10:16un
10:16filtre vraiment sombre dessus on va voir si ça se vérifiera avec d'autres exemples et pour clore
10:21ce chapitre il faut que on teste aussi les autres avancées importantes c'est à dire le multilangue
10:27chat gpt image 2.0 il peut maintenant générer des alphabets non latins comme le japonais le
10:33coréen le chinois ou l'indie on va faire quelques tests très très rapide donc le premier test que
10:38j'ai fait c'est que j'ai demandé de traduire en coréen le menu de crêpes qu'on avait
10:42généré avec
10:43gpt image 2.0 donc voilà le résultat l'ensemble du texte a été traduit si quelqu'un parle coréen
10:49qui n'hésite pas à me dire si il voit des fautes en tout cas j'ai essayé leur traduire
10:53après en
10:53français j'avais aucun souci et sur nano banana 2 il a aussi réussi à traduire le menu en coréen
10:59mais la petite déception au niveau des boissons toujours ça bloque impossible de les traduire
11:04donc dommage le deuxième test on va essayer à partir de zéro ou du moins juste d'une bouteille
11:11de kombucha de réaliser une pub entièrement en japonais pour instagram donc voilà le résultat
11:16que j'ai eu sur gpt 2.0 à noter qui m'a pris automatiquement en compte le format 3
11:22par 4 et
11:22sur gemini avec les mêmes consignes il m'a généré ça lui m'a directement mis la pub dans un
11:27cadre comme
11:28si c'était sur le métro il n'a pas respecté la consigne instagram et encore une fois on a
11:32vraiment la
11:33différence de style où on est beaucoup plus sur le dessin dans nano banana par rapport à gpt image
11:40où il privilégie le photoréalisme ensuite sur internet j'ai trouvé une affiche d'un vieux film
11:45indien avec un watermark à l'hermi c'est important aussi pour comprendre le test pour voir si gpt image
11:51pouvait me le traduire sans aucun souci et m'améliorer tout en retirant le watermark le résultat est sans
11:56appel même si en termes de traduction il n'y avait pas grand chose à faire à part traduire le
12:00nom des
12:01acteurs mais j'ai bien ici la société production qui me présente le film donc assez sympa et surtout
12:06j'ai le watermark et la couleur qui a été améliorée et par contre avec nano banana 2 impossible de
12:12faire
12:12l'action parce que ça bloque au niveau des visages en disant que ces visages sont trop connus et que
12:17nano banana 2 ne peut pas travailler dessus donc la même chose qu'on avait eu avec sam altman là
12:22aussi
12:23de côté de google on a un logo alors que chez open ai pas de souci donc pour ce chapitre
12:281 résumé
12:29compréhension et création du texte vraiment amélioré avec gpt image 2.0 et qui prend l'avantage sur nano banana
12:362
12:36dans ce chapitre 2 on va faire les tests au niveau du respect des instructions alors c'est très très
12:41large
12:41mais on va pousser à travers différents exemples c'est important ici de dire que gpt 2 images n'est
12:47plus non seulement un modèle de diffusion mais il intègre les capacités de raisonnement quand on le met en mode
12:53thinking c'est à dire que au niveau de l'adhérence des instructions on arrive sur un taux de réussite
12:57à
12:5895% ce qui est énorme et ça va faire la différence au niveau des détails là où les anciens
13:03modèles baille les oublient
13:05le premier test comparatif le plus classique c'est celui du verre de vin avec l'horloge donc ici j
13:11'ai uploadé mon image et j'ai demandé
13:13que je tienne un verre de vin rempli à ras bord avec l'horloge en fond qui indique
13:184h34 test validé même si ici sur gemini et google nano banana 2 on y est aussi quasiment pour le
13:24verre de vin il reste peut-être
13:25ça à remplir et toujours aussi on voit la cohérence des visages quand on upload une photo pas vraiment on
13:31a le rendu photo
13:32réalistique de celle ci qui est représentée par rapport à nano banana 2 où on perd quelques détails on va
13:38enchaîner avec
13:39le jeu des sept différences donc j'ai demandé de générer un jeu des sept
13:43différences en se basant sur la culture même et j'ai fait la même chose
13:48avec nano banana 2 pour pouvoir voir s'il y avait bien les sept différences j'ai ensuite
13:53uploader l'image de nano banana 2 dans gpt et l'image de gpt dans nano banana 2 en demandant
13:59de résoudre le problème en entourant les différences
14:01donc ça c'est le résultat avec gpt image 2 il m'a entouré une deux
14:05trois quatre cinq six différences donc pas cette différence et c'est un petit peu trompé mais comme la génération
14:12de nano banana
14:12je pense à aussi elle s'est trompé à la base donc là ici au niveau de la casquette on
14:16voit bien qu'il ya quelque chose qui a été
14:17rajouté mais il a oublié de me mettre le plus simple c'est à dire que le personnage souriait il
14:21m'a bien fait les deux tasse
14:22qui étaient ici mais il a oublié le monster on voit en fait que nano banana il avait encore fait
14:27beaucoup trop de différences
14:28au la des sept que j'avais demandé et qu'il fait un petit peu de zèle à chaque fois
14:32et qui propose beaucoup plus
14:33donc on voit ici sur le jeu des sept différences 2 gpt il était beaucoup mieux organisé
14:39malgré le fait qu'il ya le petit côté sombre encore une fois que j'aime pas trop et nano
14:43banana bah il m'a indiqué ici une différence alors qu'il n'y a pas
14:46alors qu'il aurait pu tout simplement trouver la différence au niveau de la planète assez mitigé pour ce test
14:51que ça soit sur les deux modèles
14:52j'ai demandé ensuite de me générer un ou est charlie avec mon propre personnage
14:57là c'est celui généré par gpt mais je le trouve beaucoup plus simple et en plus il m'a
15:01entouré en donnant la réponse tout de suite
15:02sur nano banana j'aime beaucoup le style donc je suis ici on va dire que c'est pas trop
15:07mal après ce qui m'arrange c'est que j'avais donné comme thème
15:10l'IA nano banana m'a parlé de gpt 5 sans mentionner gemini j'ai trouvé le clin d'oeil
15:16assez rigolo
15:16mais là on va s'attarder un petit peu puisque c'était le test qui me préoccupait
15:20personnellement c'était en termes de respect des consignes tout ce qui va être
15:25réalisation pour des projets complets sur la création de personnages cohérents et de la mise en scène de ceux ci
15:31avec le vrai respect des
15:32instructions dans un premier temps sur gpt j'ai demandé à partir de l'image
15:36d'animation du film courant de me générer la fiche complète du personnage principal et franchement j'ai pas été
15:43déçu en termes de plan du
15:45personnage avec vraiment tous les angles de vue avec le détail des expressions et même le texte qui est super
15:51cohérent
15:51donc j'ai trouvé cette fiche personnage super complet pour pouvoir par exemple
15:56l'utiliser dans la génération vidéo et le donner à il n'y a comme si dense pour créer ses
16:01scènes
16:01là où sur nano banana si encore une fois il reprend bien la luminosité et la couleur par rapport à
16:07gpt où on est encore que sur quelque chose de très très
16:09sombre bien il fait des erreurs avec cette vue de côté où il me met la queue complètement devant au
16:15lieu de la mettre derrière et les pattes à l'envers
16:16alors ensuite j'ai demandé de générer la même scène en partant de cette fiche
16:21personnage donc en indiquant sachant que j'aurais pu même définir le ratio avant que c'était en 16 9e
16:28animation et que je voulais donc que le personnage boit un verre dans un bar avec un
16:33barman raton laveur le résultat est très très beau mais encore une fois c'est très très sombre à noter
16:38que sur nano banana 2
16:40j'ai demandé la même chose mais en uploadant la fiche caractère qui avait été donnée par gpt images
16:45et le résultat ici est aussi très très bon même si bon bah il me met en arrière-plan des
16:51humains
16:51c'est pas cohérent il faudrait que je le rechange derrière mais voilà c'est pas mal par contre maintenant
16:56le truc je voulais
16:57absolument voir avec lui c'est là où j'ai énormément galéré dans mes présents dans travaux c'est vraiment
17:04prendre une scène et faire comme si on
17:06demandait à l'ia de bouger la caméra pour avoir un nouvel angle de vue et donc directement dans la
17:12suite la conversation pour voir si
17:14travaille bien sur les instructions
17:15demander de changer la caméra de place pour refaire la scène comme si on la mettait derrière le barman
17:21j'ai pété images a parfaitement compris et m'a refait la scène en positionnant la caméra derrière le barman
17:28et du côté de nano banana
17:29là j'ai rencontré le même souci que j'avais déjà eu auparavant c'est à dire que une partie
17:34de la consigne est compris
17:35mais après le reste il me déplace le barman et du coup j'ai une scène qui n'est plus
17:40du tout cohérente
17:41puisqu'il n'arrive pas à me déplacer mon arrière-plan en lien avec ce changement de caméra
17:45la même chose tout de suite après j'ai demandé une vue du dessus pour voir ce que ça donnait
17:49là aussi aucun souci du côté de gpt images
17:53et bon sur nano banana ça va malgré le fait que bah là il m'a mis un bar vraiment
17:57tout petit par rapport à la profondeur du premier
18:00donc là on voit si le respect des consignes est très très bien il ya un problème clairement sur gpt
18:04images au fur et à mesure que je travaille sur la même image
18:06on voit que je sais pas pourquoi ça se dégrade ça s'assombrit au niveau des textures on était sur
18:12quelque chose qui était plus ou moins lisse ici et après
18:15ici ça commence à se dégrader et dans le workflow la troisième image ça s'est complètement dégradé en termes
18:21de textures
18:21et j'ai même essayé de dire refais moi la scène de jour
18:24mais même là je trouve ça vachement sombre et un espèce d'ajout de textures par rapport à l'image
18:29originale
18:30donc ouais sur le style animation je suis pas encore convaincu par gpt images
18:34mais je m'égare on avance dans les textes pour voir si on est toujours dans le respect des instructions
18:38et on va complètement changer de sujet en demandant quelque chose de très pointu c'est la grille des émotions
18:4410 par 10 donc sans émotions différents à partir d'une photo ça c'est le résultat que j'ai
18:49obtenu sur gpt images 2.0
18:52j'ai trouvé ça vraiment très cool il m'a vraiment trouvé sans émotions ce qui n'est pas facile
18:56donc on voit que quelquefois ça peut se répéter
18:58mais en tout cas ils ont bien été mis en scène sur une grille
19:0110 par 10 donc sans un tout alors que ça a été un petit peu plus difficile du côté de
19:05gemini même si ça partait bien avec le respect
19:08de la photo à un moment donné rageur et peur il m'a fait sauter une ligne en entier et
19:14c'est pareil si on compte
19:162 4 6 8 on n'est pas sûr du 10 sur 10 par rapport à gpt là où la
19:21consigne a été respectée toujours dans le respect des consignes mais cette fois ci
19:24dans l'intelligence spatiale on va essayer deux exemples qui sont très intéressants
19:30le premier c'est que j'ai uploadé un plan de disney que ce soit sur gpt image à 0
19:35.2 ou sur nano banana à 2 et j'ai demandé
19:37bah tiens génère moi l'image
19:39du point of view comme si tu étais au numéro 10 et là le résultat est assez
19:45bluffant donc on est vraiment à frontière land mais sur nano banana aussi il m'a trouvé frontière land
19:52donc j'ai tellement été impressionné que j'ai voulu leur donner un exercice un peu plus difficile
19:56en disant de refaire cette scène comme s'ils étaient à la place de la personne avec le manteau blanc
20:01donc si on zoom on la voit ici on voit que
20:04j'ai pété image qu'est ce qu'il m'a fait et me fait comme si la personne tenait
20:08un café et était avec son compagnon
20:10on voit l'avant de la voiture on voit les montagnes alors c'est pas exactement je pense qu'il
20:14se tenait plutôt la main on va voir ce que nano banana
20:16m'a trouvé et là il a bien déduit que les deux personnages se tenaient la main mais en termes
20:21d'espace par contre il m'a mis l'homme sur la droite
20:23alors que plutôt l'imaginer qu'il serait sur la gauche ou loin à la même hauteur et surtout dans
20:28l'espace au niveau du camion
20:29il n'a pas su
20:31le situer comme
20:32ici il a bien été situé par rapport à cette scène
20:36originale et imaginer que les deux personnages ne voient que l'avant du camion donc voilà assez intéressant sur la
20:42spatialité
20:43on a des bons résultats mais ça pourrait s'améliorer sur les deux et puis enfin pour finir tout ce
20:48qui est
20:49respect des consignes je voulais voir un petit peu comment on gérer l'information par rapport au web donc en
20:56temps réel avec par exemple
20:58demander de générer un tableau des demi-finales de ligue des champions de cette saison sans préciser les équipes
21:04j'ai juste précisé l'année 2026
21:06là j'ai les bonnes informations
21:09avec le style qui est toujours assez propre
21:11à gpt image 2 et sur nano banana les informations sont aussi correctes après le style est propre à nano
21:18banana
21:19pour compléter le respect des instructions j'ai demandé aux deuxiats de me générer un carousel sur les actualités de
21:25la semaine
21:25là j'ai été très surpris par le résultat
21:28donné par gpt image 02 surtout la façon dont il me la présenter c'est à dire que il m
21:33'a généré le carousel mais il m'a généré
21:35l'entièreté des images et ainsi en fait dans ma conversation
21:39je peux me balader comme ça de slide en slide
21:42pour pouvoir voir l'ensemble des informations et ainsi télécharger l'ensemble des slides qui ont été généré
21:50là où avec la même consigne sur gemini et bien là j'ai eu tout d'un seul bloc
21:55donc pas forcément le format carousel qui est super utilisable on reste sur l'infographie
22:00malgré fait que encore une fois c'est très joli mais ici vraiment j'aime le fait que quand il
22:04a réfléchi en termes de design
22:05et il m'a proposé la possibilité d'interagir comme ça page 1 page 2 page 3 page 4 très
22:11très intéressant
22:11donc respect des consignes que ce soit d'un point de vue espace que ce soit d'un point de
22:16vue
22:17connecteur web nano banana 2 est très très bon mais je pense que
22:21gpt image 2.0 il fait très peu d'erreurs s'il comprend les instructions je trouve que les images
22:27dans le workflow ils sont dégradés mais je m'avance un petit peu sur le chapitre suivant puisque maintenant on
22:33va parler de format d'image
22:35de flexibilité de modification et donc de workflow
22:37le chapitre 3 donc format d'image ratio flexible modification et workflow
22:42ça va être un petit peu ce qu'on a vu en introduction
22:44gpt image 2 ça propose enfin les formats flexibles ce n'était pas le cas avant est ce qui est
22:49bien c'est que ils sont directement
22:51sélectionnable quand on souhaite créer une image à partir d'ici ça va du carré portrait en passant par la
22:58story le paysage et l'écran large
23:00ça je l'englobe aussi dans le workflow et on va voir dans les modifications
23:04puisque ça permet tout de suite si on souhaite créer une miniature youtube par exemple le prompt c'était ici
23:10uploader l'image et créer une
23:12miniature style mr beast
23:1346 heures sur une île déserte on voit que ici ça a été ajouté mais quand j'ai généré le
23:18prompt j'ai juste eu à
23:20sélectionner via le bouton qui est juste ici et même si je n'avais pas demandé
23:23juste en mettant le mot clé miniature youtube il m'aurait généré donc le bon ratio
23:28après pas de mystère j'ai demandé un style mr beast avec la photo
23:32on y est parfaitement sur la génération de miniatures je le trouve très très fort mais du côté de nano
23:36banana 2 c'est pas mal aussi
23:38même si c'est un petit peu moins épuré c'est à dire qu'il a tendance à rajouter beaucoup
23:43trop de détails
23:43et pareil au niveau de la tête il a changé un petit peu plus par rapport à celle ci
23:48donc donc dans le style je préfère vraiment les miniatures générés maintenant par gpt image 2
23:53et là où dans le workflow c'est intéressant c'est que dans la modification on peut tout simplement en
23:58sélectionnant ici notre miniature
24:00aller dans format d'image et changer directement en demandant le format souhaité comme par exemple ici j'ai transformé
24:08en poste instagram et les éléments ont été repris pour pouvoir
24:11ainsi faire en sorte qu'ils rentrent tous dans la composition donc de façon
24:15intelligente il refait le design en gardant la thématique et vraiment en replaçant tout dans son contexte sur gemini ici
24:23j'ai dû passer par imprompte et malgré le fait qu'il me l'a transformé bah déjà il me
24:27l'a transformé sur l'ancien format instagram qui est le format carré
24:31donc j'aurais peut-être dû préciser trois par carte par contre oui on peut pas dire qu'il n
24:34'a pas bien fait le boulot
24:35ça reste cohérent par rapport à l'image numéro un l'âge où gpt image va être moins fort c
24:40'est que il ne pourra pas aller au delà du
24:4316 9e j'ai eu beau demander un plan large il m'a donné le 16 9e maximum
24:48même si après je lui demande de me faire vraiment un plan large cinéma
24:52il n'y arrive pas au mieux qu'il me fait c'est que il me dézoome l'image pour
24:56faire en sorte d'avoir le plan large
24:57mais du côté de gemini c'est un ratio qui est pris en compte et donc ici on peut créer
25:02vraiment des plans large cinéma
25:04sur gemini donc pour les exemples de modifications de travail sur le workflow sur gpt image 2.0 ici je
25:12lui ai demandé de me transformer
25:13pour une photo linkedin j'enchaîne en demandant d'ajouter des lunettes aucun souci sur la modification
25:19après on verra sur un exemple sur la fin quand on commence à avancer beaucoup trop loin dans le workflow
25:23ça commence à baisser un petit peu en termes de qualité mais bon en termes de modification et compréhension dans
25:28le workflow
25:29les deux sont très très bien là aussi sur nano banana j'ai eu un très bon exemple
25:33de linkedin même si encore une fois et la photo me ressemble un petit peu moins
25:37j'ai essayé aussi le travail du workflow par exemple dans la modification d'un logo donc on est parti
25:42sur le labo des réseaux
25:43j'ai demandé de moderniser il m'a modernisé un petit peu sur gpt image 2.0 les couleurs en
25:49me rendant quelque chose
25:50d'un peu plus stylé il m'a fait le merge qui va avec et le site internet
25:55encore une fois très très détaillé où il s'est inspiré vraiment de l'ensemble de nos vidéos le seul
26:00souci qu'il a eu
26:00c'est que bah il a inventé deux noms
26:02les créateurs du labo des réseaux jules et nico alors que non c'est marco et boris et du côté
26:07de gemini
26:07dans le logo il m'avait proposé quelque chose de différent
26:10mais pareil il avait aussi réussi à le mettre cohérent sur un merge
26:13et proposer un site internet un petit peu moins bien l'interface
26:18et surtout il a repris en compte le merge qui avait avant donc lui dans le workflow
26:22c'est ça peut-être qui va gêner c'est que dans la génération d'image il va tenir compte
26:25des anciennes
26:27générations d'image donc ça peut être pas mal selon le cas d'utilisation mais par exemple si on veut
26:32au sein d'une même conversation
26:33créer différentes choses sans se référencer toujours aux images d'avant
26:37ça peut être embêtant là-haut au niveau des consignes
26:41gpt image est beaucoup plus agréable à travailler dans le workflow donc voilà je vais pas aller plus loin sur
26:45ce chapitre là on voit juste que
26:47ça sera plus agréable de travailler avec gpt image 2 sur la possibilité de sélectionner les ratios bien qu'on
26:53a plus de ratios disponibles avec
26:55nano banana 2 mais sur les formats classiques sur tout ce qui va être aussi une modification de workflow
27:00point sur gpt image 02 et on va attaquer le chapitre 4 avec tout ce qui va être aspect esthétique
27:06le premier c'est très très classique c'est le style photo réalistique
27:10qu'est ce que ça donne donc si on donne des consignes une femme le cadre l'expression l'atmosphère
27:16les détails techniques
27:17voilà ce qu'on obtient
27:19sur
27:20gpt image
27:21je trouve ça très très beau malgré le fait que on sent toujours la patilla et du côté de nano
27:27banana 2
27:28voilà ce qu'on obtient je pense que j'ai une préférence quand même un sur les images
27:32je trouve qu'elles sont beaucoup plus naturel avec nano banana dans tout ce qui est style
27:36on l'avait déjà vu sur les dessins on l'avait déjà vu sur la photographie même si la compréhension
27:40des promptes c'est très très important sur le style
27:43c'est personnel mais j'ai une préférence sur nano banana où on n'a pas cette patria qui est
27:48omniprésente
27:49honnêtement je ne sais pas dites moi ce que vous en pensez en commentaire si on parle purement style quel
27:53est l'ia que vous préférez entre les deux
27:55ça m'intéresse d'avoir votre avis c'est pareil ici sur le transfert de style d'une photo donc
27:59j'ai uploadé mon image avec
28:01l'image de courroux pour essayer de retranscrire le style ce qui me fait sur gpt image
28:06bah ça c'est super en termes de cohérence puisque il essaye de me
28:09retranscrire le personnage dans l'univers de courroux dans un style animé mais
28:15je préfère vraiment le rendu de nano banana qui est vraiment plus en lien avec l'image de base après
28:21par contre sur un autre exercice
28:22là j'ai pris la colorisation et l'amélioration de l'image donc là on a une image de football
28:27où je crois que c'est yachin qui fait un arrêt
28:29j'ai pété
28:30image a réussi à me recoloriser et à m'améliorer l'image et malheureusement du côté de gemini encore une
28:36fois
28:37ça ne passe pas pour des raisons de droit d'auteur
28:40c'est dommage mais j'ai essayé de faire un autre exemple en demandant à partir de la même image
28:45de me la défauter pour voir quel résultat
28:47j'allais à voir et là c'est le résultat qui m'a été donné par
28:52gpt image 2.0 et ici le résultat qui m'a été donné par nano banana 2
28:58donc voilà gpt image a fait énormément de progrès si on pense au premier gpt image où c'était vraiment
29:03les images jaunes
29:04qui ressortaient qui faisait tout de suite y a grillé à 1000 km on a quand même une amélioration
29:10on a aussi beaucoup plus de possibilités grâce à la compréhension des promptes
29:13beaucoup moins de restrictions sur nano banana mais pour l'aspect esthétique préférez travailler l'esthétique sur nano banana 2
29:21pour l'instant
29:22néanmoins dans le match global on peut dire que c'est une victoire de gpt image 2.0
29:28et pour finir et bien on va faire les tests viraux
29:32de ces dernières semaines qui sont apparus sur les réseaux
29:35donc on va les voir au fur et à mesure le premier que j'ai trouvé sympa c'est pour
29:39l'animation de tes personnages si tu crées un jeu vidéo tu as juste à uploader ton personnage et a
29:45demandé l'animation
29:47frame par frame complète de ton personnage pour l'action que tu souhaites par exemple ici sur une action de
29:53combat
29:53ensuite très très sympa en utilisant ton image tu peux créer une analyse
29:58colométrique pour savoir quelle couleur de vêtements va le mieux
30:01donc voici le prompt à utiliser et là juste après tu as un document complet qui va te dire ton
30:08analyse
30:09colométrique avec les vêtements qui te vont le mieux et ce que tu devrais éviter de porter donc on voit
30:15bien là je suis pas trop dedans je pense
30:18et je devrais plutôt m'orienter vers ces couleurs si
30:20j'ai essayé une deuxième fois avec un autre prompt que j'avais trouvé sur les réseaux pour avoir un
30:24petit peu plus la couleur idéale
30:27et là et là pour moi au tonne doux donc avec cette palette de couleurs idéale
30:31pour refaire ma garde de robe et surtout malheureusement moi qui adore porter des t-shirts blanc gris ou noir
30:38et ben assez mort ça ne me va pas
30:40j'ai trouvé aussi un prompt pour t'aider à trouver ton meilleur style au niveau de la coiffure le
30:45crop le kiff ou la raie
30:465 étoiles avec dégradé texture et buzz cup là plutôt en trois étoiles et je lui ai même demandé par
30:52la suite dans le workflow
30:54le même mais avec des coiffures à éviter absolu je m'en doutais un peu mais dommage pour la coupe
30:58au bol que j'aurais bien tenté mais
31:00non apparemment ça passera pas ça c'est pour tous les supporters de l'om mécontent j'ai demandé à
31:04tchat gpt s'ils pouvaient refaire
31:07le logo parce que les supporters n'étaient pas trop contents et voilà ce qui m'a sorti
31:11donc je sais pas trop ce que vous en pensez peut-être que là il a un petit peu trop
31:14complexifié mais en tout cas il a repris la base du om
31:18distinct par rapport à celle ci ensuite ça c'est l'utilisation préférée que j'ai vu et que ça
31:22peut fonctionner
31:23sur vos réseaux si vous gérez un petit club à m'acteurs et que vous voulez mettre en avant vos
31:26joueurs vous avez qu'à uploader la photo du joueur
31:29le maillot et les cuissons et demander une affiche signature en mode 4k voilà ce qu'on a
31:36cristiano ronaldo bienvenue à l'us boulogne pour la saison
31:412026 2027 et franchement en termes de détails c'est super on voit le tifo dans les tribunes
31:46on voit l'ambiance la tête de ronaldo bon j'avais pas pris la meilleure photo de base mais en
31:51tout cas ça a été bien repris
31:53mais ça peut être grave sympa à l'utiliser à l'échelle amateur pour votre club de foot
31:58ou votre club de sport en général et puis même si vous faites pas du sport vous pouvez créer des
32:03affiches originales
32:04par exemple celle ci en mode glamour urbain en mode détaillant un maximum votre prompte et en ayant vraiment des
32:11résultats assez
32:12surprenants et puis les dernières utilisations que j'ai eu de gpt images et qui m'ont bien servi c
32:17'est à travers cette vidéo pour pouvoir illustrer
32:19tout ce que vous avez vu au cours de la vidéo
32:22donc il m'a généré des images que j'ai pu modifier
32:25facilement et le fait d'avoir le rendu texte qui est parfait à chaque fois et la compréhension surtout des
32:31promptes
32:31ça facilite énormément le travail et le workflow ce qui permet d'aller vite et de ne pas passer trop
32:37de temps sur la génération
32:39entre temps j'ai vu aussi la création des grands titres de faux jeux
32:42et avec la combinaison de site dream on peut faire des petites maquettes comme ça de fausses bandes annonces de
32:48jeux vidéo qui sont très très sympa
32:50ça c'est quelque chose qu'on va voir énormément si on a une idée précise qu'on souhaite la
32:54mettre en scène
32:58Et enfin dans mon workflow j'ai généré la miniature de cette vidéo à noter que j'ai demandé des
33:04détails
33:04précis à chaque fois des petites modifications et que quand même j'avoue
33:09entre mon image une on voit où mon personnage était un petit peu plus net va dans le workflow sur
33:15l'image 4
33:15on voit que ça commence à baver un petit peu ça c'est vraiment un petit souci je pense qu
33:22'on avait aussi sur nano banana c'est que
33:25généralement quand on demande et redemande de faire quelque chose il ya une légère
33:29dégradation donc ne pas hésiter à recommencer une conversation même si c'est agréable de travailler dans le workflow et
33:34sinon ouais
33:35j'ai péter image 2.0 gagne sur tous les fronts peut-être peut-être au niveau de l'esthétique
33:40j'ai toujours une préférence sur nano banana 2
33:43la grosse combinaison du moment
33:45j'ai péter image 2.0 avec sit dance 2.0
33:49en attendant bien sûr
33:51dans quelques temps je pense les nouvelles annonces de google et pourquoi pas un anneau banana 3 et un video
33:574
33:57en tout cas en commentaire n'hésite pas à me dire ce que tu en penses de ton côté n
34:01'hésite pas à me demander aussi si tu as besoin
34:02d'un prompt en particulier je te répondrai avec celui ci merci d'avoir suivi cette vidéo c'était marco
34:08et je te dis à très bientôt sur le labo des réseaux pour
34:10d'autres tutos autour de l'ia de la création de contenu et des réseaux sociaux
Commentaires