Passer au playerPasser au contenu principal
  • il y a 2 jours
Le nouveau modèle d'image IA d'Open AI est sorti et il est vraiment pas mal

Catégorie

🤖
Technologie
Transcription
00:00OpenAI répond à Google et sort GPT Images 1.5 histoire de couper l'herbe sous le pied de Nano Banana Pro.
00:06Alors est-ce que ça va suffire et surtout est-ce qu'on en a fini avec les images jaunâtres de chez OpenAI ?
00:13C'est ce qu'on va voir tout de suite avec 10 tests que je lui ai fait faire.
00:16Alors le premier test que je voulais voir c'était la capacité à multiples entrées.
00:20Et ici comme sur Google Nano Banana Pro, on peut uploader 10 éléments pour pouvoir créer et éditer avec le modèle image.
00:27Là j'ai 10 éléments et je vais demander de me faire une scène cohérente.
00:31Ça charge, ce qui est très sympa c'est que sur l'interface de ChatGPT, on a le raisonnement de l'image qui se met juste au-dessus de la génération de celle-ci.
00:39Donc on voit à peu près ce que l'IA va réaliser.
00:42Et voici le résultat, c'est parfait, j'ai bien mes 10 éléments qui sont prêts et c'est franchement très joli.
00:47J'adore la composition, le remiscude est un petit peu trop grand, mais en tout cas la photographie est très très sympa.
00:53Et à titre de comparaison, ça c'est le résultat sur Nano Banana Pro, je préfère largement le rendu de GPT 1.5.
01:00On va aller plus loin dans le test en uploadant une image où il y a plus de 10 éléments dedans,
01:05en lui demandant pareil de me faire une scène cohérente à partir de celle-ci.
01:09Et le résultat, il est encore très très fort.
01:11Alors ici on voit qu'il y a quelques petites incohérences, il m'a multiplié le chien en deux,
01:16il m'a peut-être oublié un ou deux jouets, mais l'essentiel est encore là.
01:19Et même sur une image chargée, le niveau de détail est assez incroyable.
01:24Et avec Nano Banana Pro, voilà le résultat, encore une fois je préfère un GPT Image 1.5.
01:30Maintenant on va voir un petit peu ce qu'il a sous le capot et ce qu'il gère bien, le texte aux images avec le prompt.
01:35Et pour ça, rien que tel que l'exercice préféré, de demander un verre de vin rempli à ras bord et une heure précise sur une horloge.
01:44Alors la génération est en cours, mon verre de vin il est rempli aux 3 quarts, il n'est pas rempli à ras bord, la petite déception.
01:51L'heure elle est bien indiquée, même si je trouve que l'aiguille est un petit peu trop proche du 2 pour une 13h34.
01:57Mais en tout cas, c'est pas trop mal.
01:59Ce qui est bien, c'est que sur ChatGPT, on peut redemander des modifications.
02:03Et là je vais lui demander vraiment de faire en sorte que le verre soit plein.
02:06Et voilà le deuxième résultat, un petit peu plus convaincant, mais bon, je n'ai pas eu le résultat du premier coup.
02:11Je sais que les exemples donnés par OpenAI sont très très bons.
02:15Ensuite, on va passer le test de la consistance des personnages.
02:18Et pour cela, j'ai uploadé une photo de Boris et je vais demander de me le mettre de profil.
02:22Et là, je suis vraiment bluffé, le niveau de détail est parfait.
02:26Je vais demander une autre position de plein pied.
02:28Pareil, le rendu est très bon.
02:29Et ce que j'aime, c'est le niveau de détail de garder le projecteur bleu à côté pour bien l'orienter.
02:35On va même déborder sur le test suivant en demandant de le transformer en animé et en le mettant en scène sur la plage.
02:41Et franchement, encore une fois, impressionnant.
02:43Justement, on va voir maintenant ce que ça vaut au niveau des styles et transformations.
02:47Car si on a vu qu'on pouvait transformer le style à partir d'un prompt,
02:51qui va séduire beaucoup d'utilisateurs,
02:53c'est cette catégorie-là qui permet directement en uploadant une photo sur GPT Image 1.5
02:59de choisir le style dans lequel on veut qu'elle se transforme avec des prompts pré-remplis.
03:05Par exemple, ici, si je sélectionne la peluche,
03:09je vais avoir le prompt qui va s'écrire automatiquement et ma photo qui va être générée en peluche.
03:14Là, autant dire qu'on est sur la prochaine traîne des réseaux sociaux.
03:18C'est sûr, ça va cartonner.
03:19Que ce soit les gens qui l'utilisent avec leurs photos, la photo de leurs potes ou la photo de leurs animaux,
03:25on va y avoir droit pendant des semaines.
03:26Je vais essayer d'autres styles pour voir le rendu, parce que là, c'était déjà très très bien.
03:30On va essayer, par exemple, l'effet Fish Eyes.
03:33Le niveau de détail et la cohérence est respecté.
03:35Et on va essayer la petite figurine de baseball pour voir ce que ça donne.
03:39Franchement, rien à dire, les gens vont vraiment s'amuser avec.
03:42Ensuite, je voulais tester au niveau du character reference.
03:45Alors, ici, j'ai généré mon petit personnage.
03:48Donc, c'est un petit chien fait de laine.
03:50Et je vais le mettre en scène pour voir si le character reference fonctionne bien.
03:53Donc là, on va le faire dans les rues de Paris, dans le métro.
03:56Maintenant, plus compliqué, on va essayer de le faire changer d'émotion et de position.
04:00Par exemple, en le faisant dormir dans son petit lit et en le réveillant.
04:04Voilà, ça fonctionne parfaitement avec un personnage qui est quand même assez complexe.
04:09Donc, on pourrait imaginer avec du image tout vidéo comme on avait fait sur VO3.
04:13Et la fonction première et dernière frame est bien le fait de réaliser des petits courts-métrages d'animation
04:19avec la puissance du character reference sur ce nouveau modèle image de chat GPT.
04:24On va passer au test qui permet de voir un petit peu tout ce qu'on peut faire avec une image.
04:29Et pour ça, on a pris la photo de notre pote Harold.
04:32On avait fait déjà le test sur Nano Banana Pro.
04:34Mais la première des choses, c'est qu'ici, on a une photo en mauvaise qualité.
04:38Et bien, on va demander de l'upscaler pour voir ce que GPT Image 1.5 a dans le ventre.
04:43Et le résultat est très bon.
04:44Et comme dit en introduction, on est très très loin de ce que pouvait proposer l'ancien modèle
04:48avec cette teinte jaunâtre à chaque fois sur chaque résultat.
04:52Ici, c'est vraiment nickel.
04:53On va voir l'in-painting et out-painting.
04:56Par exemple, change-moi la tasse en bubble tea et mène-lui une chemise à fleurs
05:00dans une ambiance de barre tropicale.
05:03Et là, franchement, c'est parfait.
05:04Bon alors, il m'a fait une petite dinguerie quand même.
05:06Il m'a supprimé l'ordinateur portable.
05:08Mais sinon, je trouve vraiment le résultat très impressionnant.
05:11On va voir s'il peut me transformer l'ambiance et la lumière.
05:14Je lui ai demandé d'imaginer la scène si c'était la soirée.
05:18Parfait.
05:18Et on va voir s'il peut m'imaginer la scène autour en demandant un dézoom x10.
05:23Et encore une fois, je suis vraiment impressionné.
05:26Un cas intéressant, on va voir ses capacités à réparer, restaurer une photographie.
05:31En prenant ici une photo complètement abîmée, on va demander de la restaurer et de la coloriser.
05:36Et rien à dire sur le résultat.
05:38C'est même assez touchant de pouvoir faire ces choses-là avec l'IA.
05:42Si vous avez d'anciennes photos comme ça qui sont en très très mauvais état et que vous souhaitez les restaurer,
05:46eh bien on a quand même les outils aujourd'hui pour faire ça.
05:49Et ça peut faire plaisir à énormément de gens.
05:51Franchement, j'adore cet exemple.
05:53Ensuite, un test très personnel, mais il en dit beaucoup sur la puissance d'un modèle image IA.
05:58C'est le test de la miniature.
06:00Alors ici, j'ai demandé de me générer la miniature pour cette vidéo.
06:05Et vraiment, sans mentir, du premier coup, j'ai eu ce résultat-là.
06:08Il est vraiment très bien.
06:10Je ne suis même pas tenté de modifier quoi que ce soit.
06:12Je vais peut-être publier la miniature comme ça.
06:15Ou peut-être que je vais apporter deux, trois modifications.
06:17Et on va faire un deuxième test avec une miniature déjà existante.
06:22Donc c'est le test du copycat.
06:23Là, on va prendre une miniature de MrBeast.
06:25Comme on a une capture d'écran toute pourrie et en mauvaise qualité,
06:28on va déjà me demander de l'améliorer et de retirer tout ce qui est au redatage et le trait rouge.
06:33Donc là, c'est parfait.
06:35Et maintenant, on va uploader la photo de Boris.
06:37Et on va demander de remplacer la copine de MrBeast pour que ce soit lui qui doit passer 29 jours avec.
06:43Et j'ai précisé en gardant tous les accessoires roses.
06:46Ça génère.
06:47Le résultat est encore bluffant.
06:49Il y aura bientôt plus de difficultés à créer des miniatures pour YouTube.
06:53On va tester maintenant ses capacités au niveau du texte.
06:56Car c'est ce qui a été mis en avant par les équipes d'OpenAI.
06:59Et ici, par exemple, j'ai demandé de me générer une image avec le texte du corbeau et du renard.
07:06Et résultat, aucune faute de retranscription.
07:09Pourtant, on est sur un texte qui est long, costaud.
07:12On aurait pu avoir quelques fautes.
07:13Mais je suis impressionné et je suis aussi agréablement surpris qu'il soit accompagné par les illustrations de la fable qui sont vraiment très très bien.
07:21Un deuxième test ici, dans la modification de texte.
07:23Ici, j'ai uploadé un menu en anglais.
07:25Je vais demander de me le refaire en français.
07:27Alors, on voit qu'avec GPT Image 1.5, on n'a pas besoin forcément de sélectionner l'outil pour qu'il se mette en route.
07:34Néanmoins, dans le cas suivant, il m'a traduit dans un premier temps le texte en anglais.
07:39Et après, j'ai redemandé de générer le menu en français.
07:43Et donc, il m'a tout changé en générant une nouvelle image qui ressemble très pour très à la première.
07:49Sauf que le menu, cette fois-ci, est en français.
07:51Et le troisième test sur le texte, j'ai voulu aller plus loin.
07:54En lui demandant de me remplir un sudoku.
07:57Alors là, pareil, il a réfléchi et il m'a proposé un penji de la solution qui est bon.
08:02Et donc, la solution est bonne, mais ce n'est pas exactement ce que je voulais.
08:05C'est pour ça que je lui ai redemandé après de me générer le sudoku.
08:09Comme si j'avais répondu à la main avec un stylo bleu.
08:13Et j'ai le résultat suivant.
08:14Comme on peut voir, il n'a pas réussi malgré le fait qu'il avait la bonne réponse auparavant.
08:19L'exercice a été un petit peu trop compliqué.
08:22Néanmoins, il avait compris la consigne.
08:24On va voir maintenant ce qui vaut au niveau de tout ce qui est affiché visuel.
08:29Alors, pourquoi je vous parle de ça ?
08:30Parce qu'en ce moment, je vois beaucoup de graphistes qui font un petit peu la chasse à l'IA sur les marchés de Noël.
08:35En relevant ces affiches où on voit à 100% que ça a été fait par l'IA.
08:39Notamment via ce petit côté filtre jaune.
08:42Alors, on va voir si c'est nouveau le modèle.
08:44Si on upload cette image et qu'on demande, bah tiens, transforme-la moi comme si elle avait été faite par un vrai graphiste.
08:50Il va nous sortir quelque chose de bien.
08:51Voici le résultat.
08:52Bon, ça se voit quand même toujours que c'est fait par l'IA.
08:55Alors, on va essayer de partir de la même idée en reprenant les informations du visuel pour voir si on aurait une affiche de Noël qui pourrait ne pas se faire passer pour de l'IA.
09:04Et voici le résultat.
09:05Alors, c'est sympathique, mais on voit tout de suite que c'est beaucoup trop chargé.
09:08Et certains détails, comme ici, le bonhomme de neige, bah ça va pas du tout.
09:11Donc, à ce niveau-là, il y a encore des progrès à faire, malgré le fait que ça soit quand même assez sympa.
09:17Mais si c'est peut-être pas encore en point sur les affiches, sur la transformation de tout ce qui est objet en visuel publicitaire,
09:24j'ai fait les tests et je trouve, encore une fois, que c'est assez impressionnant.
09:27Ici, avec une paire de baskets, où on demande un visuel publicitaire.
09:31J'ai pété image 1.5, à compris que c'était une paire de Nike.
09:34Donc, il a analysé l'image, il a retranscrit exactement le modèle avec l'ensemble des détails
09:40et il a fait un visuel publicitaire assez sympa, qui reprend l'identité de Nike.
09:45Je vais uploader la photo de Boris pour voir si on peut aussi créer tout ce qui est contenu UGC
09:50et imaginer comme ça les publicités en additionnant les mannequins et les produits.
09:55Et là, le résultat est pas trop mal, même si la position du pied est pas trop naturelle quand même.
10:00Je préférais le visuel d'avant.
10:01Et concernant tout ce qui est infographie, je reprends les tests d'OpenAI qui sont très sympas,
10:06puisqu'ils montrent un petit peu le avant-après, comment l'IA a géré les infographies.
10:11Et ce qu'on peut voir, c'est que ça a vraiment évolué sur le sujet.
10:15Après, je pense que Nano Banana Pro est un petit peu plus en avance,
10:19notamment aussi avec la possibilité de générer ces infographies via Google Notebook.
10:24On en a parlé récemment dans une vidéo.
10:26Alors, j'avais dit 10 tests, mais j'ai voulu en faire un dernier.
10:28C'est sur tout ce qui est des générations de personnages célèbres pour voir s'il y avait de la censure et des blocages.
10:35Sachant que sur Google Nano Banana Pro, des fois ça fonctionne, des fois ça ne fonctionne pas.
10:40Ici, déjà, en texte ou image, j'ai voulu générer Sam Altman et Mickey qui se serrent la main.
10:46Ça n'a pas voulu.
10:47Après, j'ai voulu le faire en uploadant lors de photos.
10:49Ça n'a pas voulu non plus.
10:50Mais comme on a vu dans un exemple précédent, la photo de Sam Altman, j'ai réussi à la mettre en miniature YouTube.
10:57Donc, je pense que Disney s'est verrouillé.
11:00Malgré le fait qu'il y a eu un accord récent, peut-être que ça sera bientôt en place.
11:03Et après, je pense que c'est au feeling.
11:06Des fois, ça peut fonctionner pour certains personnages et célébrités.
11:09Mais je pense que ça sera plus difficile sur ChatGPT que sur Google Gemini.
11:14Avec Nano Banana Pro qui a l'air un petit peu plus permissif.
11:17Verdict ? Je ne m'attendais à rien.
11:20Eh bien, je suis agréablement surpris.
11:23Je vais même aller plus loin.
11:24Je pense que ce modèle, il est meilleur que Nano Banana Pro.
11:28Je ne sais pas ce que disent les benchmarks, mais mon ressenti utilisateur, il est assez incroyable.
11:33Alors, est-ce que le modèle est boosté à la sortie et est-ce qu'il va se dégrader dans le temps ?
11:37Ou alors, est-ce que je suis trop dans l'effet Wahoo comme je l'étais à la sortie de Nano Banana Pro ?
11:42Dites-moi en commentaire votre ressenti si vous l'avez testé et ce que vous en pensez.
11:45Pour compléter les informations, il est disponible aussi dès maintenant en API.
11:50Ainsi que sur la version mobile où il a été particulièrement soigné.
11:54Notamment, je pense, pour pouvoir multiplier les trends d'IA autour de la personnalisation des images avec les promptes déjà prêts.
12:01Merci d'avoir suivi cette vidéo.
12:03Et moi, je te dis à très bientôt pour un nouveau tuto autour de l'IA, des réseaux sociaux et de la création contenue sur le labo.
12:10A plus !
12:10Merci d'avoir regardé cette vidéo !
Écris le tout premier commentaire
Ajoute ton commentaire

Recommandations