Passer au playerPasser au contenu principal
  • il y a 5 mois
Dans cette vidéo, on découvre Nano BANANA, qui est en réalité Gemini 2.5 Flash Image Preview

Catégorie

🤖
Technologie
Transcription
00:00Google frappe très très fort et nous sort le meilleur modèle d'édition d'image IA au monde.
00:08Son nom Gemini 2.5 Flash Image Preview, plus connu sous le nom de code Nano Banana.
00:14Sur le papier, il bat tous les autres et en le testant, on comprend vite pourquoi.
00:19Dans cette vidéo, je te dis comment y accéder, comment l'utiliser, mais surtout les cas pratiques
00:24qui vont te montrer toute la puissance et ce que tu vas pouvoir faire avec.
00:28D'abord, pour l'utiliser, tu peux le trouver sur plusieurs plateformes.
00:32La première et celle que j'ai utilisée essentiellement pour mon tuto, c'est Google AI Studio.
00:38Ici, il suffira d'aller dans le mode Generate Media et de sélectionner le dernier modèle Gemini Native Image,
00:45Gemini 2.5 Flash Image Preview que tu vois indiqué juste ici.
00:50Tu auras le nombre de tokens disponibles et sur la droite, tu as des petits paramètres pour pouvoir générer ton édition.
00:56Sachant que tu as des paramètres de sécurité si tu veux bloquer certains contenus.
01:02Mais bon, l'IA est quand même assez bridée, tu ne pourras pas faire n'importe quoi avec.
01:06On n'est pas sur un groc.
01:07Pour l'utiliser, c'est très très simple.
01:09Ici, dans la barre de prompt, tu rentreras ce que tu souhaites t'écrire.
01:13Mais surtout, si tu veux faire de l'édition, tu pourras aller dans le petit plus
01:16et insérer à partir de ton drive, de ton ordinateur ou d'un simple média,
01:22plusieurs images ou photos pour pouvoir les combiner, les modifier.
01:26On voit ça tout de suite.
01:27Juste avant de te dire que si tu es à court de crédit sur Google AI Studio,
01:31tu peux aussi l'utiliser sur Gemini.
01:34Mais aussi de façon quasi illimitée sur le site de LM Arena.
01:38C'est d'ailleurs ici qu'il est apparu pour la première fois avec le nom de code Nano Banana.
01:42Il suffira d'aller dans le mode direct chat et de sélectionner le modèle Gemini 2.5 Flashlight Preview.
01:50Et dernière info, l'API est déjà disponible pour tous les développeurs.
01:54Maintenant, commençons nos tests et voyons ce qu'il a dans le ventre.
01:57Alors, le premier test que je vais faire passer, c'est qu'est-ce qu'il vaut en termes de compréhension simple de prompt.
02:03Et quand je dis simple, je vais plutôt mettre un prompt compliqué.
02:07Ici, une description d'une tour avec plusieurs étages.
02:09A chaque étage, on a une scène qui est détaillée.
02:12On va voir comment ce modèle réagit et ce qu'il me propose.
02:17Ça va plutôt vite.
02:18Et on a ici notre design.
02:20Alors, tout est bien respecté.
02:22À part à la fin, il me fait une confusion sur le jardin floral avec la taverne et la bibliothèque.
02:27Il me mélange à peu près tout.
02:28Mais sinon, dans l'ensemble, on a une bonne structure.
02:31Et ce qui est intéressant de voir, c'est en termes de comparaison avec d'autres modèles.
02:35Il y a qui, bon, peut-être un rendu un petit peu plus joli comme mid-journée, où là, c'est difficile de comprendre l'ensemble des prompts et de bien réorganiser les étages.
02:44Ou pour un modèle qui est censé être un petit peu moins joli, mais qui comprend mieux comme GPT-5.
02:49Là, il a eu trop du mal à me refaire les étages.
02:52Donc, point ici pour Google pour cet exercice.
02:55Ça s'annonce bien pour la suite.
02:57Et pour tout de suite, un exemple qui me tardait de tester, c'est la possibilité de créer une image à partir de plusieurs.
03:04Ici, on a uploadé notre image, l'image d'un chat et l'image de Sam Altman.
03:09Et on va rentrer simplement en prompte.
03:11Le premier homme offre le chat au second.
03:15Et franchement, le résultat est bluffant.
03:17On me reconnaît bien.
03:19On reconnaît bien le chat, même si la tête est un petit peu bizarre.
03:22Le décor a été respecté derrière.
03:24Et sur la droite, on a Sam Altman qui va recevoir en cadeau ce chat.
03:29Bon point donc.
03:30Et on peut toujours continuer le dialogue avec Lya.
03:32Par exemple, ici, on va demander de changer le fond pour faire comme si on était sur Mars.
03:36Et du coup, il m'a changé le décor.
03:38Et chose intéressante, il m'a changé aussi la lumière.
03:41En termes d'édition de retouches, c'est vraiment pas mal.
03:43On va continuer à tester ce mode ingrédient.
03:46Et j'ai vu l'exemple passer.
03:47J'ai trouvé très intéressant celui de rajouter deux photos.
03:51Mais cette fois-ci, de joindre un schéma d'instruction qu'on a dessiné à la main.
03:55Pour voir si Lya peut reproduire exactement la scène qu'on a décrite.
04:00Ici, par exemple, j'ai mis que les deux hommes se battent dans la rue.
04:04Et qu'il fallait que Lya reproduise le schéma que je lui ai joint avec.
04:09On va générer.
04:10Et là, on a un petit problème.
04:12Comme vu tout à l'heure, c'est peut-être le mot Fighting qui bloque.
04:15Donc tu vois, tu peux pas générer n'importe quoi.
04:16Mais tu peux toujours contourner avec les bons mots.
04:19Là, par exemple, on va remettre la même scène.
04:22Mais on va dire qu'il pratique les arts martiaux.
04:24On génère.
04:25Et ainsi, on a le résultat.
04:26Alors, la pose est super.
04:29Elle est bien comprise.
04:30On a aussi le décor de la rue.
04:33Mais sur les personnages, on est plutôt sur des dérivés de moi et de Sam Altman.
04:37C'est pas très ressemblant.
04:39A la limite, il faudrait que je refasse une génération avec les trois photos.
04:44Et que je dise bien, reprends les têtes de chacun.
04:47Donc ça, c'est quand même à savoir.
04:48Des fois, tu auras des résultats super.
04:49Des fois, il faudra redemander de régénérer, régénérer.
04:53Afin d'avoir exactement ce que tu souhaites.
04:56Un mode que je voulais tester dans la retouche photo,
04:59c'est la possibilité aussi de imaginer la suite d'une photo.
05:03Donc par exemple, ici, la photo d'un champ d'hôtel.
05:06Et je voudrais qu'il agrandisse cette photo en mode des zooms.
05:10Et là, il me donne le résultat suivant.
05:12Alors si ça reste très lisible, c'est quand même un petit peu incohérent.
05:16Puisque bon, il m'a mis un deuxième lit.
05:18Comme si on était sur une chambre d'hôtel avec deux lits qui sont en L.
05:23Mais bon, c'est plutôt pas mal.
05:25Et ce que je vais demander maintenant, c'est de changer l'angle de la photo.
05:28S'il est possible de m'imaginer en 180 degrés, comment serait la pièce ?
05:34Et là, j'ai le résultat suivant qui est vraiment pas mal.
05:37Avec vraiment un angle 180 degrés comme si je tournais l'appareil.
05:40Avec même cet effet un petit peu GoPro.
05:43Et ce qui est intelligent de la part de l'IA, c'est qu'elle a imaginé vraiment la chambre d'hôtel.
05:46Avec le petit bureau, la télé, la porte.
05:49Et même, on a les détails du thermostat.
05:51Donc ça, super impressionnant.
05:52Du coup, toujours dans cette notion d'édition IA.
05:55On va essayer maintenant la retouche photo en prenant une image ancienne.
06:00Et en demandant de l'upscaler et de la coloriser.
06:02Alors là, va savoir, il me bloque.
06:05Je sais pas trop pourquoi.
06:06Mais par la suite, je me suis mis sur mon VPN aux Etats-Unis.
06:10Et j'ai pas du tout été bloqué.
06:11Donc va savoir si on a encore des restrictions au niveau de l'Europe pour certaines actions.
06:15Et là, il a réussi à me recoloriser l'image.
06:18Et à l'upscaler au maximum.
06:20Donc vraiment très sympa.
06:21Maintenant, je vais lui demander des modifications.
06:23Je vais d'abord lui demander de changer de place entre la femme en bleu et la femme en vert.
06:27On va voir.
06:29Alors, il a pas réussi à aller changer de place.
06:31Mais par contre, il aura changé d'habit.
06:33Donc peut-être que j'ai pas été assez précis dans mon prompt.
06:35Mais en tout cas, il a changé les couleurs.
06:38Je vais lui demander maintenant d'enlever les enfants de la photo.
06:41Là, parfait.
06:42Il me les a parfaitement enlevés.
06:44Comme s'ils avaient jamais été dessus.
06:46Et pourquoi pas maintenant, je vais demander.
06:48Je rajoute un chat sur les genoux de la vieille dame.
06:52Et là, il m'a intégré le chat à la perfection.
06:54À ce niveau-là, cet outil, ça va devenir une usine à mèmes incroyables.
06:59On va avoir de plus en plus de dingueries sur les réseaux sociaux.
07:01Par la suite, je vais essayer maintenant de le faire appliquer des styles.
07:05Comme on avait un petit peu sur ChatGPT.
07:07Avec les styles manga et autres.
07:09Donc on va d'abord commencer avec le style animé.
07:12Ok, c'est pas trop mal.
07:14Maintenant, on va essayer avec le style Lego.
07:17Là, je suis un petit peu plus convaincu.
07:18D'autant qu'encore une fois, il a été très précis sur l'arrière-plan.
07:22Sur les petits accessoires.
07:23Il est vraiment mythiculeux sur l'analyse de la photo.
07:26Et essaye de reprendre toutes les informations de celle-ci.
07:29Maintenant, pourquoi pas en style 3D animation.
07:31Un petit peu comme les Pixar.
07:32Mais on cite pas le mot Pixar, on sait jamais.
07:34Et là, pareil, j'adore le résultat.
07:36C'est exactement ce que je voulais.
07:38Et d'ailleurs, ce rendu, ça me donne une idée.
07:40Peut-être pour la fin, pour un projet un petit peu plus complexe.
07:42On verra si j'ai le temps en fin de vidéo.
07:44D'ailleurs, en parlant de tout ce qui est style et modifications photo.
07:47Il y a des petites applications aussi qui sont disponibles directement dans les exemples sur Google AI Studio.
07:53Comme par exemple, celle-ci qui s'appelle Passed Forward.
07:57Donc on voit que celle-ci fonctionne bien avec Gemini 2.5 Flash Image.
08:01On a aussi d'autres applications, je t'invite à les tester.
08:03Mais celle-ci, pour pouvoir essayer plusieurs styles en une seule fois, c'est parfait.
08:08Il suffit d'uploader sa photo pour avoir ainsi notre personnage transporté au fil des différentes époques.
08:15Voilà, c'est assez marrant et rapide à faire.
08:18Il y a d'autres applications à découvrir.
08:20C'était la petite parenthèse avant de rebasculer sur notre texte.
08:24Et celui que j'attendais avec impatience, la possibilité d'imaginer ou de modifier du texte.
08:30Donc ici, par exemple, j'ai l'enseigne, le nom d'un restaurant, la belle époque.
08:34Je vais l'uploader sur mon Google AI Studio et je vais demander de changer le titre du restaurant en Souvenir du passé.
08:43Je génère et là, la typo a parfaitement été respectée.
08:48Le nom Souvenir du passé parfaitement marqué.
08:50Par contre, j'ai toujours l'arc de cercle qui gâche un petit peu la modification.
08:54Mais ce n'est pas grave, je vais continuer le dialogue avec mon IA.
08:56Je vais demander, retire-moi le demi-arc de cercle.
09:00Et là, parfait, j'ai une modification comme si le nom du restaurant s'appelait toujours Souvenir du passé.
09:07En termes de précision, c'est vraiment très fort et ça garde même le style d'écriture.
09:13Alors, je vais essayer aussi ici avec une miniature en demandant, est-ce que tu peux me traduire le texte en français ?
09:20Malheureusement, le résultat n'est pas 100% parfait.
09:24Il y a écrit Design 2 et puis Vignette moderne.
09:27Il s'est un petit peu foiré, mais pourquoi pas, toujours quand on a un mauvais résultat,
09:32continuer en disant, tiens, réécris-moi bien le texte.
09:36Et là, aucun défaut sur ma miniature et sur le changement de texte.
09:40Ça peut sauver des heures d'édition et pourquoi pas aussi pour ajouter du texte sur une image facilement,
09:46passer par ce Google AI Studio et ce dernier modèle.
09:49Maintenant, il n'y a plus qu'à laisser parler sa créativité.
09:52Il y a surtout des exemples qui sont en train de se multiplier sur le net et qui pourraient devenir les prochaines trends IA.
09:58Celle qui m'a plus marqué, c'est celle qui te permet de transformer n'importe quelle image en figurine.
10:03Par exemple, ici avec Bart Simpson, je trouve le rendu qui a été formidable.
10:07Et en plus, l'IA a reconnu que c'était Bart Simpson.
10:09Il m'a marqué le nom Bart Simpson en dessous.
10:11Et j'ai fait un autre essai ici avec Inox Tag.
10:14Et là aussi, pareil, le rendu est assez fou.
10:16Bon, par contre, il ne m'a pas mis le nom d'Inox Tag, mais je me demandais de changer le nom de la statuette et de rajouter Kaizen.
10:22Et là, le résultat est simplement incroyable.
10:26En termes de détails, en termes de rendu, en termes de mise en scène, je suis conquis.
10:31Alors avec tout ça, il y a une utilisation que j'étais obligé de faire pour voir ce qu'il y a dans le ventre.
10:38C'est d'additionner les outils de Google.
10:40Donc, ce nouveau modèle de Gemini 2.5 Flash Image Preview avec Vio pour pouvoir créer mon propre film d'animation.
10:47Et pour cela, tu te souviens, on avait généré le petit personnage en termes de 3D animation.
10:53Et bien, dans une conversation en entier, je vais déjà demander de le rhabiller comme si c'était un aventurier.
10:58Et je vais imaginer différentes scènes avec lui pour pouvoir les mettre en scène dans Vio 3.
11:05Par la suite, je vais passer par le mode Image to Video de Vio 3.
11:09Un petit coup de montage pour ajouter de la voix IA avec Eleven Labs.
11:14Ça, pour le faire facilement de ton côté, je te renvoie à la vidéo qu'on a fait sur le sujet.
11:18Mais surtout, ici, ce que je voulais mettre en avant, c'est que la simplicité que ça a été d'uploader un personnage,
11:24de le mettre en scène dans la même conversation sur différents plans,
11:28et surtout qu'il garde une cohérence et que l'univers garde une cohérence autour de lui.
11:33Donc, on finit sur cette petite animation que j'ai fait vraiment très rapidement en moins d'une heure.
11:37Et je t'invite à me dire en commentaire ce que tu penses, toi, de Gemini 2.5 Flash Image Preview, ou plutôt Nano Banana.
11:44C'était Marco, merci et à très bientôt sur le Labo des Réseaux.
11:47La carte du Labo des Réseaux disait donc vrai, le temple de l'IA existe bien.
11:56Je m'enfonçais dans le sombre couloir, mes pas résonnant au sol.
12:01J'étais perdu.
12:02Mais soudain, sur un mur, je vis une inscription.
12:06Trouve la banane et libère le pouvoir.
12:09J'ai besoin de trouver une banane.
12:14Banana.
12:15Banana.
12:18Je ne comprenais rien, jusqu'à ce que dans un escalier, je vis sur les murs des bananes.
12:24Ça avait l'air d'une blague.
12:26Quand soudain, je l'ai enfin trouvé.
12:30Tout le pouvoir de l'IA dans cette énorme banana.
12:33C'est parti.
Écris le tout premier commentaire
Ajoute ton commentaire

Recommandations