Passer au playerPasser au contenu principal
  • il y a 7 heures
Google vient de lancer Nano Banana 2, son nouveau modèle d’image officiellement nommé Gemini Image Flash 3.1.

Dans cette vidéo, on le teste en conditions réelles pour vérifier si ses promesses sont tenues : qualité d’image, vitesse de génération, cohérence, édition… On passe tout au crible.

Catégorie

🤖
Technologie
Transcription
00:00Nano Banana 2, le nouveau modèle image de Google, est disponible.
00:04De son vrai nom, Google Gemini Flash 3.1,
00:07ce modèle permet de générer des images d'une qualité comparable à l'ancien modèle Google Nano Banana Pro,
00:14mais jusqu'à 4 fois plus rapidement.
00:16Il se veut également moins gourmand en ressources, tout en conservant un niveau de rendu équivalent.
00:23Alors, selon les benchmarks, il existerait toutefois une légère nuance en termes de performance
00:27dans les classements Hello par rapport à Google Nano Banana Pro,
00:31que ce soit sur la génération à partir de textes ou l'édition d'images existantes.
00:35Néanmoins, il est plus rapide, il est plus léger,
00:38ce qui le rend particulièrement intéressant dans l'intégration d'un workflow automatisé
00:43ou via une application connectée en API.
00:45Donc, ce nouveau modèle, il remplace Nano Banana classique dans la génération d'images directement sur Gemini.
00:52Pour rappel, pour avoir accès à Gemini, il faut un compte Google,
00:55se rentre dans Gemini et ensuite, dans la barre de prompt, sélectionner Créer une image.
00:59Et à partir d'ici, sur Gemini, qu'on soit sur la version rapide, raisonnement ou pro,
01:05eh bien, pour l'instant, le modèle image par défaut sera ce nouveau modèle Google Nano Banana 2.
01:11C'est-à-dire que pour avoir accès à Google Nano Banana Pro,
01:16il faudra passer par le Google AI Studio ou notre plateforme qui permet d'utiliser plusieurs modèles
01:21comme Xfield ou ici, dans Créer une image, je peux utiliser le dernier modèle Nano Banana 2,
01:26mais aussi l'ancien modèle Nano Banana Pro.
01:29Maintenant qu'on l'a introduit, passons en revue ces nouveautés
01:32et surtout, voyons ensemble si Google est à la hauteur de ses annonces.
01:37La première nouveauté que je vois en étant sur Gemini,
01:39c'est quand on va dans Créer une image,
01:41on a une interface automatique qui s'ouvre sur la possibilité
01:45de combiner nos photos ou nos images dans des styles prédéfinis
01:49pour avancer vite sur notre workflow.
01:51Moi, par exemple, j'ai fait avec ma photo,
01:53dans un style figurine gothique, cinématique,
01:58technicolor, monochrome ou encore dessin.
02:01Ce qu'on voit, c'est que ces styles-là,
02:02appliqués à l'image ou à la photo qu'on donne à Gemini,
02:06les détails et la cohérence des visages,
02:08tout est très bien respecté.
02:10Maintenant, Google a mis en avant que ce modèle
02:12avait une connaissance plus avancée du monde
02:14et un ancrage web qui lui permet de mieux comprendre le contexte réel
02:18et de s'appuyer sur les informations actualisées
02:20pour générer des visuels plus cohérents et plus crédibles.
02:24Et ça, je peux le confirmer par cet exemple simple
02:26où j'ai demandé à Google Nano Banana 2,
02:29directement dans Gemini, de me générer une voiture.
02:32Et donc, voilà l'image générée.
02:34En termes de qualité, rien à dire, c'est du classique.
02:36Par contre, si on va dans les détails, c'est là que c'est intéressant.
02:39On voit bien que la voiture a une plaque d'immatriculation.
02:42Et surtout, si on zoome sur les panneaux
02:44et qu'on fait attention au décor,
02:46eh bien, en fait, ces villes qui sont indiquées,
02:48ce sont celles qui sont près de mon IP.
02:51Donc, si vous faites l'exercice de votre côté,
02:53eh bien, vous aurez des détails qui correspondent
02:55à votre adresse IP.
02:57Ensuite, Google annonce un texte un petit peu plus précis
03:00et lisible, ainsi qu'une traduction améliorée.
03:03Meilleur intégration du texte dans les images affichées et mock-up.
03:06Et une orthographe fiable et une gestion plus propre des langues.
03:09Alors, pour vérifier ça, j'ai fait deux tests.
03:12Et on va dire que c'est plutôt mitigé.
03:14Donc, j'ai fait les tests sur la plateforme Xfield
03:16où j'avais accès aux deux modèles,
03:18Google Nano Banana Pro et Google Nano Banana 2.
03:22Et par exemple, j'ai donné aux deux une affiche à traduire
03:26pour pouvoir l'avoir en français.
03:27Eh bien, Google Nano Banana Pro a moins galéré à traduire l'affiche
03:32que Google Nano Banana 2.
03:34Surtout sur le plus important, le titre « Nous recrutons ».
03:37Après, si on va dans les détails, si Google Nano Banana Pro
03:40a gardé ici le nom du studio comme il était indiqué en anglais,
03:45Nano Banana 2 m'a traduit le nom du studio en français.
03:49Mais bon, si je devais choisir entre les deux,
03:50eh bien, je resterais quand même sur la version Pro
03:52pour en tout cas cet exemple-là.
03:54Sur un autre exemple, pour tester la cohérence
03:56en termes du texte et de l'orthographe,
03:59j'ai uploadé ce panneau-là, bourré de fautes d'orthographe,
04:02demandant la consigne « Améliore et corrige ».
04:05Et sur le Google Nano Banana Pro,
04:07on a bien la correction avec pas de modification.
04:11Donc l'orthographe est bon.
04:12Sur le Google Nano Banana 2,
04:14ici la compréhension a été quand même un petit peu mieux.
04:17Et on a une correction d'orthographe et une amélioration.
04:20Donc voilà, je pense que la différence dépend des exemples.
04:23En tout cas, on n'est pas sur un gap d'amélioration,
04:26mais plutôt un modèle équivalent à Google Nano Banana Pro.
04:30Sauf qu'ici, il est en 100% gratuit.
04:32Ensuite, Google nous parle de ratios supplémentaires.
04:35Alors, ces ratios supplémentaires,
04:36ils ne seront pas disponibles en présélection dans Gemini,
04:40même si on pourra les rajouter à la main.
04:42Là, il faudra plutôt se rendre sur le Google iStudio
04:44ou alors encore une fois sur une plateforme
04:46qui propose le modèle Google Nano Banana 2.
04:49Et c'est vrai qu'ici, on a vraiment tous les formats les plus connus
04:54pour pouvoir générer notre design.
04:56Et ça, ça permet une personnalisation supplémentaire,
04:58surtout si on travaille sur des maquettes spécifiques.
05:00Ensuite, on nous dit qu'il y a une meilleure cohérence des sujets
05:04jusqu'à 5 personnages et 14 éléments dans une scène.
05:08Donc pour faire le test, j'ai uploadé 5 personnages
05:11pour les mettre en scène façon animée dans un bar de Tokyo.
05:14Le résultat est très bon.
05:16L'ensemble des détails des personnages est respecté,
05:18mais aussi, force est de constater que j'ai aussi un bon résultat
05:22avec Google Nano Banana Pro,
05:24toujours en uploadant ces 5 personnages.
05:25Là où, par contre, je pense que, quand même,
05:27Nano Banana 2 a une petite amélioration dans la cohérence,
05:31c'est quand on travaille sur un seul personnage.
05:33Par exemple, ici, sur cette scène-là,
05:35j'ai uploadé ma photo et j'ai imaginé le fait de me réveiller
05:38sur une île déserte avec les vêtements déchirés.
05:41Les deux images sont très bien,
05:42mais d'un côté, Google Nano Banana Pro
05:45n'a pas refait le logo du Labo des Réseaux sur le T-shirt.
05:48C'est permis quelques libertés sur la coiffure,
05:51rien de grave,
05:53mais c'est vrai que si on compare avec le personnage
05:55généré par Nano Banana 2,
05:58eh bien là, on retrouve bien le logo,
06:00on retrouve bien la même coiffure.
06:02Donc, sur la cohérence des personnages,
06:03oui, il doit avoir un léger avantage sur cette nouvelle version.
06:07Plus important, meilleur respect des instructions.
06:09Et là, pour l'exemple,
06:10j'ai demandé de générer une grille de palette d'émotions,
06:14parce qu'en aussi, on dit que Google Nano Banana 2
06:16est meilleure sur les émotions que Google Nano Banana Pro.
06:19On va pouvoir donc tester la compréhension des prompts
06:22et les émotions en même temps.
06:23Donc, je plogue ma photo
06:24et j'ai demandé une grille 4x4 de différentes émotions.
06:28Et donc, le résultat entre les deux,
06:30c'est que Google Nano Banana 2 a bien compris la consigne
06:33et a bien mis la grille 4x4 avec les différentes émotions.
06:37Les émotions sont pas mal.
06:39Et Google Nano Banana Pro, ici,
06:42les émotions sont pas mal,
06:43mais la consigne a eu du mal à être respectée.
06:45Et là, on est sur du 3x6.
06:47Et en reprenant le test plus standard du vin et de l'horloge,
06:51donc en mettant bien le prompt,
06:53un verre de vin rempli à ras-bord
06:56et l'horloge qui indique 23h23,
06:59on a les résultats suivants.
07:01Ici, on est sur Google Nano Banana Pro,
07:04donc on a bien notre verre de vin rempli presque à ras-bord.
07:08On va dire que c'est validé.
07:09Par contre, l'horloge, on n'est pas du tout sur du 23h23.
07:11Alors que sur Nano Banana 2,
07:14le verre de vin s'est aussi validé.
07:17Et ce qui est intéressant,
07:18c'est que l'horloge nous a mis une horloge digitale.
07:21Et là, pas d'erreur possible.
07:23On est bien 23h23.
07:25Alors, je vais quand même refaire.
07:26En indiquant une horloge à aiguille,
07:29pour être sûr,
07:30et bien ici, on a eu moins de chance.
07:32Donc sur le verre de vin,
07:33on n'est pas du tout rempli à ras-bord.
07:35Et sur l'aiguille,
07:36on est à 22h24.
07:39Donc voilà, si la compréhension est améliorée,
07:42elle n'est pas encore parfaite.
07:44Enfin, on nous dit que la qualité visuelle a été améliorée,
07:48tout en rendant, bien sûr, le processus plus rapide.
07:51Alors, pour le processus plus rapide,
07:52il n'y a pas photo.
07:53Comme on est sur un modèle flash,
07:55c'est très très agréable de l'utiliser.
07:56Ça va très très vite à la génération
07:58par rapport à Google Nano Banana Pro.
08:00Après, pour le rendu global,
08:01ça dépend des situations,
08:03sur le détail, sur les lumières,
08:04sur les textures,
08:05on voit une légère amélioration.
08:07Alors, pour cela, j'ai fait deux exemples.
08:09En générant une influenceuse tech
08:11avec les deux modèles,
08:12en utilisant le même prompt,
08:13et on peut voir que
08:15Google Nano Banana Pro,
08:17c'est très bien, il n'y a rien à dire.
08:18Et ça, c'est l'image qui a été générée
08:20par Google Nano Banana 2.
08:22Et bien ici, on aura plus de détails.
08:24En fait, c'est ça.
08:25J'ai l'impression avec ce modèle-là
08:26que vraiment l'accent est mis sur les détails.
08:29Et peut-être que même si c'est impressionnant,
08:30parce que là, on voit bien les détails
08:32des fenêtres de l'ordinateur qui sont ouverts,
08:35les livres sur la bibliothèque
08:36avec beaucoup de titres,
08:37on voit les écrans de montage,
08:39les différents objectifs,
08:40le micro, le casque,
08:41mais ça fait vraiment peut-être
08:42trop de détails.
08:43Et du coup, ça casse l'immersion
08:45en termes de crédibilité
08:46sur la photo IA,
08:48par rapport à ce que
08:48Google Nano Banana Pro
08:50pouvait générer,
08:51avec moins de détails,
08:52mais donc plus de crédibilité.
08:53Après, si on se focus
08:54sur l'influenceuse,
08:56on voit, oui,
08:57que le grain de peau,
08:58il est légèrement plus naturel,
09:00tout comme la coupe de cheveux,
09:01avec le reflet aussi dans les lunettes,
09:03sur Google Nano Banana 2.
09:05Donc voilà,
09:06c'est peut-être ce côté détail
09:06qui est censé rajouter un plus,
09:08qui pour moi,
09:09selon les générations,
09:10ça peut casser un peu l'immersion.
09:12J'ai aussi essayé
09:13via des générations de moi
09:14dans des scènes d'action,
09:15pour voir la différence
09:16entre ce côté cinématique.
09:19Et là, c'est la même chose.
09:19On voit que Google Nano Banana 2
09:22apporte un petit peu plus de détails,
09:24un petit peu plus de finition.
09:25Donc avec cette volonté
09:27de rendre la scène plus crédible,
09:29mais personnellement,
09:30ce fait de vouloir travailler
09:31à fond les détails,
09:32eh bien,
09:32ça se voit qu'on est en train
09:34de générer quelque chose
09:35avec de l'IA.
09:36Donc voilà,
09:36mon avis après l'avoir testé,
09:38ce nouveau modèle,
09:39sans être une révolution,
09:40en étant flash,
09:41il permet de démocratiser
09:43la puissance de Google Nano Banana
09:45en mode gratuit,
09:46c'est-à-dire faire profiter
09:47l'expérience Google Nano Banana Pro
09:50au plus grand nombre.
09:52Et donc Google élève le standard
09:54de la génération d'images IA
09:57en mode gratuit.
09:58Cependant,
09:58pour l'instant,
09:59je regrette l'absence
10:00de Google Nano Banana Pro
10:02accessible dans Gemini,
10:04surtout quand on a un abonnement payant.
10:06Et je pense,
10:06ou du moins,
10:07j'espère que Google proposera
10:09dans peu de temps
10:09un modèle de Nano Banana 2
10:12en mode pro
10:13d'un niveau supérieur
10:14pour qu'on justifie
10:15de prendre un abonnement payant
10:17à Gemini.
10:18L'avenir nous le dira,
10:19n'hésite pas de ton côté
10:20à me laisser ton avis
10:21en commentaire
10:22si tu as testé aussi le modèle.
10:23Et je te dis à très bientôt
10:24sur le Labo des réseaux
10:25pour d'autres tutos
10:26autour de l'IA,
10:27de la création de contenu
10:28et des réseaux sociaux.
Commentaires

Recommandations