Vous connaissez déjà les IA génératives de texte ou d’images. Que vous utilisiez votre ordinateur ou votre smartphone, aujourd’hui ces portails sont accessibles à tout le monde, et gratuitement pour un nombre de « tokens » maximum par jour.
Inutile de les citer, ces sites internet ou ces applications mobiles sont rentrées dans le langage courant.
Moi qui suis plutôt visuel, il y a un nouveau service d’image avec l’Intelligence Artificielle que j’ai découvert à la fin de cet été : Nano Banana.
Une appellation plutôt amusante qui cache derrière ce nom une avancée majeure dans la génération de visuels.
Ce qui est nouveau et particulièrement performant dans ce nouveau modèle, c’est la cohérence.
Mais d’où vient Nano Banana ?
Et on voit que Google n’a pas dit son dernier mot …
Google a lancé son nouvel outil nommé Banana Nano dans Gemini. L’objectif : concurrencer Photoshop et les autres outils de retouche photo. Avec de simples prompts, vous pouvez modifier les photos à volonté, sans avoir à passer du temps sur un logiciel de retouche photo parfois difficile à maîtriser.
Dans Gemini 2.5 Flash image-preview, Banana Nano permet de corriger, retoucher, modifier une image avec de simples demandes textuelles. Vous n’avez plus besoin de connaitre les interfaces, parfois très complexes, des logiciels de retouche.
Et alors de quoi est-il capable ?
La première fois que j’ai testé Nano Banana, je l’ai fait sur ma photo de profil.
Moi qui voulais savoir à quoi je ressemblais avec une moustache, c’était une bonne occasion de le savoir.
Je lui ai juste demandé de rajouter des moustaches au portrait mis en pièce-jointe.
Et voici le résultat !
J’ai photographié ma liseuse posée sur mon bureau.
Et j’ai écrit le prompt suivant : « enlève la texture autour de la liseuse«
Puis j’ai continué avec ceci : « Tu vas composer une image où l’on retrouve la liseuse posée sur une table basse, sur une plage de sable blanc avec la mer comme horizon«
Et : « Fais une ambiance exotique avec palmiers, table basse en bambou. Des ombres sur la table et la liseuse. Il y aura des cocktails sur la table«
Enfin : « Tu intègreras dans la scène le personnage dans la photo jointe* La personne sera allongée sur une chaise longue; une liseuse dans les mains. Il faut que son visage soit reconnaissable avec sa moustache.«
*La photo jointe étant ma photo de profil afublée d’une moustache.
Les ombres sur la liseuse, la direction de la lumière, le personnage, tous les éléments sont cohérents les uns avec les autres.
Cohérence !
Cette cohérence visuelle est, à mon sens, la marque de fabrique de cette IA générative. Elle comprend et garde le contexte ainsi que l’identité générale à chaque nouvelle génération d’image, et tout cela avec une rapidité étonnante.
Facilité d’exécution & rapidité bluffante.
C’est un outil ouvert à tout-e-s, avec un avantage certain si l’on parle anglais.
A la date d’aujourd’hui, Nano Banana saisi mieux les nuances syntaxique en anglais plutôt qu’en français.
Malgré tout, l’utilisation du français reste très performante quant aux résultats.
Second bémol concernant la génération de texte où le modèle n’est pas encore optimisé.
En exemple, la citation tronquée de : « la lecture, c’est pas mal … ».
Voir l’image ci-contre.
Avec toutes ces possibilités se posent désormais des questions sur la production de visuels pour les réseaux sociaux mais aussi pour les illustrations destinées aux sites internet et autres e-commerces.
Une belle réflexion sur ces problématiques dans cet article.
Mais c’est aussi une nouvelle façon de s’approprier des outils du moment (et cela évolue très très vite).
De remettre en question nos usages et nos habitudes pour créer de nouveaux processus.
La possibilité de fusionner plusieurs images issues d’un « pack-shot maison » est infinie pour les commerçants par exemple.
Et si c’était le moment pour PANDA TRIBU de s’emparer de Nano Banana et proposer des formations avec ce modèle IA … ?
