Nano Banana Pro (Gemini 3 “thinking”) franchit un cap en génération d’images : mise en page, typographie nette, infographies lisibles et cohérence visuelle. Dans cet article, je détaille pourquoi ça marche, comment structurer des prompts “brief design”, et je partage une série de cas d’usage concrets (schémas, BD, traduction sur image, amélioration photo, dashboards…).

Depuis la sortie de Nano Banana pro qui utilise le modèle de raisonnement Gemini 3, on a passé un cap dans la génération des images IA.
Ce cap, il permet d’exploiter l’IA dans la création de contenu et je vais vous partager une série d’exemples concrets. Juste avant, je voulais revenir sur 2 points :
Pour rappel, si vous souhaitez utiliser Nano Banana Pro, vous pouvez passer par Gemini, puis sélectionner “Create Image” avec le modèle “thinking”.

Le problème avec les anciens modèles venait de l’incapacité à respecter les contraintes de notre environnement, structurelles et logiques, autrement dit à raisonner visuellement.
Ici, avec l’utilisation d’un modèle de raisonnement pendant la génération, on contraint la génération d’image pour respecter l’agencement spatial et la relation logique entre les éléments visuels.
Le modèle utilise des logiques de génération différentes en fonction du prompt et réussit à produire des artefacts visuels structurés, sémantiquement cohérents (un peu moins bien en français) et visuellement lisibles.
Comme on va le voir, le modèle est aussi capable de gérer la :
Google a précisé que le modèle était beaucoup moins bon lorsque la demande était courte et vague, du type “créer une infographie”, et qu’il fallait plutôt générer des instructions complètes, très précises, comme si on le partageait à un stagiaire expert en design mais qui commence son premier jour.
Mais, pour générer des instructions avancées, autant utiliser l’IA et un assistant qui va élaborer un brief complet. (cet assistant se base sur les recommandations officielles de Google)
Je l’ai créé sur chatGPT, disponible à tous, gratuitement, il vous sort un prompt optimisé en anglais sur un format textuel et un format JSON (plus efficace). Voici le lien de l’assistant :

Par exemple, ici les 2 résultats sur Gemini avec le prompt textuel et JSON :

En général, il est pertinent de structurer votre prompt avec :
Vous avez peut-être remarqué sur LinkedIn une augmentation des infographies, des diagrammes, de tableaux de bord, .. qui sont générés par l’IA. Alors que normalement, il faut compter facilement 100 à 200€ pour une feuille volante complète sur un sujet.
Voici quelques exemples que je partage pour vous montrer le champ des possibles :
Un schéma sur comment un LLM prédit le prochain mot :

Passer d’un post sur X plutôt complexe à un schéma digne de l’explication d’un professeur sur un tableau (en anglais)

Générer un morceau de BD avec cohérence des scènes (et sans faute)

Traduire un contenu directement sur l’image

Transformer une photo floue fournie en une photo ultra-nette et réaliste sans modifier la composition ni les objets.

Créer une image avec les différents éléments qui composent la chaussure de gauche. Disposer les éléments individuellement sur une surface neutre.

Ajouter des yeux globuleux illustrés et coller des mains sur (l’objet/l’animal/votre meilleur ami) dans une pose comique exagérée.

Générer une carte de Paris avec des monuments en 3D

Les possibilités sont super larges sur la partie génération d’images
Ici une petite démo sur la génération de slides sur Gemini en partageant simplement une étude. L’utilisation de nano banana est mineure ici mais c’était l’occasion de vous partager ce cas d’usage.
Dernièrement, j’ai partagé sur LinkedIn comment vous pouvez générer des photos de vous gratuitement.
C’est souvent une galère d’avoir une belle photo, à jour de soi : tenue correcte, lumière approximative, 12 poses forcées qui ne ressemblent à rien… Et au final, une photo “ok”, choisie par défaut.
Maintenant, on a l’IA qui change notre rapport à l’image : on choisit le style en restant derrière notre écran.
Voici comment faire la même chose :
(Conseil : utiliser une photo prise face caméra, avec un fond simple)


