Génération d'images par IA : exemples concrets et conseils

Nano Banana Pro (Gemini 3 “thinking”) franchit un cap en génération d’images : mise en page, typographie nette, infographies lisibles et cohérence visuelle. Dans cet article, je détaille pourquoi ça marche, comment structurer des prompts “brief design”, et je partage une série de cas d’usage concrets (schémas, BD, traduction sur image, amélioration photo, dashboards…).

Exploiter la génération d’images par IA

Depuis la sortie de Nano Banana pro qui utilise le modèle de raisonnement Gemini 3, on a passé un cap dans la génération des images IA.

Ce cap, il permet d’exploiter l’IA dans la création de contenu et je vais vous partager une série d’exemples concrets. Juste avant, je voulais revenir sur 2 points :

  1. Pourquoi Nano Banana réussit là où les autres modèles échouent ?
  2. Comment simplifier la génération d’images avec un générateur de prompts ?

Pour rappel, si vous souhaitez utiliser Nano Banana Pro, vous pouvez passer par Gemini, puis sélectionner “Create Image” avec le modèle “thinking”.

1/ Pourquoi Nano Banana réussit là où les autres modèles échouent ?

Le problème avec les anciens modèles venait de l’incapacité à respecter les contraintes de notre environnement, structurelles et logiques, autrement dit à raisonner visuellement.

Ici, avec l’utilisation d’un modèle de raisonnement pendant la génération, on contraint la génération d’image pour respecter l’agencement spatial et la relation logique entre les éléments visuels.

Le modèle utilise des logiques de génération différentes en fonction du prompt et réussit à produire des artefacts visuels structurés, sémantiquement cohérents (un peu moins bien en français) et visuellement lisibles.

Comme on va le voir, le modèle est aussi capable de gérer la :

  • mise en page : des structures spatiales cohérentes (en conservant les grilles / hiérarchies visuelles), ce qui rend l’infographie lisible
  • typographie : écriture nette, lisible, en petit format avec une mise en forme respectée.
  • visualisation de données : convertir les chiffres en graphiques / tableau de bord, comme le ferait un tableur ou figma
  • l’univers de style : cohérence esthétique des éléments, style, palette de couleurs, capable de reconnaitre les éléments de marques (logo) et de les réutiliser.

2/ Votre générateur de prompt Nano Banana Pro

Google a précisé que le modèle était beaucoup moins bon lorsque la demande était courte et vague, du type “créer une infographie”, et qu’il fallait plutôt générer des instructions complètes, très précises, comme si on le partageait à un stagiaire expert en design mais qui commence son premier jour.

Mais, pour générer des instructions avancées, autant utiliser l’IA et un assistant qui va élaborer un brief complet. (cet assistant se base sur les recommandations officielles de Google)

Je l’ai créé sur chatGPT, disponible à tous, gratuitement, il vous sort un prompt optimisé en anglais sur un format textuel et un format JSON (plus efficace). Voici le lien de l’assistant :

Par exemple, ici les 2 résultats sur Gemini avec le prompt textuel et JSON :

En général, il est pertinent de structurer votre prompt avec :

  • le type d’image à générer (tableau de bord, page web, infographie, etc)
  • l’agencement → comment les éléments doivent être organisés sur l’image
  • la liste des composants requis
  • la liste des contraintes à la fin : “le texte doit rester net même en petite taille”, “utiliser un style d’icônes cohérent”

Les nouveaux cas d’usage

Vous avez peut-être remarqué sur LinkedIn une augmentation des infographies, des diagrammes, de tableaux de bord, .. qui sont générés par l’IA. Alors que normalement, il faut compter facilement 100 à 200€ pour une feuille volante complète sur un sujet.

Voici quelques exemples que je partage pour vous montrer le champ des possibles :

Un schéma sur comment un LLM prédit le prochain mot :

Passer d’un post sur X plutôt complexe à un schéma digne de l’explication d’un professeur sur un tableau (en anglais)

Générer un morceau de BD avec cohérence des scènes (et sans faute)

Traduire un contenu directement sur l’image

Transformer une photo floue fournie en une photo ultra-nette et réaliste sans modifier la composition ni les objets.

Créer une image avec les différents éléments qui composent la chaussure de gauche. Disposer les éléments individuellement sur une surface neutre.

Ajouter des yeux globuleux illustrés et coller des mains sur (l’objet/l’animal/votre meilleur ami) dans une pose comique exagérée.

Générer une carte de Paris avec des monuments en 3D

Les possibilités sont super larges sur la partie génération d’images

Les slides via le mode “build” de Gemini

Ici une petite démo sur la génération de slides sur Gemini en partageant simplement une étude. L’utilisation de nano banana est mineure ici mais c’était l’occasion de vous partager ce cas d’usage.

Générer une photo de vous

Dernièrement, j’ai partagé sur LinkedIn comment vous pouvez générer des photos de vous gratuitement.

C’est souvent une galère d’avoir une belle photo, à jour de soi : tenue correcte, lumière approximative, 12 poses forcées qui ne ressemblent à rien… Et au final, une photo “ok”, choisie par défaut.

Maintenant, on a l’IA qui change notre rapport à l’image : on choisit le style en restant derrière notre écran.

Voici comment faire la même chose :

  1. Ouvrir Gemini (pour utiliser nano banana)
  2. Importer une photo de vous (selfie par exemple)
  3. Coller un des prompts
  4. Choisir “Outils” et “Créer des images”, utiliser le modèle “Raisonnement”
  5. Ajuster et itérer

(Conseil : utiliser une photo prise face caméra, avec un fond simple)

No items found.