Google Gemini dévoile ses nouveaux outils d'édition d'images alimentés par l'IA

Google Gemini dévoile ses nouveaux outils d'édition d'images alimentés par l'IA

Google franchit une nouvelle étape avec Gemini en déployant des fonctionnalités d'édition d'images particulièrement innovantes. Ces nouveaux outils, développés par l'équipe DeepMind, sont disponibles dès aujourd'hui dans l'application Gemini et promettent de transformer notre façon de créer et modifier des visuels.

Un filigrane automatique pour plus de transparence

Toutes les images générées ou modifiées par Gemini portent désormais un filigrane visible et numérique. Cette mesure permet d'identifier clairement le contenu créé par intelligence artificielle, répondant ainsi aux préoccupations croissantes autour de l'authenticité des contenus visuels.

Des personnages cohérents à travers les modifications

L'une des principales avancées concerne la cohérence des personnages humains. Le nouveau modèle maintient l'apparence des personnes même après plusieurs modifications de l'environnement ou des vêtements. Concrètement, vous pouvez télécharger une photo de vous-même et la placer dans différents décors ou tenues tout en conservant vos traits caractéristiques.

Des options d'édition plus poussées

Les nouvelles fonctionnalités offrent trois possibilités majeures :

La fusion d'images existantes pour créer une scène inédite, permettant de combiner des éléments visuels provenant de sources différentes.

L'utilisation d'éléments visuels d'une image comme base pour générer de nouveaux contenus, transformant ainsi un détail en point de départ créatif.

L'édition séquentielle multi-étapes, qui permet de modifier différents composants d'une image successivement sans perdre les changements précédents.

Un retour après une pause forcée

Il faut rappeler que la génération d'images de personnes avait été suspendue pendant plusieurs mois l'année dernière. Cette interruption faisait suite à des problèmes de diversité inappropriée dans les représentations historiques générées par l'IA. Google avait alors corrigé ces dysfonctionnements avant de relancer cette fonctionnalité avec le modèle Imagen 3.

Ces nouvelles capacités d'édition marquent une évolution significative dans l'accessibilité des outils de création visuelle alimentés par l'intelligence artificielle, rendant des techniques jadis réservées aux professionnels disponibles au grand public.

Anthony Rodier
A propos de l'auteur

Anthony Rodier

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.