L'IA de Microsoft transforme les photos en vidéos réalistes

L'IA de Microsoft transforme les photos en vidéos réalistes

Vous n'allez pas en croire vos yeux ! Microsoft Research Asia vient de lever le voile sur un outil expérimental d'IA, baptisé VASA-1, capable de donner vie à une simple photo. Imaginez : vous prenez une image fixe d'une personne, ou même un dessin, vous y ajoutez un fichier audio, et pouf ! Vous avez un visage qui parle et qui exprime des émotions en temps réel. Les mouvements des lèvres et de la tête sont synchronisés avec le son, que ce soit pour un discours ou une chanson. Les chercheurs ont mis en ligne plein d'exemples, et franchement, c'est bluffant. On pourrait presque croire à de vraies vidéos !

Bon, en y regardant de plus près, on remarque que les mouvements peuvent encore sembler un peu robotiques. Mais le hic, c'est que cette technologie pourrait être détournée pour créer très facilement des vidéos deepfake. Les chercheurs en sont conscients et ont préféré jouer la carte de la prudence : pas de démo en ligne, ni d'API, ni de produit commercialisé pour le moment. Ils attendent d'être sûrs que leur bébé sera utilisé à bon escient et dans le respect des règles.

Malgré ces risques, les avantages sont énormes. L'équipe derrière VASA-1 pense que cette techno pourrait révolutionner l'éducation en rendant l'apprentissage plus accessible. Elle pourrait aussi aider les personnes ayant des difficultés de communication en leur offrant un avatar pour parler à leur place. Et ce n'est pas tout : elle pourrait offrir compagnie et soutien thérapeutique à ceux qui en ont besoin.

Entraîné avec le VoxCeleb2 Dataset, qui inclut plus d'un million de paroles de célébrités issues de vidéos YouTube, VASA-1 fonctionne aussi avec des œuvres d'art, comme une photo de la Joconde à laquelle les chercheurs ont ajouté un extrait audio d'Anne Hathaway. Un vrai régal pour les yeux et les oreilles, même si vous êtes sceptique sur l'utilité d'une telle technologie !

Anthony Rodier
A propos de l'auteur

Anthony Rodier

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.