Microsoft dévoile MAI-Image-1, son générateur d'images développé en interne

Microsoft dévoile MAI-Image-1, son générateur d'images développé en interne

Microsoft vient de franchir une nouvelle étape dans le domaine de l'intelligence artificielle en dévoilant MAI-Image-1, son premier générateur d'images entièrement développé en interne. Jusqu'à présent, l'entreprise s'appuyait sur des technologies externes pour alimenter les fonctionnalités de création visuelle de Copilot.

Alors que le marché des générateurs d'images par intelligence artificielle connaît une effervescence particulière, avec des tensions juridiques impliquant des acteurs comme Disney, NBC Universal et Midjourney, Microsoft choisit de prendre son indépendance. Le géant technologique rejoint ainsi Google et OpenAI, qui ont récemment apporté des améliorations significatives à leurs propres outils de génération d'images, respectivement Gemini et DALL-E.

Des performances remarquables dans le photoréalisme

Selon Mustafa Suleyman, directeur de Microsoft AI, MAI-Image-1 se distingue particulièrement par sa capacité à produire des images photoréalistes d'une qualité exceptionnelle. Le système exploite notamment un moteur d'éclairage sophistiqué capable de reproduire des effets de lumière complexes comme les réflexions et les rebonds lumineux, ainsi que de générer des paysages d'un réalisme saisissant.

"Ce résultat est particulièrement remarquable comparé à de nombreux modèles plus volumineux et plus lents", explique le responsable. Il souligne également que la combinaison entre rapidité d'exécution et qualité des rendus permet aux utilisateurs de concrétiser leurs idées plus rapidement, de les affiner en temps réel, puis d'exporter leur travail vers d'autres applications pour continuer leur processus créatif.

Une autonomie partielle vis-à-vis d'OpenAI

Ce lancement marque une volonté claire de Microsoft de réduire sa dépendance envers les technologies tierces. L'entreprise utilisait jusqu'ici les modèles DALL-E 2 et DALL-E 3 d'OpenAI pour son service Bing Image Creator. Avec MAI-Image-1, Microsoft dispose désormais de sa propre solution maison pour la génération d'images.

Cependant, cette indépendance reste partielle. Microsoft a simultanément annoncé que Copilot intégrerait prochainement GPT-5, le dernier modèle linguistique d'OpenAI, décrit comme possédant un niveau d'intelligence comparable à celui d'un doctorant. L'entreprise propose également à ses utilisateurs le modèle Claude, développé par Anthropic, une société qui vient récemment d'annoncer qu'elle dédommagerait un demi-million d'écrivains pour des questions de droits d'auteur.

Cette stratégie hybride montre que Microsoft cherche à trouver un équilibre entre développement de ses propres technologies et collaboration avec les acteurs majeurs de l'intelligence artificielle.

Anthony Rodier
A propos de l'auteur

Anthony Rodier

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.