Nouvelle version de Grok : quand l'IA traite aussi les images

Nouvelle version de Grok : quand l'IA traite aussi les images

xAI, une boîte fondée par Elon Musk et qui fait concurrence à OpenAI, vient de lancer une petite révolution avec Grok-1.5V. C'est la première mouture de leur modèle d'IA multimodale capable de jongler avec les infos visuelles. Imagine un peu : non seulement elle déchiffre le texte, mais aussi les documents, les graphiques, les captures d'écran et même les photos.

Le truc cool avec Grok-1.5V, c’est que tu peux lui montrer, par exemple, un organigramme en photo et lui demander de te le traduire en code Python. Tu peux aussi lui filer un dessin et lui demander de te pondre une histoire, ou encore lui présenter un mème que t'arrives pas à piger et il te l'explique. Parce que, soyons honnêtes, on n'attrape pas toutes les subtilités que l'internet nous balance.

Cette nouveauté arrive juste quelques semaines après la présentation de Grok-1.5, un modèle surtout boosté pour le codage et les maths, et qui pouvait gérer des contextes plus longs pour mieux fouiller dans les données et comprendre ce qu'on lui demande. xAI annonce que ses testeurs et utilisateurs habituels pourront bientôt bénéficier des prouesses de Grok-1.5V, même s'ils n'ont pas précisé quand exactement.

En plus de ça, la boîte a lancé un nouveau benchmark, baptisé RealWorldQA. Avec ce set de 700 images, tu peux tester la capacité des modèles d'IA à répondre à des questions piégeuses, avec des réponses faciles à vérifier. Et devine quoi ? Lors des tests avec RealWorldQA, la technologie de xAI a raflé le score le plus élevé, se plaçant devant des concurrents comme le GPT-4V d'OpenAI ou le Google Gemini Pro 1.5.

Source : xAI

Anthony Rodier
A propos de l'auteur

Anthony Rodier

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.