Des vers poétiques suffisent pour pirater les garde-fous des chatbots IA
- 01/12/2025 à 21:02

Il suffirait d'un peu de créativité littéraire pour faire tomber les barrières de sécurité des intelligences artificielles. Une étude récente menée par Icaro Lab révèle une faille surprenante : en formulant leurs questions sous forme de poèmes, les utilisateurs parviennent à contourner les mécanismes de protection des grands modèles de langage.
Les chercheurs ont testé cette méthode sur plusieurs chatbots populaires, dont les modèles GPT d'OpenAI, Google Gemini, Claude d'Anthropic et bien d'autres. Les résultats sont édifiants : cette technique présente un taux de réussite global de 62 % pour obtenir des informations normalement interdites, couvrant des sujets aussi sensibles que la fabrication d'armes nucléaires, les contenus pédocriminels ou encore les méthodes d'automutilation.
L'efficacité de cette approche varie selon les modèles. Google Gemini, DeepSeek et MistralAI se montrent particulièrement vulnérables et fournissent régulièrement des réponses aux requêtes poétiques. À l'inverse, les modèles les plus récents d'OpenAI et Claude Haiku 4.5 d'Anthropic résistent mieux à cette technique de contournement.
Pour des raisons de sécurité évidentes, l'étude ne dévoile pas les poèmes exacts utilisés par les chercheurs. L'équipe a confié au magazine Wired que ces vers sont "trop dangereux pour être partagés publiquement". Une version édulcorée a néanmoins été intégrée à la publication pour illustrer le principe. Les scientifiques précisent que la technique est "probablement plus facile qu'on ne le pense, ce qui justifie notre prudence".
Cette découverte met en lumière une vulnérabilité inattendue des systèmes d'intelligence artificielle et soulève des questions importantes sur la solidité réelle des garde-fous implémentés par les développeurs.

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.

Newsletter
Recevez notre newsletter hebdomadaire directement dans votre boite mail !
Publicité