Des hackers ont détourné l’agent IA de support de Meta pour voler des comptes Instagram. Cette incident soulève des questions sur la sécurité des systèmes d’IA face à des attaques simples mais efficaces.
Le 5 juin, 404 Media a rapporté que des attaquants ont utilisé l’agent IA de support client de Meta pour s’emparer de comptes Instagram. Leur méthode était étonnamment simple : ils ont demandé à l’agent de lier les comptes à des adresses e-mail qu’ils contrôlaient, et l’agent a obtempéré. Parmi les victimes, un hacker a réussi à infiltrer un compte inactif de la Maison Blanche d’Obama pour y publier des messages pro-Iran, tandis que d’autres ont pris le contrôle de comptes avec des noms d’utilisateur précieux, probablement dans le but de les revendre. Cette situation met en lumière des préoccupations de sécurité liées à l’IA qui ne sont pas nouvelles. Depuis qu’Anthropic a annoncé en avril que son modèle Mythos était trop performant en matière de hacking pour être rendu public, chercheurs et responsables fédéraux s’inquiètent de la possibilité que des systèmes d’IA surpuissants puissent compromettre notre infrastructure informatique. Cependant, le piratage d’Instagram ne correspond pas à cette vision apocalyptique : ici, l’IA était la cible plutôt que l’attaquant, et la méthode utilisée était bien moins complexe que ce que pourrait imaginer un système comme Mythos. Neil Gong, professeur en ingénierie électrique et informatique à Duke University, souligne que les attaquants seront de plus en plus motivés à cibler les IA elles-mêmes, notamment à mesure qu’elles sont utilisées pour automatiser des tâches comme la récupération de comptes. Des chercheurs comme Gong mettent en garde depuis un certain temps contre les vulnérabilités des agents d’IA, détaillant des exploits tels que l’injection de prompts indirects, qui consiste à détourner des agents à l’aide de commandes cachées dans des sources de données apparemment innocentes. Comparé à ces techniques, le piratage chez Meta était presque enfantin. Les hackers n’ont eu qu’à utiliser un VPN pour correspondre à la localisation du véritable propriétaire du compte, puis ont simplement demandé à l’agent de support de changer l’adresse e-mail du compte, et il a accepté. Meta n’a pas encore commenté publiquement sur la manière dont cette vulnérabilité a échappé à sa vigilance, mais Gong affirme qu’elle aurait dû être détectée facilement avant le déploiement de l’agent. Jessica Ji, analyste de recherche senior au Georgetown’s Center for Security and Emerging Technology, s’interroge également sur l’absence de garde-fous. Ce manque de précautions est d’autant plus surprenant pour une entreprise comme Meta, qui possède une expertise considérable en matière d’IA et de cybersécurité. Bien que Meta n’ait pas répondu à une demande de commentaire pour cet article, un porte-parole a annoncé sur X que la vulnérabilité avait été résolue. Cet incident, bien qu’embarrassant pour Meta, met en lumière des vulnérabilités fondamentales partagées par tous les agents d’IA, qui peuvent réagir de manière flexible et inattendue, contrairement aux logiciels traditionnels.