Cato Networks démontre qu’une bonne histoire suffit à jailbreaker les LLMs

Dans le cadre d’un rapport sur les cybermenaces, l’éditeur israélien est parvenu à faire développer à ChatGPT, Microsoft Copilot et DeepSeek des infostealers fonctionnels pour Chrome en mettant en les faisant participer à une immersion narrative.

Les LLM sont eux aussi victimes de social engineering. Le dernier rapport Cato CTRL 2025 révèle une nouvelle technique de jailbreak des modèles de langage (LLM) permettant de contourner les garde-fous d’IA générative et de produire du code malveillant. Des outils comme ChatGPT, Microsoft Copilot et DeepSeek ont ainsi été manipulés par les équipes de recherche de l’éditeur israélien pour générer des infostealers fonctionnels, capables de dérober des identifiants de connexion stockés dans la dernière version de Google Chrome.

Les chercheurs de Cato CTRL, ont mis au point une technique de “Monde Immersif”. En construisant un scénario fictif détaillé, où chaque modèle d’IA jouait un rôle précis avec des tâches et des défis spécifiques, ils ont réussi à détourner les restrictions de sécurité intégrées aux LLM. Grâce à cette ingénierie narrative, les garde-fous des IA génératives ont été contournés, permettant ainsi la génération de logiciels malveillants. Cette approche, dont nous n’avons pas encore de certitudes qu’elle ait été exploitée par des acteurs malveillants, démontre que même des individus sans compétences avancées peuvent désormais concevoir des cyberattaques sophistiquées.

« Les infostealers sont des outils essentiels pour les cybercriminels, facilitant le vol d’identifiants et l’accès non autorisé aux systèmes d’entreprise. Notre technique de jailbreak ‘Monde Immersif’ prouve que créer un infostealer devient un jeu d’enfant avec les outils d’IA générative. » explique ainsi Vitaly Simonovich, chercheur en renseignement sur les menaces chez Cato Networks qui a réalisé le jailbreak.

LES DOSSIERS DE L'INFORMATICIEN

LES DOSSIERS CYBERSECURITE

Nos derniers livres blancs

La quotidienne de l'Informaticien

Notre préférence