Des chercheurs ont créé une intelligence artificielle capable de pirater ChatGPT et Google Bard !

Publié le 02 janv. 2024 à 16:01

Des chercheurs de Singapour ont trouvé une méthode pour débloquer les bridages de ChatGPT et Google Bard afin d’obtenir des réponses comportant des contenus malveillants et normalement non autorisés par les chatbots.

Libérer ChatGPT ou Google Bard de leurs carcans pour les compromettre à partir d’un autre chatbot, c’est ce que sont parvenus à faire des chercheurs en informatique de l’Université technologique Nanyang (NTU) de Singapour. L’opération repose sur le même principe que celui du « jailbreak » d’un smartphone en déverrouillant les sécurités et bridages de l’intelligence artificielle (IA). Pour arriver à leur fin et pouvoir générer du contenu normalement interdit car malveillant, avec ChatGPT ou bien Google Bard, les chercheurs ont développé leur propre chatbot dédié au jailbreak. Les scientifiques ont baptisé leur technique Masterkey. Ils ont d’abord réalisé de la rétro-ingénierie des chatbots les plus populaires pour comprendre comment ils se défendaient contre les requêtes malveillantes. En fait, ils ont pu constater que pour brider les réponses, les développeurs ajoutent des mots-clés ou des expressions précises pour déterminer si une requête peut s’avérer illicite. En partant de ce constat, le contournement utilisé par le chatbot n’a pas été aussi compliqué que…

> Lire la suite sur Futura

Par Sylvain Biget, Journaliste

Lire la suite sur Futura-Sciences

Dans la même rubrique

L’Apple Vision Pro plus léger et moins cher pourrait arriver plus tôt que prévu

Des chercheurs ont créé une intelligence artificielle capable de pirater ChatGPT et Google Bard !

Dans la même rubrique

L’Apple Vision Pro plus léger et moins cher pourrait arriver plus tôt que prévu

Le Samsung Galaxy Z Fold 7 pourrait être le smartphone pliable le plus fin jamais conçu

L’Apple iPhone 20 pourrait être l’iPhone le plus cher jamais produit

The Last of Us saison 2 : des changements audacieux mais fidèles