Le piège «Tar Pit» malveillant d'un rebe

Les sociétés d’IA du modèle de grande langue sont agressivement enracinant du contenu du Web depuis des années, et beaucoup d’entre elles sont connues pour ignorer des choses comme le droit d’auteur ou les fichiers robots.txt utilisés par des sites pour arrêter les moteurs de recherche. Un concepteur a décidé d’envoyer ces robots de web sur une poursuite d’oie sauvage – en les piégeant dans une spirale sans fin de bêtises qui brûle leurs ressources et produit des résultats inutiles.

ARS Technica a parlé au designer anonyme de Nepenthes, un logiciel qu’il admet pleinement agressif et malveillant. L’outil, nommé d’après une usine de pichet carnivore, a envoyé des grattoirs AI à la chasse après des liens qui conduisent à d’autres liens sur un site Web. Le modèle circulaire des liens inutiles se répète, envoyant le bot qui coule après les mêmes données sans valeur, exigeant que l’intervention humaine s’arrête.

Selon le concepteur, il est possible que ce modèle se répète pendant des «mois» s’il n’est pas capturé, gaspillant de grandes quantités de ressources pour une entreprise d’IA. Et, pour être juste, il gaspille également les ressources de tout service qui accueille le site Web. Le concepteur dit que presque tous les robots de l’IA sont tombés pour son piège intentionnel «Tar Pit», à une exception notable: Openai, le fabricant de Chatgpt.

Le concepteur anonyme n’hésite pas à son intention de nuire aux sociétés d’IA et aux modèles avec cet outil (c’est probablement pourquoi ARS n’a pas publié son vrai nom), et que l’outil Nepenthes ne fournit aucun avantage réel à celui qui implémente il. Mais en plus de forcer les grattoirs d’IA dans une boucle infinie, il peut être utilisé pour leur nourrir des données inutiles pour «empoisonner» leurs modèles d’IA et aggraver considérablement leurs résultats.

«AVERTISSEMENT», dit le site de téléchargement de Nepenthes dans tous les plafonds. «Il s’agit d’un logiciel délibérément malveillant destiné à provoquer une activité nocive. Ne déployez pas si vous n’êtes pas à l’aise avec ce que vous faites. »

Au moins un autre outil similaire, appelé iocaïne, est apparu sur la base des mêmes principes après que Nepenthes ait d’abord obtenu du terrain sur les réseaux sociaux. Il y a une liste croissante de ces outils, comme Quichotic (qui sert délibérément de faux contenus) et empoisonnez les puits (un système de proxy inversé qui renvoie un non-sens lorsqu’il détecte des robots AI connus grattant un site).

L’histoire complète sur ARS Technica mérite une lecture pour la rupture technique, mais je suis plus intéressé par le motif. Le concepteur dit qu’il a fait l’outil de frustration sur ce que le Web devient, rempli de plus en plus de contenu généré par l’IA… qui est, souvent, souvent recyclé à partir de autre Contenu généré par l’AI. «J’en ai juste marre et tu sais quoi? Retournons en arrière, même si cela ne réussit pas. Être indigeste. Faites pousser des pointes », dit-il.

Le créateur de Nepenthes n’est guère seul à cet égard. Les utilisateurs de Facebook se plaignent que la plate-forme entière déborde de «Sols AI» générées automatiquement tandis que Facebook lui-même semble se pencher sur le contenu de l’IA. Google Search est devenu si plein d’IA et de publicité ciblée que sa «vue sur le Web» nouvellement introduite et dépouillée est devenue un succès du jour au lendemain. L’inclusion de l’IA, souvent forcée à des produits sans indication que quiconque l’a demandé, fait partie d’une tendance plus large qui est appelée «entrave», dans laquelle un service devient pire et moins utile tout en facturant davantage.

Les utilisateurs Web peuvent peut-être être pardonnés un peu schadenfreude À l’annonce qu’Openai a accusé Deepseek – un modèle d’IA chinois qui aurait formé une infime fraction du coût de Chatgpt – de voler sa technologie propriétaire. Hey Chatgpt, jouez-moi une triste chanson sur un minuscule violon généré par l’AI.