En résumé:
- PCWorld rapporte qu’OpenAI lance de nouvelles fonctionnalités de sécurité pour ChatGPT, notamment le mode de verrouillage et les étiquettes de risque élevé pour lutter contre les menaces croissantes.
- Le mode de verrouillage restreint les interactions externes et désactive la navigation Web pour les utilisateurs bénéficiant d’une confidentialité élevée, tandis que les étiquettes de risque indiquent clairement les fonctionnalités potentiellement dangereuses.
- Ces mises à jour traitent spécifiquement des attaques par injection d’invites dans lesquelles des invites malveillantes tentent de tromper l’IA pour qu’elle effectue des actions nuisibles.
OpenAI lance deux nouvelles fonctionnalités de sécurité dans ChatGPT pour faire face aux menaces croissantes pesant sur ses systèmes d’IA, selon un récent article de blog.
À mesure que les services d’IA se connectent de plus en plus à des parties plus larges du Web et à davantage d’applications externes, le risque de ce que l’on appelle les « attaques par injection rapide » augmente également. Une attaque par injection d’invite se produit lorsqu’une personne crée une invite trompeuse dans le but d’inciter le LLM à suivre des instructions malveillantes et/ou à révéler des informations sensibles.
L’une des nouvelles fonctionnalités de ChatGPT est le mode verrouillage, un mode de sécurité optionnel destiné aux utilisateurs ayant des exigences élevées en matière de confidentialité. Ce mode limite strictement la manière dont ChatGPT interagit avec les systèmes externes. Certains outils et fonctionnalités sont complètement désactivés et la navigation sur le Web n’est autorisée que via le contenu mis en cache au lieu des appels réseau directs. Le mode verrouillage sera d’abord disponible pour les entreprises clientes et sera ensuite lancé auprès des consommateurs dans les mois à venir.
Dans le même temps, un étiquetage des risques plus clair sera introduit, avec une étiquette uniforme portant le texte « Risque élevé » pour les fonctionnalités qui présentent un risque de sécurité accru (par exemple, celles qui donnent accès au réseau aux outils d’IA). Les étiquettes seront visibles dans ChatGPT, ChatGPT Atlas et Codex.











