Anthropic a lancé Claude Opus 4.5, la dernière version de l’IA phare de l’entreprise. Techcrunch écrit que l’Opus 4.5 devrait fonctionner superbement dans plusieurs tests de référence, tels que SWE-Bench (codage), tau2-bench (utilisation des outils) et GPQA Diamond (résolution de problèmes). Il s’agit du premier modèle à obtenir un score supérieur à 80 % au test SWE-Bench Verified, une référence importante en matière de capacité de programmation d’un modèle.
Les nouvelles fonctionnalités incluent Claude pour Excel, une barre latérale du programme désormais disponible pour les utilisateurs Max, Team et Enterprise. Il prend en charge les tableaux croisés dynamiques, les graphiques et les téléchargements de fichiers. Parallèlement, Claude pour Chrome sera également disponible pour tous les utilisateurs Max.
Une autre nouveauté est la gestion améliorée de la mémoire. Les utilisateurs peuvent désormais parler à Claude sans interruption lorsque la limite de mémoire est atteinte, grâce au modèle lui-même compressant les anciennes parties de la conversation en arrière-plan.
Opus 4.5 est également optimisé pour les cas d’utilisation dits agents, où il peut agir en tant qu’agent principal et contrôler de plus petits sous-agents alimentés par Haiku. Selon Anthropic, Opus 4.5 est également leur modèle le plus sécurisé à ce jour, avec une meilleure protection contre les attaques par injection rapide.











