Un mémo interne d’Anthropic, coécrit par Marina Favaro et Jack Clark, décrit une transformation profonde dans l’usage de l’intelligence artificielle pour développer des logiciels. Selon le document, le système d’IA d’Anthropic, nommé Claude, rédige aujourd’hui plus de 80 % du code de l’entreprise, contre moins de 5 % avant février 2025. Cette avancée ouvre de nouvelles questions sur la manière dont les humains et l’IA vont travailler ensemble en programmation.
Ce qui a changé dans la production de code
La progression de Claude a modifié le processus de développement. Avant, les ingénieurs copié-collaient des fragments suggérés par Claude ; maintenant, ils donnent un objectif à Claude qui écrit, teste et propose des solutions sans intervention humaine, explique Clubic. Cette automatisation a permis aux ingénieurs de produire et de superviser huit fois plus de code qu’en 2024, tout en soulevant des préoccupations éthiques.
Depuis le début de 2026, chaque modification de code passe par une relecture automatisée, ce qui a transformé la relecture humaine en un goulot d’étranglement.
Les agents automatisés de Claude, comme Claude Opus 4, ont déjà multiplié par trois la vitesse du code de départ dès mai 2025. Plus récemment, le modèle Mythos Preview a poussé ce chiffre encore plus loin, atteignant une vitesse multipliée par cinquante-deux. À titre de comparaison, un chercheur humain compétent peut au mieux multiplier sa vitesse par quatre, limité par ses capacités intrinsèques.
Progrès dans la détection et la correction d’erreurs
Le mémo indique aussi que les « agents Claude » ont corrigé plus de 800 erreurs d’API en autonomie, réduisant une catégorie d’incidents d’un facteur 1 000. Un travail de cet ordre aurait demandé 4 ans à des humains.
Un bug historique, vieux de 27 ans, a été détecté dans OpenBSD (système d’exploitation axé sur la sécurité), montrant que l’IA peut repérer des failles que des humains avaient laissées passer.
Un projet de recherche en sécurité mené en avril par les agents Claude a prouvé l’efficacité des calculs automatisés : en 800 heures de calcul, pour un coût d’environ 16 300 €, les résultats ont montré une performance de 97 %, contre 23 % obtenus par deux chercheurs humains en une semaine.
Et ensuite ? quelles pistes envisagent Favaro et Clark
La capacité de Claude à générer du code plus vite que les humains ne peuvent le relire pose des questions organisationnelles et éthiques importantes, notamment en raison des dangers potentiels de l’IA.
Favaro et Clark évoquent trois trajectoires possibles :
- limiter les capacités des modèles,
- maintenir le contrôle humain sur la recherche,
- ou laisser un système d’IA entraîner seul son successeur, soulignant l’importance d’une gouvernance responsable.
Avec des capacités d’IA en hausse, la détection et la correction de plus de 10 000 vulnérabilités critiques ont été réalisées en quelques semaines par le projet Glasswing et le modèle Mythos Preview. Cette efficacité souligne l’importance majeure de l’IA pour améliorer les systèmes de sécurité actuels, tout en nécessitant une intervention humaine.


