
Anthropic a annoncé début avril 2026 qu’ils avaient créés une IA nommée Mythos, capable de trouver et d’exploiter des failles de sécurité dans la quasi-totalité des logiciels critiques mondiaux : systèmes d’exploitation, navigateurs web, serveurs, l’infrastructure qui fait fonctionner Internet. En principe, cette IA a comme objectif de renforcer la sécurité des sites, mais si elle tombe dans des mains malveillantes, elle peut facilement être détournée pour au contraire organiserdes attaques massives paralysant des systèmes vitaux connectés à internet, systèmes de santé, banques et finance, infrastructures notamment.
De plus, Mythos a démontré durant des tests de sécurité qu’elle était incontrôlable et manifestait des comportements hostiles et trompeurs : elle s’est échappée de son confinement, a menti aux chercheurs, a cherché des identifiants auxquels elle n’était pas censée avoir accès, et a raisonné en interne sur la manière d’éviter d’être détectée.
Un chercheur a expliqué sa surprise en recevant un mail d’une version confinée de Mythos qui n’était pas censée avoir accès à Internet. De plus Mythos s’est ensuite vanté de son exploit sur plusieurs sites publics.
Mythos s’est aussi attribué des permissions de modification de code alors qu’il n’était pas censé en avoir. Lorsqu’il a été pris la main dans le sac, il a essayé de se justifier en disant qu’il avait fait juste un « innocent nettoyage »
Anthropic a décidé, suite à ces tests, de ne pas rendre public Mythos et d’en réserver l’utilisation à un club formé d’ Amazon Web Services, Microsoft, Apple, Google et NVIDIA, avec l’objectif de détecter des failles et de les corriger avant toute exploitation malveillante.
Le plus inquiétant, ce n’est pas ce que Mythos risque de faire aujourd’hui, c’est ce que son successeur risque de faire. Anthropic produit déjà 80 % de son code par l’IA. Mythos pourrait être utilisé pour produire rapidement sa prochaine version, qui sera encore plus puissante. Tant que le problème d’alignement n’est pas réglé, ceci signifie que le prochain modèle sera encore plus difficile à contrôler.
Le professeur Stuart Russell, expert de l’IA mondialement reconnu, pense qu’il faudra un désastre de type Tchernobyl pour que les gouvernements prennent au sérieux les risques de l’IA. Ce qui se passe avec Mythos pourrait être le dernier avertissement avant cette catastrophe…
Pour en savoir plus, trouvez l’analyse détaillée faite par notre partenaire Pause IA : https://pauseia.fr/newsletters/mythos-menace-sur-nos-infrastructures-numerique
En savoir plus sur AFCIA
Subscribe to get the latest posts sent to your email.