00:00Anthropik parle donc du premier cas documenté au monde, d'une cyberattaque sans ou avec très peu d'intervention humaine.
00:09En fait, Claude, par exemple, a découvert toute seule les vulnérabilités des cibles.
00:15Elle les a exploitées seule une fois qu'elle était arrivée à pénétrer dans les systèmes.
00:20Elle a elle-même organisé son travail de manière à analyser les systèmes, à les cartographier,
00:25à y trouver les informations intéressantes, à y trouver d'autres identifiants qui lui permettaient d'augmenter ses privilèges d'accès
00:32ou, et bien entendu, à exfiltrer les données.
00:36Mais là, on atteint une limite de l'intelligence artificielle, pour le moment en tout cas.
00:40C'est que, comme dit Anthropik, Claude a halluciné et a largement augmenté ses résultats, enfin exagéré ses résultats.
00:48Par exemple, en ramenant des identifiants qui, en fait, étaient faux et qu'elle avait fabriqués elle-même,
00:54en présentant comme exclusives et secrètes des informations qui étaient publiques.
01:00Et là, on voit qu'on a atteint la limite de l'autonomie, parce que pour corriger ces erreurs,
01:04l'intervention humaine redevenait nécessaire.
Commentaires