Hoe krachtig is Claude Mythos als hacker nu écht?
Het Britse AI Security Institute (AISI) testte Claude Mythos Preview op cybercapaciteiten. Het model vormt een duidelijke sprong vooruit t.o.v. eerdere AI-systemen.
In tests kon het zelfstandig kwetsbaarheden vinden én exploiteren. Het voerde volledige meerstaps cyberaanvallen uit zonder menselijke hulp.
In een 32-stappen simulatie (bedrijfsnetwerk) slaagde het 3 van de 10 keer volledig.Gemiddeld doorliep het 22 van de 32 aanvalsstappen.
Op expertniveau CTF-hacktests behaalde het ca. 73% succes. Taken die mensen dagen kosten, kan het model sterk versnellen. Het kan autonoom aanvallen uitvoeren op zwak beveiligde systemen. Maar tests gebeurden in vereenvoudigde omgevingen zonder echte verdediging. Daarom is onduidelijk hoe goed het presteert tegen sterke, realistische beveiliging.
De resultaten tonen vooral risico bij slecht beveiligde netwerken met toegang.
AI verlaagt de kosten en moeite om cyberaanvallen uit te voeren.
Evaluatiemethoden moeten evolueren om zulke krachtige AI goed te testen. Mythos is dus nog geen “superhacker”, maar wél een serieuze versneller van cyberdreiging.
Lees het gov.uk artikel voor meer informatie.

