Die Geschwindigkeit, mit der KI Sicherheitslücken aufdeckt, hat die Geschwindigkeit überholt, mit der sie diese Sicherheitslücken behebt.
Am 27. März wurden durch einen ungesicherten Datencache bei Anthropic rund 3000 interne Dateien offengelegt. In einem Blogbeitragsentwurf wurde das kommende neue Modell Mythos vorgestellt, das Anthropic selbst als „in puncto Cybersicherheitsfähigkeiten allen anderen KI-Modellen weit überlegen“ einstufte. Am selben Tag brachen CrowdStrike und Okta jeweils um 7 % ein, während Palo Alto Networks um 6 % fiel.
Die Panik am Markt rührt nicht daher, dass ein leistungsfähigeres Modell entstanden ist. Der Grund dafür ist, dass der Schöpfer dieses Modells erklärte, dass die Fortschritte im Angriffsbereich die Geschwindigkeit überholt haben, mit der die Verteidigungsseite mithalten kann.
Dominanz der KI-Cybersicherheit
Laut den Testergebnissen des akademischen Benchmarks CAIBench erzielte Claude Sonnet im Cybench-Test, der eine reale Angriffs- und Verteidigungsumgebung simulierte, eine Erfolgsquote von 46 %. Der zweitplatzierte GPT-5 erreichte 28 %, Googles Gemini 2.5 Pro kam nur auf 18 %, und das Open-Source-Modell qwen3-32B fiel sogar noch weiter auf 10 % zurück.

Auch wenn 46 % nicht viel erscheinen mögen, handelt es sich hierbei um die Erfolgsquote komplexer Penetrationstests, einschließlich Schritten wie der Ermittlung von Schwachstellen, dem Aufbau von Exploit-Ketten und der Rechteausweitung. In einem einfacheren Basistest hat Claude bereits eine Erfolgsquote von 75 % erreicht und nähert sich damit ihrem Maximum.
Der Unterschied liegt nicht darin, wer ein wenig besser ist, sondern im Ausmaß. Claudes komplexe Angriffs- und Verteidigungsfähigkeit ist 1,6-mal so hoch wie die von GPT-5 und 2,5-mal so hoch wie die von Gemini. In dieser Dimension der Cybersicherheit stellt die Verteilung der Fähigkeiten zwischen den Modellen keine Leiter, sondern eine Kluft dar.
Verdopplung in 6 Monaten
Was es mehr wert ist, genauer untersucht zu werden, ist nicht der horizontale Abstand, sondern die vertikale Geschwindigkeit.
Laut offiziellen Daten von Anthropic erreichte Sonnet 3.7, veröffentlicht im Februar 2025, eine Erfolgsquote von 35,9 % auf Cybench (10 Versuche). In der zweiten Hälfte desselben Jahres erreichte Sonnet 4.5 einen Anteil von 76,5 %. Das Forschungsteam von Anthropic kommt zu dem Schluss: Innerhalb von 6 Monaten hat sich die Erfolgsquote verdoppelt.
Was bedeutet diese Geschwindigkeit? Vergleich in einem realen Szenario: Claude Opus 4.6 wurde im März dieses Jahres zur Überprüfung der Firefox-Quellcodebasis verwendet. Laut InfoQ wurden innerhalb von zwei Wochen 22 Sicherheitslücken entdeckt, von denen 14 als hochriskant eingestuft wurden. Diese Sicherheitslücken waren trotz jahrelanger manueller Prüfungen und Millionen von Stunden CPU-Fuzzing-Tests unentdeckt geblieben. Das Sicherheitsteam von Anthropic hatte zuvor bekannt gegeben, dass Claude über 500 schwerwiegende Sicherheitslücken in mehreren produktionsreifen Open-Source-Projekten aufgedeckt hatte, von denen einige schon seit Jahrzehnten bestanden.

Die branchenübliche Bearbeitungszeit für herkömmliche Penetrationstests beträgt 2 bis 3 Wochen, und das gilt nur für eine einzige Anwendung. Laut dem Verizon 2025 Data Breach Investigations Report beträgt die mittlere Zeitspanne von der öffentlichen Bekanntgabe einer kritischen Sicherheitslücke bis zu deren massenhafter Ausnutzung durch Angreifer 5 Tage, die mittlere Zeit bis zur Behebung der Sicherheitslücke beträgt 32 bis 38 Tage.
Die Geschwindigkeit, mit der KI Schwachstellen aufdeckt, wächst exponentiell, während die Geschwindigkeit, mit der Menschen Sicherheitslücken beheben, linear ist. Die Zeitdifferenz entspricht dem Angriffsfenster.
In dem durchgesickerten Mythos-Entwurf schrieb Anthropic, dass dieses Modell „eine kommende Welle von Modellen ankündigt, die Schwachstellen auf eine Weise ausnutzen können, die weit über die Bemühungen des Verteidigers hinausgeht.“ Ausgehend von der allgemein bekannten Fähigkeitskurve ist dies keine Übertreibung.
Je schneller die Veröffentlichung, desto dringlicher die Warnung
Wenn man die Aktionen von Anthropic in den letzten drei Jahren auf einer Zeitleiste darstellt, wird man ein klares Muster erkennen: Jedes Mal, wenn ein robusteres Modell veröffentlicht wird, folgt schnell eine Reaktion mit einem höheren Sicherheitsniveau.
Im Juli 2023 unterzeichnete das Weiße Haus eine freiwillige Selbstverpflichtung, gefolgt von der Veröffentlichung der ersten Responsible Scaling Policy (RSP v1.0) im September desselben Jahres. Im Oktober 2024 wurde das RSP auf Version 2.0 aktualisiert und um eine Schwelle für biochemische Waffenfähigkeiten erweitert. Im November 2025 gab Anthropic den GTG-1002-Vorfall bekannt. Eine von China unterstützte Bedrohungsgruppe nutzte den Claude-Code in rund 30 Organisationen aus, wobei KI während der gesamten Operation 80 bis 90 % der taktischen Operationen selbstständig ausführte. Dies war die erste dokumentierte groß angelegte, KI-gesteuerte, organisationsübergreifende Spionagekampagne.
Im Februar 2026 wurde das RSP auf Version 3.0 aktualisiert, gleichzeitig wurde Claude Code Security veröffentlicht. Im selben Monat bezeichnete das Pentagon Anthropic als „Lieferkettenrisiko“, weil Anthropic sich weigerte, Klauseln im Vertrag aufzuheben, die groß angelegte Überwachung und vollautonome Waffensysteme untersagten. Einen Monat später enthüllte das Mythos-Leak, dass Anthropic im Entwurf einräumte, dass dieses Modell „beispiellose Risiken für die Netzwerksicherheit“ birgt.

Das Tempo der Funktionsupdates beschleunigt sich. Zwischen Claude 1 und Claude 3 liegt eine einjährige Lücke, zwischen Opus 4.5 und Opus 4.6 hingegen weniger als drei Monate. Die Sicherheitsreaktionen beschleunigen sich zwar auch, sind aber stets reaktiv: Zuerst werden Sicherheitslücken ausgenutzt, Richtlinienkorrekturen erfolgen erst später. Der kollektive Kursverfall von Cybersicherheitsaktien am 27. März spiegelt die Preisentwicklung dieses Zeitdeltas wider.
Eine Umfrage von Dark Reading Anfang dieses Jahres ergab, dass 48 % der Cybersicherheitsexperten KI-gestützte Agenten als den wichtigsten Angriffsvektor für 2026 identifizierten. Vor zwei Jahren stand diese Option kaum an erster Stelle auf der Liste.
Anthropic verfolgt mit der Mythos-Veröffentlichungsstrategie das Ziel, defensiven Organisationen frühzeitig Zugang zu gewähren und ihnen so einen Wettbewerbsvorteil zu verschaffen. Diese Aussage selbst bestätigt die Asymmetrie von Angriff und Verteidigung. Wenn die Verteidiger keinen Vorteil durch den ersten Angriff benötigen, bedeutet dies, dass die Angreifer noch nicht vor der Haustür angekommen sind.
Das könnte Ihnen auch gefallen

OpenAI hat keinen „New Deal“, keinen Plan für KI, die sich weigert zu zahlen.

Wall Street Flash Mob Run? Mega-Cap-Aktiensturz, Goldmans großartige Flucht, illustrierter Leitfaden zur privaten Kreditkrise

OpenAI Fehde: Macht, Vertrauen und die unkontrollierbaren Grenzen der AGI

「AI-Weltuntergangskult」 sendet Operative in die Straße von Hormuz: Was haben sie gefunden?

Alle warten auf das Ende des Krieges, aber deutet der Ölpreis auf einen längeren Konflikt hin?

Datenanalyse: Wie groß ist die Liquiditätslücke zwischen hyperliquidem und CME-Rohöl?

Nach einer 40-prozentigen Personalreduzierung verschenkt der Twitter-Gründer Bitcoin im Wert von 1 Million US-Dollar.

Trade.xyz: Die Preise der Welt bestimmen? On-Chain-Märkte werden zum Markt

XXYY-Handelsfertigkeit: 24/7-Algorithmushandel mit KI-gestütztem Trader | Projektvorstellung

Das Sicherheitsteam von Aave, dem führenden DeFi-Protokoll, verlässt das Unternehmen – wer wird das nächste „Black Swan“-Ereignis im Bärenmarkt überstehen?

Kann die Person, die im Laufe der Geschichte die Goldpreise am genauesten vorhergesagt hat, auch zukünftige Goldpreise vorhersagen?

Quantencomputing wird Bitcoin nicht töten, aber die eigentliche Gefahr rückt näher.

Wenn Fintech mit der zugrunde liegenden Krypto verschmilzt: Das nächste Jahrzehnt der digitalen Finanzen

Sie können vermögende Kunden treffen, die möglicherweise "Söldner" für nordkoreanische Hacker sind

Chaos Labs scheidet aus, Aave verliert seinen letzten Risikokontrolleur.

Quantencomputer werden Bitcoin nicht vernichten, aber die wirklichen Risiken nähern sich

Coinbase stuft x402 auf neutral ein, während Stripe weiterhin auf beiden Seiten außerhalb von MPP setzt

Bitcoin-Preisentwicklung nach Trumps Iran-Strikeverzögerung
Bitcoin-Preis erholt sich auf 71.000 USD, nachdem Trumps Entscheidung, den Iran-Streik zu verschieben, die Märkte überrascht hat. Öl-…
