Mythos 5: Besser als Claude Fable 5

Christian Schablitzki, Partner bei Infosys Consulting, präsentiert sich in formeller Kleidung. Sein Blick ist direkt und nachdenklich. Die Diskussion um den Mythos 5 und die KI-Spitzenfähigkeit wird durch seine Expertise untermauert. — Christian Schablitzki, Partner bei Infosys ConsultingInfosys Consulting

Claude Fable 5 führt fast jeden Benchmark an. Doch die spektakulärsten Werte stammen von einem Schwester-Modell, das nur handverlesene Partner bekommen. Wer diese Zahlen ungeprüft übernimmt, zitiert Leistung, die seine Bank nie sehen wird.

von Christian Schablitzki, Partner bei Infosys Consulting

Anthropic hat am 9. Juni Claude Fable 5 veröffentlicht – das erste öffentlich verfügbare Modell der Mythos-Klasse, die im April mit autonom gefundenen Zero-Day-Schwachstellen für Aufsehen sorgte. Aus einem einzigen Modell macht Anthropic zwei Produkte: Fable 5 ist die öffentliche Variante, abgesichert durch Klassifikatoren. Mythos 5 ist dasselbe Modell mit gelockerten Cyber-Sicherungen – zugänglich nur für ausgewählte Partner des Project Glasswing und die US-Regierung. Beide kosten gleich viel: 10 US-Dollar je Million Input-Token, 50 je Million Output-Token, das Doppelte des Vorgängers Opus 4.8. Was die beiden trennt, ist kein Preis, sondern eine Vertrauensprüfung.

Technisch funktioniert die Mauer so: Stellt ein Nutzer Fable 5 Anfragen zu offensiver Cybersicherheit, Biologie oder Modell-Distillation, leiten Klassifikatoren die Anfrage auf das ältere Opus 4.8 um. Das geschieht laut Anthropic in unter fünf Prozent der Sessions, der Nutzer wird informiert.

Das Sternchen-Problem

Autor: Christian Schablitzki, Infosys Consulting

Christian Schablitzki, Partner bei Infosys ConsultingInfosys Consulting

Christian Schablitzki ist Partner bei Infosys Consulting (Website) mit Fokus auf Kapitalmarkt, Regulierung und den Einsatz von Artificial Intelligence bei Finanzinstituten. Zuvor war er rund 20 Jahre im Investmentbanking tätig, unter anderem als Derivatehändler bei HypoVereinsbank/WestLB und später als Leiter Algorithmic Trading. Danach beriet er über zehn Jahre lang Banken und Versicherer bei Accenture und Capco. Er schreibt unter der Marke „the agentic banker” über die Zukunft des Bankensektors.

In Anthropics Benchmark-Tabelle tragen die spektakulärsten Werte ein Sternchen. ExploitBench, der Cybersicherheits-Benchmark, zeigt 78 Prozent – das ist der Wert von Mythos 5, dem Modell hinter der Mauer. Das frei verfügbare Fable 5 macht bei offensiven Cyber-Aufgaben im Blocking-Modus null Prozent Fortschritt, weil genau diese Anfragen auf Opus 4.8 umgeleitet werden, das dort nur 40 Prozent erreicht.

Für Beschaffung und Modellrisiko-Management heißt das: Eingekaufte Leistung und einsetzbare Leistung fallen auseinander. Wer Fable-5-Spitzenwerte aus dem Cyber-Bereich in eine Ausschreibung, eine Risikobewertung oder eine Vorstandsvorlage übernimmt, zitiert ein Modell, das er gar nicht deployen kann.

30 Tage Aufbewahrung überschreiben Zero Data Retention

Der zweite operative Punkt steht im Kleingedruckten. Anthropic verlangt für alle Anfragen an Modelle der Mythos-Klasse eine 30-tägige Datenaufbewahrung – auch wenn der Zugriff über Drittanbieter wie GitHub Copilot läuft. Bestehende Zero-Data-Retention-Vereinbarungen werden damit überschrieben; trainiert wird auf den Daten jedoch nicht. Für ein Institut unter DORA (Digital Operational Resilience Act) ist das keine Fußnote, sondern ein Eingriff in die vertragliche Auslagerungsarchitektur.

Drei Prüfaufträge für die Banken-IT

Benchmark-Herkunft klären: Für jede Fable-5-Kennzahl in Ausschreibung, Risikobewertung oder Vorstandsvorlage prüfen, ob sie vom frei verfügbaren Fable 5 stammt oder vom zugangsbeschränkten Mythos 5. Die Frage an das Modellrisiko-Management ist banal und wird trotzdem kaum gestellt: Gilt die zitierte Kennzahl für das Modell, das wir tatsächlich einsetzen dürfen?
Verträge auf Retention-Konflikte prüfen: Alle direkten und eingebetteten Claude-Zugriffe inventarisieren – auch über Drittanbieter wie GitHub Copilot – und abgleichen, ob die 30-Tage-Aufbewahrung bestehenden Zero-Data-Retention-Zusagen und der eigenen Auslagerungsdokumentation widerspricht.
Konzentrationsrisiko neu bewerten: Das Financial Stability Board nennt die Abhängigkeit von wenigen KI-Anbietern seit über einem Jahr als Finanzstabilitätsrisiko. Mit Zugangsstufen wie Glasswing wird daraus ein konkretes Kriterium für Anbieterbewertung, Vertragsverhandlung und Exit-Strategie.

Die Mauer ist die Nachricht

Bisher galt bei den Frontier-Laboren: Das beste Modell bekommt, wer den Listenpreis zahlt. Diese Logik ist seit dem 9. Juni Geschichte. Die nach Anthropics eigener Beschreibung stärkste Cyber-Fähigkeit der Welt wird nicht über den Preis verteilt, sondern über eine Partnerliste – JPMorganChase gehört zu den Glasswing-Gründungspartnern.

Ausgerechnet die Fähigkeit zur autonomen Schwachstellen-Erkennung, die Bank-Verteidiger am dringendsten brauchen, ist im öffentlichen Modell gesperrt.“

Man kann das Gating für richtig halten – ein frei verfügbares Modell mit ungebremster offensiver Cyber-Fähigkeit wäre ein Geschenk an Angreifer. Aber damit entscheidet eine private Firma per Produktdesign, wer Zugang zur stärksten defensiven Fähigkeit erhält. Und die europäische Aufsicht denkt im AI Act noch in der Logik „ein Modell, ein Risikoprofil”. Ein Modell, das je nach Anfragetyp und Zugangsstufe ein anderes Modell wird, passt in dieses Raster nicht. Die Nachricht des Tages war nicht der Benchmark-Rekord. Es ist die Mauer. Christian Schablitzki, Infosys Consulting