Anthropic hat Fable 5 am 01.07. weltweit mit seinen intakten Fähigkeiten wiederhergestellt und einen Filter hinzugefügt, der einen markierten Hacking-Prompt in mehr als 99 % der Versuche blockiert.
Das US-Handelsministerium hob die Notfall-Exportverordnung am 30.06. auf, und das Modell erreichte die Nutzer am nächsten Tag wieder über die Claude-Plattform, Claude.ai, Claude Code und Claude Cowork. Der Zugang über die großen Cloud-Plattformen wird folgen.
Bezahlte Abonnenten können es bis zum 07.07. innerhalb ihrer wöchentlichen Limits nutzen, wonach der fortgesetzte Zugang auf ein abgerechnetes Nutzungs-Credit-System umgestellt wird.
Das Modell war am 12.06. abgeschaltet worden. Die Regulierungsbehörden untersagten jedem ausländischen Staatsangehörigen den Zugriff darauf und gaben dem Unternehmen nur etwa 90 Minuten Zeit, um nachzukommen, weshalb Anthropic das Modell für alle Nutzer sperrte, anstatt zu versuchen, sie in Echtzeit einzeln zu überprüfen.
Die Anweisung folgte einem Bericht, in dem Amazon-Forscher einen Prompt fanden, der das Modell dazu brachte, eine Gruppe von Software-Schwachstellen in gängigen Systemen zu markieren. In einem Fall ging es noch weiter und produzierte funktionierenden Code, der zeigte, wie ein einzelner Fehler ausgenutzt werden könnte. Diese eine Demonstration, mehr als die Liste der Schwachstellen, löste den Alarm aus.
Lesen Sie auch: CrowdStrike warnt, dass Claude Mythos Zero-Day-Entscheidungen beschleunigen könnte
Anthropics eigene Überprüfung, die zusammen mit der Regierung und dem Unternehmen, das den Bericht eingereicht hatte, durchgeführt wurde, bestätigte, dass weitaus schwächere Modelle dieselben Schwachstellen aufdecken könnten, darunter Opus 4.8, GPT-5.5 und Kimi K2.7. Jedes andere vom Team überprüfte Modell konnte die einzelne Exploit-Demonstration immer noch reproduzieren, was die Argumentation entkräftete, dass Fable 5 allein eine einzigartige Cyberwaffe darstellt. Das Unternehmen hatte das Verbot als Übergriff bezeichnet.
Die Lösung war eng gefasst. Bei seiner Rückkehr trägt das Modell einen Klassifikator, der den gemeldeten Prompt abfängt und an das schwächere Opus 4.8 umleitet, wodurch die Fähigkeiten von Fable 5 intakt bleiben, aber bei gewöhnlicher Programmierung Fehlalarme ausgelöst werden und der Benutzer gewarnt wird, wenn es eingreift.
Mythos 5, dasselbe zugrunde liegende Modell mit weniger Schutzmaßnahmen, bleibt in einem Programm namens Project Glasswing auf etwa 100 überprüfte US-Organisationen beschränkt.
Das Unternehmen eröffnete auch einen öffentlichen Kanal für Jailbreak-Berichte. Es versprach den Regulierungsbehörden auch einen früheren Zugang, um zukünftige Frontier-Modelle vor dem Start zu testen.
Fable 5 wurde am 09.06. als Anthropics erstes weit verbreitetes Modell der Mythos-Klasse eingeführt und in einer Reihe von Branchenbenchmarks gelobt, bevor es innerhalb weniger Tage nach der Veröffentlichung verschwand. Der Ausfall dauerte kaum drei Wochen. Sein Comeback holt nun das Benchmark-Territorium zurück, das ein schnell aufstrebendes chinesisches Labor still übernommen hatte, während das Modell untätig war.
Als Nächstes lesen: XRP testet erneut 1,07 $, da die Ablehnungen im Juni die Bullen überschatten


