Claude Fable 5: Warum Anthropic ein Modell veröffentlichte, das monatelang als zu gefährlich galt

Aktualisiert:
Claude Fable 5: Warum Anthropic ein Modell veröffentlichte, das monatelang als zu gefährlich galt
Kurz gesagt: Am 9. Juni 2026 veröffentlichte Anthropic Claude Fable 5 — das erste öffentliche Modell der Mythos-Klasse, das zuvor aufgrund von Cybersicherheitsrisiken eingeschränkt war. Dieselbe technologische Basis wie bei Mythos 5, aber mit aktiven Sicherheitsklassifikatoren. Preis: 10 $/50 $ pro Million Tokens. Benchmarks: 80,3 % SWE-Bench Pro, #1 auf FrontierCode Diamond.

Claude Fable 5: Warum Anthropic ein Modell veröffentlichte, das monatelang als zu gefährlich galt

Im April 2026 stellte Anthropic Claude Mythos vor und schränkte den Zugang sofort ein: nur für ausgewählte Organisationen, die sich mit dem Schutz kritischer Infrastrukturen befassen. Am 9. Juni kündigte dasselbe Unternehmen Claude Fable 5 an – eine öffentliche Version des Modells auf derselben technologischen Basis. Was hat sich in zwei Monaten geändert und warum jetzt?

Was ist Claude Fable 5

Claude Fable 5 ist das erste öffentlich zugängliche Modell der neuen Mythos-Klasse von Anthropic. Der Name ist kein Zufall: fable kommt aus dem Lateinischen – fabula, „das Erzählte“ – derselbe Wurzel wie im griechischen mythos. Dies ist kein Marketing-Gag, sondern ein Signal: Fable 5 und Mythos 5 basieren auf denselben Modellgewichten. Der Unterschied liegt nicht in der Architektur, sondern in der Sicherheitsschicht.

Die Mythos-Klasse positioniert Anthropic als eine Stufe über Opus. Das erste Modell dieser Klasse, Claude Mythos Preview, wurde im April 2026 über das geschlossene Programm Project Glasswing veröffentlicht – und blieb der breiten Öffentlichkeit bis zum 9. Juni unzugänglich.

Warum wurde das Mythos-Modell der breiten Öffentlichkeit vorenthalten

Der Hauptgrund war die Cybersicherheit. Bereits im April beschrieb Anthropic die Fähigkeiten von Mythos als solche, die „extrem effektiv bei der Erkennung und Ausnutzung von Schwachstellen in Software“ sein können. Genau diese Eigenschaft beeindruckte sowohl die Wall Street als auch US-Regierungsbehörden – und genau deshalb plante das Unternehmen nicht, das Modell der Öffentlichkeit zugänglich zu machen.

Das Zugangsmodell wurde schrittweise umgesetzt:

  • April 2026 – Mythos Preview ist nur für ausgewählte Partner im Rahmen von Project Glasswing verfügbar, ausschließlich zum Schutz kritischer Infrastrukturen.
  • Ende Mai 2026 – Das Programm wurde auf mehrere hundert Organisationen in 15 Ländern ausgeweitet, aber wiederum nur für Schutzaufgaben.
  • 9. Juni 2026 – Veröffentlichung von Claude Fable 5 für die breite Öffentlichkeit.

Parallel dazu warnte das Unternehmen öffentlich: Frontier-Modelle werden so leistungsfähig, dass sie bereits in den kommenden Monaten das Niveau der rekursiven Selbstverbesserung (RSI) erreichen könnten – also die autonome Verbesserung ihres eigenen Codes ohne menschliches Zutun. Auf den ersten Blick widerspricht dies der Entscheidung, Fable 5 gerade jetzt zu veröffentlichen. Aber Anthropic verfolgt eine andere Logik: Nicht warten, bis das Modell noch leistungsfähiger wird, sondern es mit einer geprüften Schutzschicht veröffentlichen – solange die Kontrolle noch möglich ist.

Fable 5 vs Mythos 5: Was ist der Unterschied

Der Kernpunkt: Es ist dasselbe Modell. Der Unterschied liegt ausschließlich in der Konfiguration der Sicherheitsklassifikatoren. Fable 5 hat eine aktive Schutzschicht erhalten; Mythos 5 ist dieselbe Architektur, aber mit teilweise aufgehobenen Einschränkungen für verifizierte Partner von Project Glasswing.

Die folgende Tabelle zeigt ExploitBench: ein branchenüblicher Benchmark, der die Fähigkeit des Modells misst, reale Schwachstellen in Software zu finden und auszunutzen. Genau dieser Wert war der Hauptgrund für die eingeschränkte Veröffentlichung von Mythos.

Parameter Claude Fable 5 Claude Mythos 5
Technologische Basis Mythos-Klasse Mythos-Klasse
Zugang Öffentlich (API, Abonnements) Nur Project Glasswing
Cybersicherheit Blockiert → Fallback auf Opus 4.8 Für verifizierte Partner aufgehoben
Biologie / Chemie Blockiert → Fallback auf Opus 4.8 Wird für vertrauenswürdige Partner in zukünftigen Versionen freigeschaltet
ExploitBench ~0 % (wird vom Klassifikator blockiert) 78,0 %
Preis 10 $/50 $ pro Million Tokens 10 $/50 $ pro Million Tokens

Anthropic bestätigte: Bei Benchmarks, die nicht die blockierten Domänen betreffen, liegt der Unterschied in den Ergebnissen von Fable 5 und Mythos 5 bei 1–3 Prozentpunkten – innerhalb des statistischen Rauschens.

Claude Fable 5: Warum Anthropic ein Modell veröffentlichte, das monatelang als zu gefährlich galt

Benchmarks: Zahlen und was dahinter steckt

Unten sind die wichtigsten Benchmarks aus der offiziellen Ankündigung von Anthropic und unabhängigen Tests vom 9.–10. Juni 2026. ★-Markierungen bedeuten, dass das Ergebnis Mythos 5 betrifft – Fable 5 fällt in diesen Kategorien aufgrund von Fallbacks auf das Niveau von Opus 4.8.

Benchmark Fable 5 / Mythos 5 Opus 4.8 GPT-5.5 Gemini 3.1 Pro
SWE-Bench Verified 95,0% ~83%
SWE-Bench Pro 80,3% 69,2% 58,6% 54,2%
FrontierCode Diamond 29,3% 13,4% 5,7%
Terminal-Bench 2.1 88,0% ★
GDPval-AA (Elo) 1932 1890
Humanity's Last Exam 59,0%
ExploitBench ★ ~0% (Fable) / 78,0% (Mythos) 40,0%

Was man hinter den Zahlen verstehen sollte:

  • SWE-Bench Pro ist ein zuverlässigerer Maßstab als SWE-Bench Verified. OpenAI hat eine Datenkontamination in der Verified-Version anerkannt; die Pro-Version testet reale Aufgaben in geschlossenen Repositories.
  • FrontierCode ist am repräsentativsten für Produktionscode. 29,3 % gegenüber 13,4 % bei Opus 4.8 bedeuten: Fable 5 löst mehr als doppelt so viele komplexe Ingenieuraufgaben.
  • ExploitBench ist ein Spiegelbild der Architektur. Mythos 5 erzielt 78 %, Fable 5 etwa null. Das ist die Essenz der Trennung der beiden Modelle.

Eine detailliertere Analyse der Benchmarks der vorherigen Generation und wie Opus 4.8 vor der Veröffentlichung von Fable 5 aussah, finden Sie in unserem Artikel Claude Opus 4.8: Benchmarks, Zahlen und was dahinter steckt.

Welche Einschränkungen hat die öffentliche Version erhalten

Anthropic hat eine Schicht von Klassifikatoren implementiert, die Anfragen in vier Kategorien abfängt und an Claude Opus 4.8 weiterleitet:

  • Cybersicherheit – Suche und Ausnutzung von Schwachstellen, Entwicklung von Angriff-Software
  • Biologie – Synthese gefährlicher Substanzen, Design von Krankheitserregern
  • Chemie – Synthese von Substanzen mit doppeltem Verwendungszweck
  • Modell-Destillation – Versuche, interne Gewichte durch Ausgaben zu reproduzieren

Technisch: Wenn der Klassifikator auslöst, gibt die API HTTP 200 mit stop_reason: "refusal" und dem Feld stop_details.category mit dem Wert "cyber", "bio", "reasoning_extraction" oder null zurück. Wenn keine Ausgabe erfolgte, wird die Anfrage nicht berechnet.

Laut Anthropic lösen die Klassifikatoren im Durchschnitt in weniger als 5 % der Sitzungen aus. Das Unternehmen erkennt das Vorhandensein von falsch positiven Auslösungen an und verspricht, diese mit neuen Versionen zu reduzieren.

Vor der Veröffentlichung führte Anthropic ein externes Bug-Bounty-Programm durch: Über 1.000 Stunden Tests ergaben keinen einzigen universellen Jailbreak.

Für welche Aufgaben empfiehlt Anthropic Fable 5

Szenario Warum Fable 5 geeignet ist
Programmierung und Code-Review 80,3 % SWE-Bench Pro, #1 FrontierCode – am besten für lange Agentenaufgaben und Migrationen
Datenanalyse und Finanzen #1 im Hebbia Finance Benchmark für Senior-Level: Tabellen, Grafiken, Ursachenanalyse
Agentenaufgaben (Claude Code) Autonome Arbeit über eine Woche ohne menschliches Eingreifen; im Stripe-Test wurden 2 Monate Teamarbeit auf einen Tag komprimiert
Computer Vision State-of-the-art: Reproduktion einer Webanwendung aus einem Screenshot, präzise Lesung wissenschaftlicher Grafiken
Wissenschaftliche Forschung Generierung von Hypothesen in der Molekularbiologie (über Mythos 5); Fable 5 – für die Analyse von Literatur und Genomik ohne Einschränkungen
Juristische Arbeit In einer Blindprüfung bewerteten Juristen die Redlines von Fable 5 in 100 % der Fälle als gleichwertig oder besser als das Vorgängermodell

Für Routineaufgaben, bei denen das SWE-Bench Pro-Niveau nicht erforderlich ist, bleibt Claude Opus 4.8 die rationalere Wahl: doppelt so günstig für die gleichen Tokens.

Claude Fable 5: Warum Anthropic ein Modell veröffentlichte, das monatelang als zu gefährlich galt

Zugriff auf Claude Fable 5

Zugriffsmethode Details
Claude Pro / Max / Team / Enterprise (Abonnements) Kostenlos bis 22. Juni 2026; ab 23. Juni sind Nutzungsgutschriften erforderlich; später ist die Rückkehr zu Standardplänen geplant
Claude API Modell-ID: claude-fable-5; ab sofort verfügbar
Amazon Bedrock Ab dem Tag der Veröffentlichung verfügbar
Google Cloud / Microsoft Foundry Ab dem Tag der Veröffentlichung verfügbar
GitHub Copilot Verfügbar; erfordert bis zu 30 Tage Speicherung von Prompt+Output für Klassifikatoren (standardmäßig in Copilot Admin deaktiviert)
Claude Code (CLI) Ab dem Tag der Veröffentlichung verfügbar

Praktischer Hinweis: Wenn das Modell noch nicht in Ihrer Liste erscheint, empfehle ich, die Seite einfach neu zu laden oder sich abzumelden und wieder anzumelden. In meinem Fall erschien Claude Fable 5 nach dem Neuladen der Benutzeroberfläche, ohne zusätzliche Einstellungen.

Kosten von Claude Fable 5

Parameter Fable 5 / Mythos 5 Opus 4.8 Mythos Vorschau (vor Veröffentlichung)
Eingabe (pro Mio. Token) 10 $ 5 $ >22 $ (geschätzt)
Ausgabe (pro Mio. Token) 50 $ 25 $ >110 $ (geschätzt)
Batch-Eingabe 5 $ 2,5 $
Batch-Ausgabe 25 $ 12,5 $
Prompt-Caching -90% -90%
Kontextfenster 1 Mio. Eingabe / 128K Ausgabe 200K / 32K

Wenn Sie LLMs für die Programmierung verwenden, sollten Sie nicht nur auf den Preis pro Token achten, sondern auch auf die bedingten Kosten für das Erreichen des richtigen Ergebnisses. Bei solchen Bewertungen kann Fable 5 dank einer höheren Erfolgsquote, die die Anzahl der Wiederholungen und die Gesamtkosten für die Lösung einer Aufgabe reduziert, günstiger als Opus 4.8 erscheinen.

Was die Veröffentlichung von Fable 5 für den KI-Markt bedeutet

Meiner Meinung nach ist die Hauptfrage hier nicht technischer Natur. Wenn noch im Frühjahr ein Modell der Mythos-Klasse als zu riskant für den breiten Zugang galt, was hat sich dann in wenigen Monaten geändert? Die Antwort von Anthropic lautet nicht, dass das Modell weniger leistungsfähig geworden ist, sondern dass das Unternehmen seinem Schutzmechanismus zu vertrauen begonnen hat. Laut Anthropic konnte das externe Bug-Bounty-Programm diese Mechanismen auch nach über 1.000 Stunden Tests und Angriffsversuchen nicht umgehen. Tatsächlich sehen wir hier den ersten großen Präzedenzfall, bei dem ein Frontier-Modell öffentlich zugänglich gemacht wird, mit einem klar dokumentierten System von Einschränkungen und einem automatischen Fallback auf ein weniger riskantes Modell für bestimmte Anfragekategorien.

Nach der Analyse der Veröffentlichung von Fable 5 habe ich mehrere Trends bemerkt, die für Unternehmen, die KI-Lösungen implementieren oder die Strategie großer KI-Anbieter bewerten, wichtig sein könnten.

  • Schutzmechanismen anstelle von Verboten werden zum neuen Standard. OpenAI, Anthropic und Google bewegen sich allmählich weg vom Ansatz "veröffentlichen oder nicht veröffentlichen". Stattdessen bauen sie mehrstufige Kontrollsysteme auf, die den Zugang zu leistungsstarken Modellen ermöglichen, aber einzelne risikoreiche Szenarien einschränken. Fable 5 ist derzeit eines der transparentesten Beispiele für diesen Ansatz.
  • Die Kluft zwischen öffentlichen und privaten Modellversionen wird strukturell. Mythos 5 und Fable 5 demonstrieren ein neues Modell der KI-Distribution. Formal handelt es sich um eine technologische Plattform, aber mit unterschiedlichen Zugriffsebenen und unterschiedlichen Fähigkeiten in bestimmten Domänen. Es ist sehr wahrscheinlich, dass wir ein ähnliches Schema auch in zukünftigen Generationen von Frontier-Modellen sehen werden.
  • Kommerzialisierung und Sicherheit widersprechen sich nicht mehr. Für Anthropic ist die Veröffentlichung von Fable 5 nicht nur eine technologische Errungenschaft, sondern auch ein Geschäftssignal. Das Unternehmen zeigt, dass es die leistungsstärksten Modelle auf den Markt bringen kann, ohne seine Sicherheitsprinzipien vollständig aufzugeben. Für Investoren ist dies ein wichtiger Indikator für die Reife der Plattform.
  • Das Fähigkeitsniveau von Mythos wird allmählich zur neuen Norm. Meiner Meinung nach werden die Fähigkeiten, die heute mit der Mythos-Klasse verbunden sind, in den nächsten 6–12 Monaten als Standard für Flaggschiff-Modelle angesehen werden. Ein ähnlicher Prozess fand bereits nach der Einführung von GPT-4 statt: Was anfangs als Durchbruch galt, wurde ein Jahr später zur grundlegenden Erwartung des Marktes.

Wenn man den Start von Fable 5 nicht als weitere Modellveröffentlichung, sondern als Signal für die gesamte Branche betrachtet, dann ist die wichtigste Schlussfolgerung für mich: Große KI-Unternehmen versuchen nicht mehr, ihre leistungsstärksten Modelle vor der breiten Öffentlichkeit zu verstecken. Stattdessen investieren sie in Kontrollmechanismen, die es ermöglichen, den Zugang zu Frontier-Modellen zu öffnen, ohne die Kontrolle über die risikoreichsten Nutzungsszenarien zu verlieren.

FAQ: Häufig gestellte Fragen zu Claude Fable 5

Kann Claude Fable 5 lokal ausgeführt werden?

Nein. Fable 5 ist ein Cloud-basiertes Modell, das ausschließlich über die Anthropic API, Claude.ai und Partnerplattformen (Amazon Bedrock, Google Cloud, Microsoft Foundry) zugänglich ist. Anthropic veröffentlicht keine Modellgewichte und plant dies auch nicht. Wenn Sie ein lokales Modell benötigen, handelt es sich um eine andere Klasse von Lösungen.

Wird Fable 5 Claude Opus 4.8 ersetzen?

Nein, zumindest nicht sofort. Opus 4.8 bleibt im Sortiment und ist halb so teuer. Darüber hinaus schaltet Fable 5 bei Anfragen in blockierten Kategorien automatisch auf Opus 4.8 um. Für die meisten Routineaufgaben ist Opus 4.8 die rationalere Wahl. Fable 5 rechtfertigt seinen Preis bei langen Agentenaufgaben und komplexem Code, wo die Erfolgsquote prinzipiell unterschiedlich ist.

Worin unterscheidet sich Fable 5 von Mythos 5?

Architektonisch nicht – es ist dasselbe Modell mit denselben Gewichten und demselben Preis. Der Unterschied liegt ausschließlich in der Konfiguration der Klassifikatoren: Bei Fable 5 sind diese aktiv und leiten risikoreiche Anfragen (Cyberangriffe, Synthese gefährlicher Substanzen) an Opus 4.8 weiter. Bei Mythos 5 sind einige dieser Einschränkungen aufgehoben – aber das Modell selbst ist nur verifizierten Organisationen über Project Glasswing zugänglich.

Ist Claude Fable 5 über die API verfügbar?

Ja. Modell-ID: claude-fable-5. Ab dem 9. Juni 2026 ohne Wartezeit verfügbar. Unterstützt 1 Million Token Kontext bei der Eingabe und bis zu 128.000 Token in der Antwort. Batch-API: 5 $/25 $ pro Million Token. Wenn der Sicherheitsklassifikator auslöst, wird ein HTTP 200 mit stop_reason: "refusal" zurückgegeben – kein Fehler und wird nicht berechnet, wenn keine Ausgabe erfolgte.

Ist Fable 5 bereits sicher für den Produktionseinsatz?

Abhängig von der Domäne. Für Code, Analysen, juristische und finanzielle Aufgaben – ja, Anthropic führte eine externe Bug-Bounty-Aktion ohne Erfolg nach über 1.000 Stunden Tests durch. Die Klassifikatoren sind jedoch immer noch konservativ eingestellt: Falsch-positive Auslösungen sind in weniger als 5 % der Sitzungen möglich. Wenn Ihr Produkt Cybersicherheit oder Biochemie betrifft, werden einige Anfragen zu Opus 4.8 fallen, was bei der Architektur berücksichtigt werden muss.

Wann wird Fable 5 Teil der Standardabonnements?

Bis zum 22. Juni 2026 – kostenlos für alle zahlenden Abonnenten (Pro, Max, Team, Enterprise). Ab dem 23. Juni – über Nutzungsgutschriften. Anthropic verspricht, das Modell in die Standardpläne zurückzubringen, sobald die Kapazitäten es zulassen – konkrete Daten gibt es noch nicht.