Anthropic stabilisierte seine Claude Code-Plattform im April 2025 nach einer siebenwöchigen Verschlechterungsphase, die durch drei sich gegenseitig verstärkende Fehler auf Produktebene verursacht wurde: eine Reduzierung der Reasoning-Tiefe, ein Sitzungsspeicher-Cache-Fehler und ein die Ausführlichkeit einschränkender Systempromt-Konflikt. Entwickler bemerkten den Rückgang, bevor Anthropic ihn bemerkte, und wandelten individuelle Beschwerden in kollektive Belege um. Die Claude-API selbst blieb während der gesamten Zeit unberührt. Wöchentliche Kontingente wurden global zurückgesetzt, wodurch der sofortige Zugang wiederhergestellt wurde. Die vollständige Geschichte hinter jedem technischen Fehler ist erheblich lehrreicher, als die Schlagzeile vermuten lässt.
Inhaltsverzeichnis
ToggleWas Claude Code Anfang 2025 tatsächlich zum Absturz brachte

Zwischen Anfang März und Ende April 2025 zerfiel Anthropics Claude Code still und leise , nicht durch einen einzigen katastrophalen Fehler, sondern durch drei separate Änderungen auf Produktebene, die einzeln betrachtet die internen Tests bestanden und in ihrer Gesamtheit das Tool spürbar schlechter für die Arbeit machten, die Entwickler tatsächlich benötigten.
Die Grundursache war nicht rätselhaft. Anthropic bestätigte sie selbst: reduzierte Reasoning-Tiefe, unterbrochenes Sitzungsgedächtnis und eine übermäßig rigide Verbositätsbeschränkung kamen nacheinander, wobei jede die vorherige noch verstärkte. Die Auswirkungen auf die Nutzer trafen am härtesten komplexe, langfristige Coding-Aufgaben , große Repositories, aufwendiges Refactoring, präzises Debugging. Einfachere Aufgaben überlebten einigermaßen unbeschadet, was den Leistungsabfall auf frustrierende Weise inkonsistent machte. Entwickler bildeten sich das nicht ein; sie hatten schlicht das Pech, genuин schwierige Arbeit zu verrichten, als die Räder still und leise davonrollten.
Drei sich überschneidende technische Fehler, die den Niedergang verursachten
Anthropics Nachbericht identifizierte nicht einen, sondern drei separate technische Fehler, die durch unglückliches Timing aufeinandergestapelt wurden wie ein Serienunfall in Zeitlupe zwischen März und April 2026. Der erste war ein bewusster Kompromiss, der nach hinten losging: Die Reduzierung von Claude Codes standardmäßigem Denkniveau von hoch auf mittel am 4. März, um die Latenz zu verringern , eine Entscheidung, die dabei still und leise die Ausgabequalität verschlechterte. Dann kam ein Caching-Fehler, der am 26. März eingeführt wurde und den Sitzungskontext nach jedem Durchgang löschte, gefolgt von einer Systemanpassung des Prompts am 16. April, die die Ausführlichkeit einschränken sollte, stattdessen aber die messbare Intelligenz der Antworten beeinträchtigte , wobei eine interne Schätzung den Verlust auf etwa 3 % bezifferte.
Aufwandsniveaureduzierung
Was als gut gemeinte Leistungsoptimierung begann, entwickelte sich still und leise zu einer der peinlicheren Phasen in Anthropics jüngerer Geschichte. Am 4. März 2025 passten Ingenieure die Aufwandskalibrierung von Claude an und senkten die standardmäßige Denktiefe von „hoch” auf „mittel” für alle Modelle. Das Ziel war die Reduzierung der Latenz für Claude-Code-Nutzer , auf dem Papier durchaus vernünftig.
Die Kompromisse beim Denkvermögen erwiesen sich jedoch als kostspielig. Entwickler bemerkten schnell eine verschlechterte Codequalität, und die Beschwerden häuften sich stetig. Anthropic räumte später in einem Engineering-Blog ein, dass die Entscheidung schlichtweg falsch war. Zu ihrer Ehre sei gesagt, dass sie es nicht endlos auf sich beruhen ließen. Am 7. April 2025 wurde der Standard zurückgesetzt , und sogar übertroffen. Opus 4.7 erhielt einen verbesserten „xhigh”-Denkstandard als Standard, was einer Überkorrektur in die richtige Richtung gleichkam. Kleine Gnaden.
Cache-Optimierungsfehler
Das Postmortem, als es schließlich eintraf, erzählte eine Geschichte, die komplizierter war als eine einzige schlechte Entscheidung. Der Cache-Optimierungsfehler , ausgeliefert am 26. März , sollte veraltetes Denken aus Sitzungen löschen, die länger als eine Stunde inaktiv waren. Vernünftig genug. Außer dass der Fehler diese Löschaktion bei *jedem nachfolgenden Durchlauf* auslöste, nicht nur einmal. Die praktische Konsequenz war eine unerbittliche Gedächtnisverschlechterung: Claude verlor kontinuierlich seinen angesammelten Denkprozess mitten in Gesprächen, wie jemand, der einem leise die Notizen zwischen Meetings stiehlt. Die Sitzungspersistenz brach in längeren Arbeitsabläufen vollständig zusammen. Entwickler bemerkten, dass Claude zunehmend repetitiv und merkwürdig vergesslich wurde , frustrierende Symptome, die zusammen mit der zuvor diskutierten Reduzierung des Denk-Aufwands das Bild eines systematischen Verfalls zeichneten, anstatt isolierter Störungen. Anthropic behob diesen spezifischen Fehler am 10. April in v2.1.101.
Versteckter System-Prompt-Wechsel
Hinter dem Cache-Fehler richtete ein zweiter Ausfall still und leise seinen eigenen Schaden an , und dieser war schwerer zu lokalisieren, gerade weil er sich nicht als eine einzelne fehlerhafte Codezeile ankündigte.
Claudes Architektur unterstützt Prompt-Schichtung aus mehreren Quellen gleichzeitig: voreingestellte Auswahlen, angehängte Anweisungen, CLAUDE.md-Projektdateien und Ausgabestil-Vorlagen. Jede Schicht befindet sich an einer anderen Position in der Anweisungshierarchie. Wenn mehrere gleichzeitig aktiviert werden, können versteckte Anweisungen aus einer Quelle eine andere still überschreiben, und die daraus resultierende Verhaltensänderung sieht von außen wie ein Qualitätsabfall aus, nicht wie eine Konfigurationskollision. Tonregeln, Hinweise zur Listenverwendung und Erwartungen an die Antwortlänge leben alle in diesen gestapelten Prompts. Ändert man eine Schicht, ohne die anderen zu prüfen, beginnt das Modell sich wie eine völlig andere Person zu verhalten.
Warum die Claude Code API nie betroffen war
Zu den aufschlussreicheren Details, die aus Anthropics Nachbereitung hervorgingen, gehörte eine klare Unterscheidung, die viele Nutzer bereits vermutet hatten: Die Claude API selbst war nie Teil des Problems. Die API-Stabilität hielt während der gesamten Episode stand, wobei die Modellintegrität auf der Inferenzschicht vollständig erhalten blieb. Die Verschlechterung lag ausschließlich in der Produktschicht , der zusätzlichen Umhüllung aus Standardeinstellungen, Prompts und Caching-Verhalten, die Tools wie Claude Code über das rohe Modell legten. Entwickler, die direkt auf die API zugriffen, einschließlich derjenigen, die über OpenRouter weiterleiteten oder tokenbasierte Automatisierungen ausführten, berichteten von keinerlei Unterbrechungen. Die API umging schlicht alle fehlerhaft konfigurierten Einstellungen, die für den Rückgang verantwortlich waren. Es war im Wesentlichen ein Produktproblem im Gewand eines Modellproblems , überzeugend genug, um Alarm auszulösen, aber von Anfang an strukturell begrenzt.
Wie lange die Degradierung lief, bevor ein Fix eingespielt wurde

Die Probleme begannen still am 4. März, als Anthropic die Reasoning-Intensität von Claude Code von hoch auf mittel herabsetzte , eine Latenzoptimierung, die sich als Qualitätsverschlechterung im Verborgenen entpuppte. Es folgte kein schneller Patch; stattdessen häuften sich die Probleme über Wochen, als zwei weitere Fehler obendrauf geschichtet wurden und jene Art von schleichender Verschlechterung erzeugten, die sich irgendwie schwerer diagnostizieren lässt als ein vollständiger Ausfall. Erst am 20. April, etwa 47 Tage nach diesem ersten Fehltritt, schloss Version v2.1.116 schließlich alle drei Probleme gleichzeitig ab.
Anfang März Ursprünge
Was als stille Konfigurationsanpassung am 4. März begann, sollte im Nachhinein den Auftakt einer etwa siebenwöchigen Regression markieren, die zahlende Claude-Nutzer frustrierte und Anthropic schließlich zu einer öffentlichen Nachbetrachtung zwang. Die Änderung selbst klang harmlos: die standardmäßige Reasoning-Intensität von Claude Code von hoch auf mittel zu senken, um die Latenz bei Antworten zu reduzieren, die so lang waren, dass die Benutzeroberfläche eingefroren wirkte. Auf dem Papier vernünftig. In der Praxis schädlich.
Das Community-Feedback ließ nicht lange auf sich warten , und war wenig höflich. Nutzer bemerkten, dass sich das Modell flacher anfühlte, weniger durchdacht. Das Vertrauen in das Modell, jene unsichtbare Währung, auf die Anthropic angewiesen ist, begann still zu erodieren. Sonnet 4.6 und Opus 4.6 trugen beide die Auswirkungen. Anthropic bezeichnete es später als den falschen Kompromiss , ein knappes Eingeständnis, dass Geschwindigkeit über die Intelligenz gestellt worden war, für die die Nutzer eigentlich bezahlten.
Wochen ohne Lösung
Stille hat, wie sich herausstellt, ihren Preis. Anthropics Problem mit dem stillen Gegenwind entstand nicht über Nacht , es akkumulierte sich über sieben unbequeme Wochen. Die ungelösten Verzögerungen stapelten sich methodisch, und ließen Entwickler mitten im Arbeitsablauf im Stich.
Drei unterschiedliche Degradierungsfenster definierten die Krise:
- 4. März , 7. April , Herabstufung der primären Schlussfolgerungsleistung hielt 34 Tage an
- 26. März , 10. April , Sitzungsspeicherfehler liefen gleichzeitig über 15 Tage
- 16. April , 20. April , Systemprompt-Interferenzen verschlechterten die Ausgabequalität in den letzten 4 Tagen
Kumulativ entspricht das ungefähr 50 Tagen produktionsbedingter Frustration. Für Entwickler, die auf zuverlässige Werkzeuge angewiesen sind, um ihre Autonomie und ihren Schwung zu bewahren, fühlte sich jeder nicht anerkannte Tag weniger wie ein technischer Ausrutscher an und mehr wie institutionelle Gleichgültigkeit. Freiheit erfordert schließlich eine funktionierende Infrastruktur.
20. April Fix
Nach sieben Wochen angesammelter Frustration zog Anthropic am 20. April endlich einen Schlussstrich unter die Claude Code-Regression, als Version v2.1.116 mit dem dritten und letzten Rollback ausgeliefert wurde. Die Prompt-Rücknahme richtete sich gegen eine am 16. April eingeführte Anweisung zur Reduzierung der Ausführlichkeit , vier Tage eskalierender Schäden, bevor die Ingenieure sie zurücknahmen.
| Behebungsdatum | Details zum Rollback |
|---|---|
| 7. April | Reasoning-Aufwand auf „hoch” wiederhergestellt |
| 10. April | Fehler beim Löschen des Sitzungs-Thinkings behoben |
| 16. April | Ausführlichkeits-Prompt eingeführt (Fehler) |
| 20. April | Ausführlichkeits-Prompt vollständig zurückgenommen |
Die API selbst war nie defekt , dies war ein reines Problem auf Produktebene. Drei aufeinanderfolgende Fehler, drei Korrekturen. Die Nutzer erlangten die Kontrolle über ein Werkzeug zurück, das ihnen ehrlich gesagt niemals still und leise hätte entzogen werden dürfen.
Warum haben Entwickler das Problem vor Anthropic entdeckt?

Wie konnte ein weitverzweigtes KI-Unternehmen übersehen, was seinen eigenen Nutzern fast sofort auffiel? Die Antwort liegt in schnellem Feedback und der Wachsamkeit der Nutzer, die zusammenwirken. Entwickler, die Claude Code verwendeten, führten keine abstrakten Benchmarks durch , sie erledigten *echte Arbeit*, wiederholt, bei vertrauten Aufgaben. Kleine Regressionen wurden schnell offensichtlich.
Drei Faktoren verschafften den Entwicklern einen entscheidenden Vorteil:
- Repetitive Arbeitsabläufe machten Vorher-Nachher-Vergleiche unvermeidlich , dieselben Aufgaben, dieselben Fehler, Sitzung für Sitzung.
- Messbare Ergebnisse wie Korrektheit des Codes und die Befolgung von Anweisungen legten Verschlechterungen konkreter offen als beiläufige Gespräche es je könnten.
- Koordination in der Community bedeutete, dass individuelle Beobachtungen schnell zu kollektiven Belegen wurden und die Diagnose beschleunigten.
Anthropic beobachtete unterdessen interne Metriken. Die Entwickler sahen zu, wie ihre eigentliche Arbeit auseinanderbrach. Einer dieser Feedback-Kreisläufe erwies sich als erheblich schneller.
Was Anthropics Post-Mortem tatsächlich zugegeben hat
Als Anthropic schließlich sein Schweigen brach, tat es etwas, das in der Technologiebranche relativ selten ist: Es sagte die Wahrheit. Die Nachuntersuchung bestätigte, dass die Qualität von Claude Code über einen Zeitraum von etwa einem Monat tatsächlich nachgelassen hatte, und der Verursacher war nicht das zugrunde liegende Modell. Drei separate Änderungen auf Produktebene, die zwischen dem 4. März und dem 16. April eingeführt worden waren, hatten sich still und leise zu einer echten, messbaren Regression summiert. Geringere Denkleistung, ein Caching-Fehler, der das Gesprächsgedächtnis löschte, und eine übermäßig aggressive Ausführlichkeitsbegrenzung hatten jede für sich vernünftig erschienen. Zusammen haben sie die Leistung still und leise ausgehöhlt. Dieses Maß an Produkttransparenz und Rechenschaftspflicht ist wichtig, insbesondere für Entwickler, die ihren Lebensunterhalt mit diesen Tools bestreiten. Anthropic stellte den Vorfall als gutgemeinte technische Fehler dar und nicht als absichtliche Kürzungen, was die Einräumung des Fehlers ehrlich gesagt glaubwürdiger machte.
Claude Code Kontingent wird zurückgesetzt: Was betroffene Nutzer zurückbekommen haben

Anthropics Reaktion auf die Kontingent-Kontroverse erfolgte in Form eines globalen Gegen-Flush , eines vollständigen Zurücksetzens der wöchentlichen Nutzungslimits, das für alle Claude Code-Nutzer auf der Plattform ausgerollt wurde. Konkret gesagt: Das haben die Nutzer tatsächlich zurückbekommen:
- Kontingentstand , Wöchentliche Obergrenzen wurden von null wiederhergestellt und verschafften sofort Erleichterung.
- Fortgesetzter Zugang , Nutzer konnten ihre Arbeit wieder aufnehmen, ohne auf automatische Auffüllzyklen warten zu müssen.
- Betriebliche Kontinuität , der Neustart begann ab dem Zeitstempel des Zurücksetzens frisch herunterzuzählen.
Was die Nutzer *nicht* zurückbekamen, ist ebenso bedeutsam. Das rollende Fünf-Stunden-Fenster blieb fest bestehen, und das Erreichen von Nutzungslimits bedeutete weiterhin Warten, ein Upgrade oder den Kauf von Credits. Das Zurücksetzen war Erleichterung, keine Befreiung , eine vorübergehende Atempause statt eines strukturellen Umdenkens darüber, wie Claude Code den Zugang regelt.
Was Anthropic versprochen hat, um dies zu verhindern, dass es wieder passiert
Nach der Quoten-Kontroverse, die aufgedeckt hatte, wie undurchsichtig die Zugriffskontrollen von Claude Code geworden waren, bemühte sich Anthropic darum, die Nutzer mit einer Reihe konkreter Zusagen zu beruhigen , einige struktureller, einige philosophischer Natur und einige, die gerade genug Spielraum für Interpretationen ließen.
In Bezug auf Transparenzverpflichtungen sicherte das Unternehmen zu, dass markierte oder abgelehnte Anfragen künftig sichtbar abgelehnt oder umgeleitet werden, wobei API-Nutzer genannte Gründe erhalten, anstatt auf stille Sackgassen zu stoßen. Das allein war eine bedeutende Veränderung. Auch die Sicherheitsoffenlegungen wurden verbessert , Anthropic verpflichtete sich zur Veröffentlichung von Frontier-Sicherheits-Roadmaps und regelmäßigen Risikoberichten. Die Zugriffskontrollen wurden verschärft, wobei binäre Autorisierung an jedem Endpunkt erforderlich ist und Honeypots zur Einbruchserkennung eingesetzt werden. Ob diese Versprechen unter Druck standhalten, bleibt der eigentliche Test. Anthropic formulierte sie als Ziele. Die Nutzer werden entscheiden, ob das ausreicht.
Was der Claude-Code-Vorfall über das Vertrauen in KI-Produkte verrät

- Hygiene in der Lieferkette ist entscheidend , ein übersehenes Artefakt kann eine gesamte Engineering-Architektur offenlegen.
- Erhöhte Privilegien erfordern strengere Governance , agentische Tools mit echten Ausführungsbefugnissen sind keine Chatbots; sie sind operative Systeme.
- Vertrauen geht über das Modell hinaus , Paketierung, Bereitstellung und Abhängigkeitsverwaltung definieren heute die Glaubwürdigkeit von Anbietern.
Unternehmen, die diese Entwicklung beobachten, erhielten eine klare Botschaft: Die Freiheit, KI-Tools verantwortungsvoll einzusetzen, erfordert mehr als beeindruckende Benchmarks. Es erfordert überprüfbare, disziplinierte Release-Prozesse.


