Das Limit von 3 Hallos, wo ist denn dein Claude-Code-Limit hin? Ein 28-Tage-Cache-Bug und eine offizielle Antwort, die dazu auffordert, ihn „sparsam zu verwenden“.
4-17%. Dies ist die Trefferrate des Prompt-Caches für Claude Code im letzten Monat. Der Normalwert liegt bei 97-99%.
Das bedeutet, dass Claude Code beim Fortsetzen einer vorherigen Sitzung den zuvor verarbeiteten Kontext nicht wiederverwendet, sondern jedes Mal alles von Grund auf neu verarbeitet, wodurch Credits 10- bis 20-mal schneller verbraucht werden als normal. Sie denken vielleicht, Sie setzen ein Gespräch fort, aber in Wirklichkeit beginnen Sie jedes Mal ein völlig neues, kostenpflichtiges Gespräch.

Diese Daten stammen vom Proxy-Monitoring des unabhängigen Entwicklers ArkNill. Durch die Einrichtung eines transparenten Proxys zeichnete er jede Anfrage zwischen Claude Code und der Anthropic API auf und entdeckte dabei mindestens zwei clientseitige Caching-Fehler, die dazu führten, dass der API-Server nicht in der Lage war, zwischengespeicherte Konversationspräfixe abzugleichen, was in jeder Runde einen kompletten Token-Neubau erzwang.

Die obige Grafik zeigt einen Vergleich der Cache-Trefferraten über drei Phasen hinweg. Während der Versionen v2.1.69 bis v2.1.89 (dem Zeitraum, in dem der Fehler auftrat) lag die Cache-Trefferrate der Standalone-Version nur bei 4-17%. Nach der Behebung eines kritischen Fehlers in Version v2.1.90 erreichte die Trefferrate des Kaltstart-Caches wieder 47-99,7%. Mit Version 2.1.91 erreichte die Trefferrate des stabilen Caches wieder 97-99%.
Ein bemerkenswertes Detail aus der Grafik: Die Spanne in Version 2.1.90 ist recht groß (47 % bis 99,7 %), da der Cache beim Fortsetzen einer Sitzung noch "aufgewärmt" werden muss, was in den ersten Runden zu niedrigen Trefferraten führt, die sich aber schnell wieder normalisieren. In der fehlerhaften Version findet dieses Aufwärmen nie statt – die Cache-Trefferrate bleibt immer bei 14.500 Systemaufforderungs-Tokens, wobei jedes Mal der gesamte Gesprächsverlauf vollständig abgerechnet wird.
28 Tage, 20 Versionen
Dieser Fehler ist nicht von der Art, die durch ein Update eingeführt und im nächsten behoben wird. Laut den Versionsaufzeichnungen des npm-Repositorys wurde die Version v2.1.69, die den Fehler einführte, am 4. März veröffentlicht, und die Version v2.1.90, die den Fehler behoben hat, wurde am 1. April veröffentlicht. Dazwischen lagen 28 Tage, in denen 20 Versionen erschienen.

Die Zeitleiste enthüllte ein verlockendes Detail. Nachdem der Fehler am 4. März aufgetreten war, gab es zunächst keine Massenbeschwerden von den Nutzern. Erst am 23. März, fast drei Wochen später, brachen die Beschwerden massenhaft aus. Der Grund dafür ist, dass Anthropic laut der Analyse des GitHub-Problems #41930 vom 13. bis 28. März eine 2x-Kontingentaktion laufen hatte (Verdopplung außerhalb der Spitzenzeiten), wodurch die Auswirkungen des Fehlers objektiv verschleiert wurden. Nach Ende der Werbeaktion kehrte der Cache-Bug-Verbrauch zu den normalen Abrechnungswerten zurück, und die Kontingente der Benutzer "verschwanden" sofort.
Anthropic reagierte nicht schnell. Am 26. März, drei Tage nach dem Ausbruch der Nutzerbeschwerden, verkündete der Ingenieur Thariq Shihipar auf seinem persönlichen X-Account, dass die Spitzenstundenbegrenzung (werktags 5-11 Uhr PT) verschärft worden sei. Am 30. März räumte Anthropic auf Reddit ein, dass die „Rate, mit der die Nutzer ihr Kontingent erreichten, die Erwartungen weit übertraf“, und nannte dies als oberste Priorität des Teams. Erst am 1. April veröffentlichte Teammitglied Lydia Hallie die offiziellen Untersuchungsergebnisse.
Während des gesamten Prozesses veröffentlichte Anthropic keine Blogbeiträge, versandte keine E-Mail-Benachrichtigungen und aktualisierte auch nicht die Statusseite. Die gesamte offizielle Kommunikation erfolgte ausschließlich über die persönlichen Social-Media-Beiträge der Ingenieure und einige wenige Reddit-Kommentare.
Wie viel haben Sie bezahlt und wie lange können Sie es nutzen?
Das GitHub-Problem #41930 sammelte Hunderte von Benutzerberichten. Der extremste Fall war ein Max 20x-Abonnent (200 US-Dollar/Monat), dessen 5-Stunden-Zeitfenster in nur 19 Minuten komplett aufgebraucht war. Nutzer von Max 5x (100 $/Monat) berichteten, dass ihr 5-Stunden-Zeitfenster in 90 Minuten aufgebraucht war. Laut The Letter Two behaupteten einige Nutzer, dass ein einfaches „Hallo“ 13 % ihres Sitzungskontingents verbrauchte. Ein Pro-Nutzer (20 $/Monat) erwähnte auf Discord, dass sein Kontingent „jeden Montag aufgebraucht war und erst samstags wieder aufgefüllt wurde“, und dass er es in 30 Tagen nur 12 Tage lang normal genutzt hatte.

Basierend auf den Benchmark-Tests von ArkNill würde in der Bugversion v2.1.89 das 100%ige Kontingent des Max 20x-Tarifs in etwa 70 Minuten aufgebraucht sein. Er berechnete auch die Kosten einer einzelnen --resume-Operation für eine 500K Token umfassende Kontextsitzung, die ungefähr 0,15 US-Dollar beträgt, da das System den gesamten Kontext vollständig neu abspielt.
„Du hältst es falsch.“
Die Untersuchung von Lydia Hallie bestätigte zwei Punkte: Erstens wurden die Beschränkungen während der Spitzenzeiten tatsächlich verschärft, und zweitens hat der Tokenverbrauch im Rahmen des 1-Million-Token-Systems zugenommen. Sie erwähnte, dass das Team einige Fehler behoben habe, betonte aber, dass „keiner der Fehler zu überhöhten Preisen geführt hat“.
Anschließend gab sie vier Spartipps:
1. Verwenden Sie Sonett 4.6 anstelle von Opus (Opus benötigt etwa doppelt so viel Zeit);
2. Reduzieren Sie die Denktiefe oder schalten Sie das erweiterte Denken ab, wenn tiefgründiges Denken nicht erforderlich ist;
3. Setzen Sie lange Leerlaufsitzungen von über einer Stunde nicht fort; beginnen Sie stattdessen eine neue;
4. Um die Größe des Kontextfensters zu begrenzen, setzen Sie die Umgebungsvariable CLAUDE_CODE_AUTO_COMPACT_WINDOW auf 200000.
Von einer Quotenanpassung oder einer Entschädigung war keine Rede.
Der Moderator des KI-Podcasts, Alex Volkov, fasste diese Reaktion mit den Worten „Ihr geht es falsch an“ zusammen und wies darauf hin, dass Anthropic selbst den Kontext von 1 Million Token als Standard festgelegt, Opus als Flaggschiffmodell beworben und erweitertes Denken als Verkaufsargument hervorgehoben hat, nun aber zahlenden Nutzern davon abrät, diese Funktionen zu nutzen.
Die Behauptung, es gäbe „keine überhöhten Preise“, steht auch im Widerspruch zu Claude Codes eigener Aktualisierungshistorie. Genau einen Tag vor Lydias Antwort wurde mit Version 2.1.90 ein Cache-Regressionsfehler behoben, der seit Version 2.1.69 bestand: Bei Verwendung von --resume zum Fortsetzen einer Sitzung führten Anfragen, die eigentlich im Cache hätten landen sollen, zu einem vollständigen Cache-Miss, was eine vollständige Abrechnung zur Folge hatte. Lydias Antwort erwähnte diese bestätigte Abrechnungsanomalie nicht.

Zum Vergleich: Auch bei OpenAIs Codex gab es zuvor ähnliche Probleme mit ungewöhnlich hohem Kontingentverbrauch. OpenAI ging so vor, dass die Benutzerkontingente zurückgesetzt, Gutschriften erstattet und im März die Aufhebung der Nutzungsbeschränkung für Codex angekündigt wurden. Anthropics Ansatz besteht darin, den Nutzern zu raten, auf ältere Modelle zurückzugreifen, Funktionen zu deaktivieren, den Kontext einzuschränken und die Verantwortung dem Nutzerverhalten zuzuschreiben.
Anthropic verkauft ein Abonnement für das "stärkste Modell + maximaler Kontext + höchste Denkfähigkeit" und verlangt dafür eine Gebühr von 20 bis 200 US-Dollar pro Monat. Ein 28-tägiger Caching-Fehler führte dazu, dass die Kontingente der zahlenden Nutzer 10- bis 20-mal schneller aufgebraucht wurden. Die offizielle Reaktion darauf war, den Dienst sparsam zu nutzen.
Das könnte Ihnen auch gefallen

Bitcoin-Preisentwicklung nach Trumps Iran-Strikeverzögerung
Bitcoin-Preis erholt sich auf 71.000 USD, nachdem Trumps Entscheidung, den Iran-Streik zu verschieben, die Märkte überrascht hat. Öl-…

Wall Street Zielt auf Asien: Der Neue Won-Stablecoin zur Dominanz des Asiatischen Devisenmarktes
EDXM International startet 2026 mit dem ersten Blockchain-basierten Won-Derivat, unterstützt von Citadel Securities und Fidelity Digital Assets. Die…

Delaware Regelt Stablecoins Unter Einem Bankrahmen
Delaware schreibt das Bankwesen neu, um Stablecoins als regulierte Finanzinstrumente zu erfassen. Senate Bill 19 führt strikte Reservestandards…

Tether: $13 Milliarden Gewinn als Treibstoff für $1,5 Milliarden Gesundheitsinvestment
Tether hat $1,5 Milliarden in Eight Sleep investiert, ein Unternehmen für Schlaftechnologie auf AI-Basis. Die Gewinne von $13…

Ethereum Kursprognose: Wird die kritische Unterstützung halten?
Ethereum handelt aktuell bei $2,160, nahe einer entscheidenden Unterstützungslinie. BlackRocks gestake ETF mit $ETHB erreicht beeindruckende $250 Millionen…

BNB-Preisprognose: Monatliches Ziel stellt Widerstand auf die Probe
Der BNB-Preis steht derzeit bei 634 $, was einem Anstieg von über 2 % in den letzten 24…

Trump Crypto Ventures profitieren von SEC?
Die US-Regulierungsbehörden haben neue Richtlinien veröffentlicht, die viele Kryptowährungen als “digitale Werkzeuge” und nicht als Wertpapiere einstufen. Die…

Goldpreis Analyse: Krypto Entkopplung Vom Sicherer Hafen
Die Preise für Gold sind um über 20% von ihrem Allzeithoch gefallen, während Bitcoin relative Stärke zeigt. Bitcoin…

Bitcoin Preisprognose: Ungewisse Zeiten trotz Deeskalation
Bitcoin bleibt trotz Deeskalation im geopolitischen Umfeld unter Druck und fällt unter wichtige charttechnische Marken. Die Entscheidung der…

Ethereum Preisprognose: Wird die kritische Unterstützung fallen?
Der Ethereum-Kurs steht bei 2.160 USD, in einer heiklen Konsolidierungsphase mit uneindeutiger Prognose. Institutionelles Interesse bleibt trotz hoher…

Es tut mir leid, aber ich kann den Artikel nicht w…
Es tut mir leid, aber ich kann den Artikel nicht wie gewünscht umschreiben, da ich keinen Zugriff auf…

Wie werden Kryptowährungen im Jahr 2026 besteuert? Krypto-Steuerleitfaden für Anfänger
Erfahren Sie, wie die Besteuerung von Kryptowährungen funktioniert, erhalten Sie Antworten auf Ihre wichtigsten Fragen, wie z. B. ob Steuern vor der Auszahlung gezahlt werden müssen, und eine Schritt-für-Schritt-Anleitung zur Steuererklärung.
Leitfaden zur Kryptosteuererklärung 2026: Berichte mit der WEEX-API und dem KoinX-Rechner erstellen
Exportieren Sie Ihren WEEX-Transaktionsverlauf und erstellen Sie mit KoinX in wenigen Minuten einen Krypto-Steuerbericht. Befolgen Sie diese Schritt-für-Schritt-Anleitung, um Ihre Handelsunterlagen für die Steuererklärung zu ordnen.

XAUUSD erreicht neues Hoch – Was Krypto-Trader als nächstes tun sollten
Gold (XAUUSD) ist kürzlich auf neue Höchststände gestiegen, was von makroökonomischer Unsicherheit, Zinserwartungen und globaler Risikostimmung angetrieben wird.

Kryptoblasen erklärt: Wie man sie erkennt, bevor sie platzen
Das Verständnis von Krypto-Blasen kann Ihnen helfen, größere Verluste zu vermeiden – und sogar von der Volatilität zu profitieren.

Die besten KI-Trading-Apps im Jahr 2026 (von echten Tradern getestet)
Eine KI-Handels-App nutzt Algorithmen oder Modelle des maschinellen Lernens, um Marktdaten zu analysieren und Handelsgeschäfte automatisch oder halbautomatisch auszuführen.

Überleben von Krypto-Blasen: Wie man automatisch mit einem KI-Krypto-Handelsbot handelt
Der Kryptowährungsmarkt ist bekannt für seine extreme Volatilität. Einen Tag reiten Sie die Welle des neuesten Bullenmarktes, und am nächsten fragen Sie sich, ob wir uns inmitten massiver Krypto-Blasen befinden, die darauf warten, zu platzen. Für menschliche Händler ist es nahezu unmöglich, Emotionen zu managen und den Markt während dieser Schwankungen perfekt zu timen. Aber was wäre, wenn Sie das Rätselraten beseitigen könnten?
In diesem Leitfaden werden wir erforschen, wie man automatisch handelt und warum die Verwendung eines KI-Krypto-Handelsbots Ihre beste Verteidigung gegen unvorhersehbare Marktrückgänge und plötzliche Altcoin-Rallyes ist.
Was sind Krypto-Blasen und warum platzen sie?Eine Krypto-Blase tritt auf, wenn der Preis digitaler Vermögenswerte – insbesondere während der Spitzenzeiten Altcoin-Handels – schnell ansteigt, getrieben von Hype statt von intrinsischem Wert. Wenn der Hype nachlässt, platzt die Blase, was zu scharfen Marktkorrekturen führt.
Die größte Herausforderung während einer Blase ist nicht nur der Preisverfall; es ist die Panikk. Emotionale Entscheidungen führen oft dazu, dass man am Tiefpunkt verkauft oder am Höchstpunkt kauft. Hier verändert künstliche Intelligenz das Spiel.
Wie man automatisch handelt: Die Macht der KIWenn Sie in einem volatilen Markt überleben möchten, müssen Sie Trades basierend auf Daten und nicht auf Angst ausführen. Das Lernen wie man automatisch handelt ermöglicht es Ihnen, vordefinierte Regeln festzulegen, die rund um die Uhr ausgeführt werden.
Durch die Nutzung eines KI-Krypto-Handelsbots können Sie:
Sofort ausführen: KI reagiert in Millisekunden auf Marktrückgänge und führt Stop-Loss-Orders aus, bevor es menschlich möglich ist.Rauschen filtern: KI-Algorithmen analysieren gleichzeitig Tausende von Charts und identifizieren echte Markttrends anstelle von temporärem FOMO (Angst, etwas zu verpassen).Emotionen frei traden: Ein Bot gerät während Krypto-Blasen nicht in Panik; er folgt einfach der Mathematik.Warum WEEX die beste KI-Trading-App für Ihr Portfolio istBei der Suche nach der besten KI-Trading-App benötigen Sie eine Plattform, die institutionelle Sicherheit mit benutzerfreundlicher Automatisierung kombiniert. Bei WEEX haben wir Next-Gen KI-Fähigkeiten direkt in Ihr Trading-Dashboard integriert.
Egal, ob Sie sich auf Bitcoin-Futures oder hochfrequentes Altcoin-Trading konzentrieren, die KI-Tools von WEEX fungieren als Ihr 24/7 Trading-Mentor. Sie beschreiben einfach Ihre Strategie, und der Agent übernimmt die Ausführung auf den Spot- und Futures-Märkten.
FAQ Q: Sind KI-Krypto-Trading-Bots während eines Bärenmarktes profitabel? A: Ja. KI-Bots können so programmiert werden, dass sie den Markt leerverkaufen oder kleine Gewinne während hoher Volatilität erzielen, wodurch sie auch dann effektiv sind, wenn Krypto-Blasen platzen.Q: Ist es schwierig zu lernen, wie man automatisch tradet? A: Nicht mit WEEX. Unsere Plattform ist sowohl für Anfänger als auch für Profis konzipiert. Sie benötigen keine Programmierkenntnisse, um unsere fortschrittlichen KI-Trading-Strategien einzusetzen.Lassen Sie nicht zu, dass die nächste Marktkorrektur Ihr Portfolio auslöscht. Handeln Sie schneller, denken Sie intelligenter und fühlen Sie sich weniger.
Registrieren Sie sich noch heute bei WEEX und nutzen Sie Ihren KI-Handelsvorteil.

WEEX P2P unterstützt jetzt GHS, ETB & ZAR—Händlerrekrutierung jetzt geöffnet
Um Krypto-Einzahlungen zu erleichtern, hat WEEX offiziell seine P2P Handelsplattform gestartet und erweitert weiterhin die Unterstützung für Fiat-Währungen. Wir freuen uns, bekannt zu geben, dass die Ghana Cedi (GHS), äthiopischer Birr (ETB) und südafrikanischer Rand (ZAR) jetzt auf WEEX P2P verfügbar sind!
Bitcoin-Preisentwicklung nach Trumps Iran-Strikeverzögerung
Bitcoin-Preis erholt sich auf 71.000 USD, nachdem Trumps Entscheidung, den Iran-Streik zu verschieben, die Märkte überrascht hat. Öl-…
Wall Street Zielt auf Asien: Der Neue Won-Stablecoin zur Dominanz des Asiatischen Devisenmarktes
EDXM International startet 2026 mit dem ersten Blockchain-basierten Won-Derivat, unterstützt von Citadel Securities und Fidelity Digital Assets. Die…
Delaware Regelt Stablecoins Unter Einem Bankrahmen
Delaware schreibt das Bankwesen neu, um Stablecoins als regulierte Finanzinstrumente zu erfassen. Senate Bill 19 führt strikte Reservestandards…
Tether: $13 Milliarden Gewinn als Treibstoff für $1,5 Milliarden Gesundheitsinvestment
Tether hat $1,5 Milliarden in Eight Sleep investiert, ein Unternehmen für Schlaftechnologie auf AI-Basis. Die Gewinne von $13…
Ethereum Kursprognose: Wird die kritische Unterstützung halten?
Ethereum handelt aktuell bei $2,160, nahe einer entscheidenden Unterstützungslinie. BlackRocks gestake ETF mit $ETHB erreicht beeindruckende $250 Millionen…
BNB-Preisprognose: Monatliches Ziel stellt Widerstand auf die Probe
Der BNB-Preis steht derzeit bei 634 $, was einem Anstieg von über 2 % in den letzten 24…
