Verwandeln Sie KI in ein individuelles Ausführungssystem: Claudes neuester Leitfaden für bewährte Verfahren im Bereich Managed Agents

By: blockbeats|2026/04/09 18:00:10

Originaltitel des Artikels: Einführung von Claude Managed Agents
Originalautor: Lance Martin
Übersetzung: Peggy, BlockBeats

Anmerkung der Redaktion: Dieser Artikel stellt die von Claude eingeführten Managed Agents vor. Es bietet eine Softwareform, die näher an der Zukunft liegt: Intelligente Agenten sind keine Schnittstellen mehr, die einmalig auf Anfragen reagieren, sondern Ausführungssysteme, die konfiguriert, bereitgestellt, geplant und langfristig betrieben werden können.

Durch die vollständige Entkopplung von „Intelligenz“ (Modell und Laufzeit-Framework), „Ausführung“ (Tools und Sandbox) und „Prozess“ (Sitzung und Protokoll) verwandeln Claude Managed Agents den Agenten von „Logik im Code“ in eine unabhängige Infrastruktureinheit. Dieses Design verbessert nicht nur die Stabilität und Sicherheit des Systems bei langlaufenden Aufgaben, sondern ermöglicht es den Agenten auch, sich kontinuierlich mit den Fähigkeiten des Modells weiterzuentwickeln, ohne durch bestehende Rahmenbedingungen eingeschränkt zu sein.

Innerhalb dieses Rahmens haben sich auch die üblichen Nutzungsmuster verändert: von ereignisgesteuerter und geplanter Ausführung hin zu automatischer Ausführung bei Zustellung und komplexen Aufgaben, die sich über Tage oder sogar Wochen erstrecken, erlangen die Agenten tatsächlich die Fähigkeit, „kontinuierlich zu arbeiten“. Dies bedeutet, dass sich der Wert von KI nicht mehr nur in der Qualität einer einzelnen Antwort widerspiegelt, sondern in ihrer Fähigkeit, sich im Laufe der Zeit zu akkumulieren und zu verstärken.

Während frühere APIs es Entwicklern ermöglichten, „Intelligenz aufzurufen“, versuchen Managed Agents nun, eine andere Frage zu beantworten: Wie kann Intelligenz zu einem System werden, das gehostet, geplant und kontinuierlich ausgeführt werden kann? In diesem Sinne sind Agenten nicht mehr nur Werkzeuge, sondern eher eine neue Rechenprimitive.

Der Originalartikel lautet wie folgt:

TL;DR

Claude Managed Agents sind ein vorkonfigurierbares Agentenausführungs-Framework (Agenten-Harness), das auf verwalteter Infrastruktur läuft. Sie müssen lediglich einen Agenten als Vorlage definieren – einschließlich Tools, Fähigkeiten, Datei-/Code-Repositories usw. – und der Rest des Laufzeit-Frameworks und der Infrastruktur wird vom System bereitgestellt. Dieses System ist darauf ausgelegt, mit Claudes schnell wachsendem Intelligenzniveau Schritt zu halten und längerfristige Aufgaben zu unterstützen.

Verwandte Links:

• Claude Blog : Nutzungsmuster und Kundenfälle

• Ingenieurblog : Design von Claude Managed Agents

• Dokumentation : Leitfaden für Einsteiger, Schnellstart, CLI- und SDK-Übersicht

Claude Managed Agents

Warum Claude Managed Agents benötigt werden

Die Messages-API von Claude ist im Grunde ein Einstiegspunkt, um direkt mit dem Modell zu interagieren: Man gibt eine Nachricht ein und erhält einen Inhaltsblock zurück. Intelligente Agenten, die auf der Messages API basieren, benötigen ein „Runtime-Framework“, um das Routing von Toolaufrufen, das Kontextmanagement und mehr zu handhaben. Dies birgt jedoch mehrere Herausforderungen:

1. Das Laufzeitframework muss mit den sich weiterentwickelnden Fähigkeiten von Claude Schritt halten.
Kürzlich habe ich einen Blogbeitrag darüber geschrieben, wie man einen Agenten auf Basis der zugrundeliegenden Funktionen der Claude-API zur Werkzeugorchestrierung und Kontextverwaltung erstellt. Das Problem besteht jedoch darin, dass das Laufzeit-Framework des Agenten oft Annahmen darüber impliziert, „was Claude nicht tun kann“. Mit zunehmenden Fähigkeiten von Claude werden diese Annahmen schnell überholt und können sich sogar zu Leistungsengpässen entwickeln. Daher muss das Laufzeit-Framework ständig aktualisiert werden, um mit Claudes Entwicklungsgeschwindigkeit Schritt halten zu können.

2. Claudes Aufgabenlebenszyklen werden länger
Die Bandbreite der Aufgaben, die Claude bewältigen kann, wächst exponentiell und übersteigt in METR-Benchmark-Tests 10 Stunden menschlicher Arbeitszeit. Dies stellt höhere Anforderungen an die zugrunde liegende Infrastruktur des Agenten: Sie muss Sicherheit, Stabilität in Langzeitszenarien (Umgang mit verschiedenen Infrastrukturausfällen) und Skalierbarkeit (z. B. Unterstützung mehrerer gleichzeitig laufender Agententeams) gewährleisten.

---Preis

Warum diese Herausforderungen wichtig sind

Die Bewältigung der oben genannten Herausforderungen ist von entscheidender Bedeutung, da wir davon ausgehen, dass zukünftige Versionen von Claude in der Lage sein werden, über Tage, Wochen oder sogar Monate hinweg kontinuierlich zu arbeiten und die komplexesten Probleme der Menschheit anzugehen.

Das Claude Agent SDK ist der erste Schritt in diese Richtung und bietet ein universelles, einfach zu bedienendes intelligentes Agenten-Laufzeitframework. Die Claude Managed Agents gehen derweil noch einen Schritt weiter: Aufbauend auf dieser Grundlage bieten sie ein komplettes Laufzeit-Framework sowie eine verwaltete Infrastruktur, die speziell für die sichere und zuverlässige Ausführung von Aufgaben über lange Zeiträume entwickelt wurde.

Erste Schritte

Ein einfacher Einstieg gelingt mit unserer Open-Source-Klasse Claude-API, die in Claude Code sofort einsatzbereit ist. Installieren Sie einfach die neueste Version von Claude Code und führen Sie dann den folgenden Unterbefehl aus, um die Initialisierungskonfiguration der Claude Managed Agents abzuschließen.

Ich persönlich bevorzuge den „Fähigkeiten“-Ansatz bei der Integration neuer Funktionen und nutze diese Fähigkeit auch in der Praxis ausgiebig.

Verwandeln Sie KI in ein individuelles Ausführungssystem: Claudes neuester Leitfaden für bewährte Verfahren im Bereich Managed Agents

Darüber hinaus können Sie in unserer Dokumentation nachlesen, wie Sie schnell mit dem SDK oder der CLI loslegen und Ihre Agenten in der Claude Console prototypisch entwickeln.

Anwendungsfälle

Im offiziellen Blog von Claude finden Sie viele interessante Anwendungsfälle. Durch die Kombination dieser Fallbeispiele mit meiner eigenen praktischen Erfahrung habe ich einige gemeinsame Nutzungsmuster beobachtet:

1. Ereignisgesteuert
Aufgabenausführung durch einen Managed Agent, ausgelöst durch einen Dienst.
Wird beispielsweise ein Fehler im System entdeckt, erfolgt ein automatisierter Aufruf an einen Managed Agent, der einen Patch schreibt und einen Pull Request einreicht. Zwischen den Phasen „Problem identifiziert“ und „Patch angewendet“ ist kein menschliches Eingreifen erforderlich.

2. Geplante Ausführung
Aufgaben planen, die von einem Managed Agent ausgeführt werden sollen.
Viele Menschen, mich eingeschlossen, nutzen diese Methode beispielsweise, um tägliche Berichte zu erstellen (etwa eine Zusammenfassung der Aktivitäten auf Plattform X oder GitHub oder einen vom Agenten erstellten Fortschrittsbericht eines Teams). Nachfolgend ein Beispiel meiner täglichen Zusammenfassung der Aktivitäten auf Plattform X.

3. Feuern und vergessen
Die Aufgabenausführung durch einen Managed Agent wird von einem Menschen ausgelöst, erfordert aber keine weitere Nachverfolgung. Beispielsweise können Aufgaben über Slack oder Teams einem verwalteten Agenten zugewiesen werden, der die Aufgabe dann selbstständig erledigt und die Ergebnisse (wie Tabellen, Folien oder sogar Anwendungen) liefert.

4. Langfristige Aufgaben
Eine langjährige Aufgabe, die ich als eines der besonders wertvollen Szenarien für Managed Agents betrachte.
Ich habe einige Experimente auf Basis des Auto-Research-Repositorys von Andrej Karpathy durchgeführt und dabei verschiedene Anwendungsmöglichkeiten erkundet. Zum Beispiel habe ich kürzlich die Pretext-Bibliothek von _chenglou als Grundlage genommen und einen Managed Agenten damit beauftragt, zu recherchieren, wie man sie auf unsere Blog-Inhalte im Ingenieurbereich anwenden kann.

Kernkonzepte

Im Onboarding-Prozess sind drei Kernkonzepte zu verstehen:

1. Agent
Eine versionskontrollierte Konfiguration, die die "Identität" des Agenten definiert: einschließlich Modell, Systemaufforderung, Tools, Fähigkeiten, MCP-Server usw. Nach ihrer Erstellung kann sie wiederholt über ihre ID aufgerufen werden.

2. Umfeld
Eine Vorlage zur Beschreibung der Sandbox-Umgebung, die für die Ausführung des Agententools bereitgestellt wird (z. B. Laufzeittyp, Netzwerkrichtlinie, Konfiguration der Abhängigkeitspakete usw.).

3. Sitzung
Eine zustandsbehaftete laufende Instanz, die auf Basis eines vorkonfigurierten Agenten und einer vorkonfigurierten Umgebung gestartet wurde. Dabei wird eine brandneue Sandbox aus der Umgebungsvorlage erstellt, die für diesen Lauf benötigten Ressourcen (wie Dateien, GitHub-Repositories) werden eingebunden und Authentifizierungsinformationen (wie MCP-Anmeldeinformationen) werden sicher in einem Keystore gespeichert.

Man kann es sich so vorstellen:

• Agent = Die Konfiguration selbst

• Umgebung = Die für den Agentenbetrieb erforderliche Sandbox-Vorlage.

• Sitzung = Ein bestimmter Ausführungsprozess

Ein Agent kann mehreren Sitzungen zugeordnet sein.

Verwendung

Weitere Einzelheiten entnehmen Sie bitte der Dokumentation. Die Gesamtnutzung lässt sich in zwei Kategorien unterteilen:

1. SDK (Codeorientiert)
Integrieren Sie das SDK in Ihre Anwendung, um Sitzungen zur Laufzeit zu steuern. Aktuell unterstützen Managed Agents 6 Sprachen: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Befehlszeilenschnittstelle)
Interagieren Sie über die Befehlszeile mit allen API-Ressourcen, einschließlich Agenten, Umgebungen, Sitzungen, Tresoren, Fähigkeiten, Dateien usw. Jedem Ressourcentyp sind entsprechende Unterbefehle zugeordnet.

Übliche Praxis:
Normalerweise wird die CLI für Konfiguration und Initialisierung verwendet, während das SDK für die Laufzeitlogik zum Einsatz kommt.
Eine Agentenvorlage ist persistent – Sie können eine Vorlage erstellen (z. B. durch Definition des Modells, der Systemaufforderung, der Tools, des MCP-Servers und der Fähigkeiten in YAML), diese in Git speichern und sie während des Bereitstellungsprozesses über die CLI anwenden.

Workflow

Ich habe zusammen mit @mc_anthropic, @gcemaj und @jkeatn einen Blogbeitrag zum Thema Anthropic Engineering verfasst, der eine detaillierte Erklärung zum Aufbau der Claude Managed Agents liefert. Eine zentrale Schlussfolgerung des Artikels war, dass die Skalierung von Agenten mit Claudes Intelligenzniveau grundsätzlich ein „Infrastrukturproblem“ darstellt und nicht nur ein Problem des Laufzeit-Frameworks.

Das bedeutet, dass die eigentliche Herausforderung nicht darin besteht, „einen intelligenteren Agenten zu schreiben“, sondern darin, ein System zu entwickeln, das langfristig stabil läuft, skalierbar und evolvierbar ist und es dem Agenten ermöglicht, zunehmend komplexere und längerfristige Aufgaben zu übernehmen.

Ausgehend von dieser Philosophie did-133">haben wir kein festes Laufzeitframework (Gerüst) für den Agenten entworfen, da wir dessen kontinuierliche Weiterentwicklung erwarteten. Stattdessen haben wir mehrere wichtige Systemteile „entkoppelt“:

„Gehirn“ (Claude und sein Laufzeit-Framework)

„Hände“ (Sandkasten und Werkzeug, die konkrete Handlungen ausführen)

„Sitzung“ (protokolliert Ereignisprotokolle der Ausführung)

Diese drei wurden als unabhängige Schnittstellen konzipiert, die nur minimale Annahmen übereinander treffen. Jedes Teil kann unabhängig ausfallen oder ersetzt werden, ohne dass dies Auswirkungen auf das Gesamtsystem hat.

Im Artikel haben wir auch erläutert, wie diese Architektur höhere Zuverlässigkeit, Sicherheit und Flexibilität bietet und gleichzeitig Raum für die zukünftige Integration neuer Laufzeit-Frameworks, Sandboxes oder Infrastruktur-Hosting-Sessions lässt.

Abschluss

Ich bin sehr gespannt auf Projekte, die sich mit Multiagenten-Orchestrierung oder langfristigen Aufgaben beschäftigen. Was mich in der Vergangenheit immer wieder frustriert hat, ist, wie schwer es dem Ausführungsrahmen des Agenten fällt, mit den sich ständig weiterentwickelnden Fähigkeiten des Modells Schritt zu halten.

Die Bedeutung von Claude Managed Agents liegt darin, dass es sich um das Ausführungsframework und die Infrastrukturschicht kümmert, sodass Sie sich auf eine höhere Ebene konzentrieren können – indem Sie den „Agenten“ selbst als neues grundlegendes Primitiv in der Claude-API behandeln und darauf aufbauend weitere Erkundungen und Entwicklungen ermöglichen.

[ Link zum Originalbeitrag ]

Das könnte Ihnen auch gefallen

Von Casino-Tools zu globalen Preismaschinen: Die Perspektive des NYSE-Chefs auf Hyperliquid

„Warum dürfen die das, und wir nicht?“ Diese rhetorische Frage offenbart nicht nur die Besorgnis traditioneller Börsen, sondern spiegelt auch das subtile und komplexe Kräftemessen zwischen TradFi und DeFi wider, nachdem sich unbefristete Terminkontrakte (Perpetuals) von Glücksspielinstrumenten zu einer globalen Infrastruktur für die Preisfindung gewandelt haben.

Sind es Hacker und Regulierungsbehörden, die DeFi ruiniert haben?

Die Zukunft von DeFi wird sich entweder in Richtung einer strengeren Selbstregulierung der Branche und eines Compliance-Rahmens bewegen, wobei Kompromisse bei den Prinzipien der Dezentralisierung eingegangen werden müssen; oder sie wird aufgrund des anhaltenden Ungleichgewichts zwischen Angriff und Verteidigung allmählich das Vertrauen des Marktes verlieren, was zu einer langfristigen Marginalisierung führt.

Chris Lee: Vom Krypto-OG zu Großinvestitionen in die drei Speicher-Giganten, Prognosen zu KI-Bullenmarkt-Korrekturen, Web4 und Chancen für die junge Generation

Die Web3-Ära ist vorbei, dem Kapitalfluss folgend.

He Yidengs Rang: Wenn du schon einmal hier bist, kannst du es auch versuchen

He Yi von Binance wurde in die Liste der "Most Powerful Women in Business" von Fortune aufgenommen, drückte der Community ihren Dank aus und kündigte die neue Vision von Binance an: den Aufbau einer Finanzinfrastruktur für 3 Milliarden Menschen weltweit.

Sechs große Kritikpunkte eines Ethereum-Entwicklers

Ethereum hat nicht den Markt verpasst, sondern sich selbst.

WEEX GOGOGO Folge 3｜LALIGA Road to Gold – 6 explosive Momente, 1 WM-Ticket und eine Nacht, die niemand vergessen wird

WEEX ging am 24. Mai mit LALIGA, KI-Trading, Gold ohne Gebühren und 100 % effektivem Jahreszins an den Start. Der Chat explodierte. Die Belohnungen flossen. Und ein glücklicher Fan ging mit einem WM-Ticket nach Hause. Hier ist, was passiert ist.

2 Jahre, 225-fache Rendite? Wir enthüllen die KI-„Flaschenhals“-Anlagestrategie des mysteriösen Forschers Serenity

Der ehemalige WSB-Trader Serenity hat auf der X-Plattform innerhalb von zwei Jahren eine beeindruckende 225-fache Rendite erzielt. Seine originelle Theorie zum „Lieferketten-Flaschenhals“ und mehrere klassische Fallstudien zu Micro-Cap-Reverse-Sniper-Trades haben große Aufmerksamkeit am Markt erregt.

B.AI kooperiert mit BNB Chain zum Start der „Billion AI Token Subsidy“-Feier und entfacht das On-Chain-Ökosystem für intelligente Agenten

B.AI kooperiert mit BNB Chain für ein Subventionsprogramm in Höhe von hundert Milliarden Punkten, ergänzt durch einen speziellen Anreiz von 8.000 USDT im Gesamtpreispool, um Web3-Nutzern den barrierefreien Zugang zu führenden Large Models und eine Full-Stack-KI-Finanzinfrastruktur zu ermöglichen.

Der Billionen-Dollar-Rausch beim Speicherverkauf: Gewinne beim Speicherkauf halbiert

Die Nachfrage nach Rechenleistung und Speicher durch KI könnte tatsächlich struktureller Natur sein, und LTA hat möglicherweise die Branchenregeln grundlegend neu geschrieben; ein Marktwert von einer Billion Dollar ist womöglich erst der Anfang.

Morgenbericht | Binance startet DYOR-Recherche-Tool; YZi Labs startet Rekrutierungsplattform YZi Talent; Vitalik erklärt, dass die Ethereum Foundation „verkleinern“ und den Verkauf von ETH reduzieren wird

Überblick über wichtige Marktereignisse am 25. Mai

Der Mars-Traum von SuperEx: Digitale Währungen als Schlüssel für den wirtschaftlichen Austausch im interstellaren Zeitalter

SuperEx hat Börsen stets dazu aufgerufen, sich nicht auf interne Konflikte und Wettbewerb zu konzentrieren, sondern gemeinsam die Entwicklung digitaler Währungen voranzutreiben, um zu einer treibenden Kraft für das kommende interstellare Zeitalter zu werden.

Morgennachrichten | Michael Saylor gab an, diese Woche Anleihen statt Bitcoin gekauft zu haben; StablR wurde angegriffen und verlor etwa 2,8 Millionen Dollar; der US-Kongress treibt den Bitcoin Reserve Act erneut voran

Überblick über wichtige Marktereignisse am 24. Mai

Wichtigste Erkenntnisse: Volltext der Rede von Google-Chef-Wissenschaftler Shanahan

Die Londoner Rede des Google DeepMind-Chef-Wissenschaftlers Shanahan: Dekonstruktion der mentalen Attribute großer Sprachmodelle (LLMs) unter Verwendung des Wittgenstein-Rahmenwerks und Analyse des Trends zur „fremdartigen Selbstidentität“ im Kontext von Allwetter-Agenten.

Agentic Design Patterns: Ein Buch, das mich dazu brachte, „Was genau ist ein Agent?“ zu überdenken

Das neue Buch eines Google Engineering Directors analysiert tiefgreifend: 21 Design-Patterns für KI-Agenten. Dieser Artikel enthüllt die Kernentwicklung vom „nackten LLM“ zu fortschrittlichen intelligenten Agenten und erläutert Context Engineering, den dualen Agenten-Reflektionsmechanismus (Producer-Critic) sowie das Drei-Schichten-Speichermodell, u. a.

Der reichste Fed-Chef seit 112 Jahren ist da: Kevin Warsh schreibt die Regeln neu

Der „reichste“ neue Vorsitzende der Federal Reserve, Kevin Warsh, hat sein Amt offiziell angetreten. Sein alternativer Vorschlag einer „Bilanzverkürzung bei gleichzeitiger Zinssenkung“ zielt nicht nur darauf ab, den Entscheidungsmechanismus umzugestalten, sondern auch das US-Finanzministerium, den Dollar und die globale...

Vitalik über die Zukunft der Ethereum Foundation: Ein kleineres, markanteres und beständigeres Schiff

Vitalik erläuterte seine persönlichen Ansichten zur Ausrichtung der Ethereum Foundation: Die EF ist nicht das „Zentrum von Ethereum“, sondern einer von vielen Knotenpunkten. Mit begrenzten Ressourcen setzt die EF auf Langfristigkeit statt auf Überlastung und konzentriert sich auf Kernaufgaben, die „ohne die EF nicht stattfinden würden“ –...

Neue Formen der Informationswäsche auf Prognosemärkten: Wie Geheimnisse in Investitionssignale einfließen

Die harte Realität ist, dass Informationswäsche keine von Menschen geschaffene Lücke im Prognosemarkt ist, sondern ein Nebenprodukt seines grundlegenden Funktionsmechanismus.

WEEX Bitcoin Pizza Day: Keine Gebühren, BTC-Cashback & 150.000 USDT zur Feier der Krypto-Geschichte

Feiern Sie den Pizza Day mit WEEX! Von gebührenfreiem Handel bis hin zu BTC-Cashback – wir ehren die erste Bitcoin-Transaktion der Welt. Ein Preispool von 150.000 USDT ist die Art und Weise, wie WEEX seine Nutzer belohnt und die Krypto-Geschichte würdigt.

Von Casino-Tools zu globalen Preismaschinen: Die Perspektive des NYSE-Chefs auf Hyperliquid

Sind es Hacker und Regulierungsbehörden, die DeFi ruiniert haben?

Chris Lee: Vom Krypto-OG zu Großinvestitionen in die drei Speicher-Giganten, Prognosen zu KI-Bullenmarkt-Korrekturen, Web4 und Chancen für die junge Generation

Die Web3-Ära ist vorbei, dem Kapitalfluss folgend.