Verwandeln Sie KI in ein individuelles Ausführungssystem: Claudes neuester Leitfaden für bewährte Verfahren im Bereich Managed Agents

By: blockbeats|2026/04/09 18:00:03
0
Teilen
copy
Originaltitel des Artikels: Einführung von Claude Managed Agents
Originalautor: Lance Martin
Übersetzung: Peggy, BlockBeats

Anmerkung der Redaktion: Dieser Artikel stellt die von Claude eingeführten Managed Agents vor. Es bietet eine Softwareform, die näher an der Zukunft liegt: Intelligente Agenten sind keine Schnittstellen mehr, die einmalig auf Anfragen reagieren, sondern Ausführungssysteme, die konfiguriert, bereitgestellt, geplant und langfristig betrieben werden können.

Durch die vollständige Entkopplung von „Intelligenz“ (Modell und Laufzeit-Framework), „Ausführung“ (Tools und Sandbox) und „Prozess“ (Sitzung und Protokoll) verwandeln Claude Managed Agents den Agenten von „Logik im Code“ in eine unabhängige Infrastruktureinheit. Dieses Design verbessert nicht nur die Stabilität und Sicherheit des Systems bei langlaufenden Aufgaben, sondern ermöglicht es den Agenten auch, sich kontinuierlich mit den Fähigkeiten des Modells weiterzuentwickeln, ohne durch bestehende Rahmenbedingungen eingeschränkt zu sein.

Innerhalb dieses Rahmens haben sich auch die üblichen Nutzungsmuster verändert: von ereignisgesteuerter und geplanter Ausführung hin zu automatischer Ausführung bei Zustellung und komplexen Aufgaben, die sich über Tage oder sogar Wochen erstrecken, erlangen die Agenten tatsächlich die Fähigkeit, „kontinuierlich zu arbeiten“. Dies bedeutet, dass sich der Wert von KI nicht mehr nur in der Qualität einer einzelnen Antwort widerspiegelt, sondern in ihrer Fähigkeit, sich im Laufe der Zeit zu akkumulieren und zu verstärken.

Während frühere APIs es Entwicklern ermöglichten, „Intelligenz aufzurufen“, versuchen Managed Agents nun, eine andere Frage zu beantworten: Wie kann Intelligenz zu einem System werden, das gehostet, geplant und kontinuierlich ausgeführt werden kann? In diesem Sinne sind Agenten nicht mehr nur Werkzeuge, sondern eher eine neue Rechenprimitive.

Der Originalartikel lautet wie folgt:

TL;DR

Claude Managed Agents sind ein vorkonfigurierbares Agentenausführungs-Framework (Agenten-Harness), das auf verwalteter Infrastruktur läuft. Sie müssen lediglich einen Agenten als Vorlage definieren – einschließlich Tools, Fähigkeiten, Datei-/Code-Repositories usw. – und der Rest des Laufzeit-Frameworks und der Infrastruktur wird vom System bereitgestellt. Dieses System ist darauf ausgelegt, mit Claudes schnell wachsendem Intelligenzniveau Schritt zu halten und längerfristige Aufgaben zu unterstützen.

Verwandte Links:

Claude Blog : Nutzungsmuster und Kundenfälle

Ingenieurblog : Design von Claude Managed Agents

Dokumentation : Leitfaden für Einsteiger, Schnellstart, CLI- und SDK-Übersicht

Claude Managed Agents

Warum Claude Managed Agents benötigt werden

Die Messages-API von Claude ist im Grunde ein Einstiegspunkt, um direkt mit dem Modell zu interagieren: Man gibt eine Nachricht ein und erhält einen Inhaltsblock zurück. Intelligente Agenten, die auf der Messages API basieren, benötigen ein „Runtime-Framework“, um das Routing von Toolaufrufen, das Kontextmanagement und mehr zu handhaben. Dies birgt jedoch mehrere Herausforderungen:

1. Das Laufzeitframework muss mit den sich weiterentwickelnden Fähigkeiten von Claude Schritt halten.
Kürzlich habe ich einen Blogbeitrag darüber geschrieben, wie man einen Agenten auf Basis der zugrundeliegenden Funktionen der Claude-API zur Werkzeugorchestrierung und Kontextverwaltung erstellt. Das Problem besteht jedoch darin, dass das Laufzeit-Framework des Agenten oft Annahmen darüber impliziert, „was Claude nicht tun kann“. Mit zunehmenden Fähigkeiten von Claude werden diese Annahmen schnell überholt und können sich sogar zu Leistungsengpässen entwickeln. Daher muss das Laufzeit-Framework ständig aktualisiert werden, um mit Claudes Entwicklungsgeschwindigkeit Schritt halten zu können.

2. Claudes Aufgabenlebenszyklen werden länger
Die Bandbreite der Aufgaben, die Claude bewältigen kann, wächst exponentiell und übersteigt in METR-Benchmark-Tests 10 Stunden menschlicher Arbeitszeit. Dies stellt höhere Anforderungen an die zugrunde liegende Infrastruktur des Agenten: Sie muss Sicherheit, Stabilität in Langzeitszenarien (Umgang mit verschiedenen Infrastrukturausfällen) und Skalierbarkeit (z. B. Unterstützung mehrerer gleichzeitig laufender Agententeams) gewährleisten.

---Preis

--

Warum diese Herausforderungen wichtig sind

Die Bewältigung der oben genannten Herausforderungen ist von entscheidender Bedeutung, da wir davon ausgehen, dass zukünftige Versionen von Claude in der Lage sein werden, über Tage, Wochen oder sogar Monate hinweg kontinuierlich zu arbeiten und die komplexesten Probleme der Menschheit anzugehen.

Das Claude Agent SDK ist der erste Schritt in diese Richtung und bietet ein universelles, einfach zu bedienendes intelligentes Agenten-Laufzeitframework. Die Claude Managed Agents gehen derweil noch einen Schritt weiter: Aufbauend auf dieser Grundlage bieten sie ein komplettes Laufzeit-Framework sowie eine verwaltete Infrastruktur, die speziell für die sichere und zuverlässige Ausführung von Aufgaben über lange Zeiträume entwickelt wurde.

Erste Schritte

Ein einfacher Einstieg gelingt mit unserer Open-Source-Klasse Claude-API, die in Claude Code sofort einsatzbereit ist. Installieren Sie einfach die neueste Version von Claude Code und führen Sie dann den folgenden Unterbefehl aus, um die Initialisierungskonfiguration der Claude Managed Agents abzuschließen.

Ich persönlich bevorzuge den „Fähigkeiten“-Ansatz bei der Integration neuer Funktionen und nutze diese Fähigkeit auch in der Praxis ausgiebig.

Verwandeln Sie KI in ein individuelles Ausführungssystem: Claudes neuester Leitfaden für bewährte Verfahren im Bereich Managed Agents

Darüber hinaus können Sie in unserer Dokumentation nachlesen, wie Sie schnell mit dem SDK oder der CLI loslegen und Ihre Agenten in der Claude Console prototypisch entwickeln.

Anwendungsfälle

Im offiziellen Blog von Claude finden Sie viele interessante Anwendungsfälle. Durch die Kombination dieser Fallbeispiele mit meiner eigenen praktischen Erfahrung habe ich einige gemeinsame Nutzungsmuster beobachtet:

1. Ereignisgesteuert
Aufgabenausführung durch einen Managed Agent, ausgelöst durch einen Dienst.
Wird beispielsweise ein Fehler im System entdeckt, erfolgt ein automatisierter Aufruf an einen Managed Agent, der einen Patch schreibt und einen Pull Request einreicht. Zwischen den Phasen „Problem identifiziert“ und „Patch angewendet“ ist kein menschliches Eingreifen erforderlich.

2. Geplante Ausführung
Aufgaben planen, die von einem Managed Agent ausgeführt werden sollen.
Viele Menschen, mich eingeschlossen, nutzen diese Methode beispielsweise, um tägliche Berichte zu erstellen (etwa eine Zusammenfassung der Aktivitäten auf Plattform X oder GitHub oder einen vom Agenten erstellten Fortschrittsbericht eines Teams). Nachfolgend ein Beispiel meiner täglichen Zusammenfassung der Aktivitäten auf Plattform X.

3. Feuern und vergessen
Die Aufgabenausführung durch einen Managed Agent wird von einem Menschen ausgelöst, erfordert aber keine weitere Nachverfolgung. Beispielsweise können Aufgaben über Slack oder Teams einem verwalteten Agenten zugewiesen werden, der die Aufgabe dann selbstständig erledigt und die Ergebnisse (wie Tabellen, Folien oder sogar Anwendungen) liefert.

4. Langfristige Aufgaben
Eine langjährige Aufgabe, die ich als eines der besonders wertvollen Szenarien für Managed Agents betrachte.
Ich habe einige Experimente auf Basis des Auto-Research-Repositorys von Andrej Karpathy durchgeführt und dabei verschiedene Anwendungsmöglichkeiten erkundet. Zum Beispiel habe ich kürzlich die Pretext-Bibliothek von _chenglou als Grundlage genommen und einen Managed Agenten damit beauftragt, zu recherchieren, wie man sie auf unsere Blog-Inhalte im Ingenieurbereich anwenden kann.

Kernkonzepte

Im Onboarding-Prozess sind drei Kernkonzepte zu verstehen:

1. Agent
Eine versionskontrollierte Konfiguration, die die "Identität" des Agenten definiert: einschließlich Modell, Systemaufforderung, Tools, Fähigkeiten, MCP-Server usw. Nach ihrer Erstellung kann sie wiederholt über ihre ID aufgerufen werden.

2. Umfeld
Eine Vorlage zur Beschreibung der Sandbox-Umgebung, die für die Ausführung des Agententools bereitgestellt wird (z. B. Laufzeittyp, Netzwerkrichtlinie, Konfiguration der Abhängigkeitspakete usw.).

3. Sitzung
Eine zustandsbehaftete laufende Instanz, die auf Basis eines vorkonfigurierten Agenten und einer vorkonfigurierten Umgebung gestartet wurde. Dabei wird eine brandneue Sandbox aus der Umgebungsvorlage erstellt, die für diesen Lauf benötigten Ressourcen (wie Dateien, GitHub-Repositories) werden eingebunden und Authentifizierungsinformationen (wie MCP-Anmeldeinformationen) werden sicher in einem Keystore gespeichert.

Man kann es sich so vorstellen:

• Agent = Die Konfiguration selbst

• Umgebung = Die für den Agentenbetrieb erforderliche Sandbox-Vorlage.

• Sitzung = Ein bestimmter Ausführungsprozess

Ein Agent kann mehreren Sitzungen zugeordnet sein.

Verwendung

Weitere Einzelheiten entnehmen Sie bitte der Dokumentation. Die Gesamtnutzung lässt sich in zwei Kategorien unterteilen:

1. SDK (Codeorientiert)
Integrieren Sie das SDK in Ihre Anwendung, um Sitzungen zur Laufzeit zu steuern. Aktuell unterstützen Managed Agents 6 Sprachen: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Befehlszeilenschnittstelle)
Interagieren Sie über die Befehlszeile mit allen API-Ressourcen, einschließlich Agenten, Umgebungen, Sitzungen, Tresoren, Fähigkeiten, Dateien usw. Jedem Ressourcentyp sind entsprechende Unterbefehle zugeordnet.

Übliche Praxis:
Normalerweise wird die CLI für Konfiguration und Initialisierung verwendet, während das SDK für die Laufzeitlogik zum Einsatz kommt.
Eine Agentenvorlage ist persistent – ​​Sie können eine Vorlage erstellen (z. B. durch Definition des Modells, der Systemaufforderung, der Tools, des MCP-Servers und der Fähigkeiten in YAML), diese in Git speichern und sie während des Bereitstellungsprozesses über die CLI anwenden.

Workflow

Ich habe zusammen mit @mc_anthropic, @gcemaj und @jkeatn einen Blogbeitrag zum Thema Anthropic Engineering verfasst, der eine detaillierte Erklärung zum Aufbau der Claude Managed Agents liefert. Eine zentrale Schlussfolgerung des Artikels war, dass die Skalierung von Agenten mit Claudes Intelligenzniveau grundsätzlich ein „Infrastrukturproblem“ darstellt und nicht nur ein Problem des Laufzeit-Frameworks.

Das bedeutet, dass die eigentliche Herausforderung nicht darin besteht, „einen intelligenteren Agenten zu schreiben“, sondern darin, ein System zu entwickeln, das langfristig stabil läuft, skalierbar und evolvierbar ist und es dem Agenten ermöglicht, zunehmend komplexere und längerfristige Aufgaben zu übernehmen.

Ausgehend von dieser Philosophie did-133">haben wir kein festes Laufzeitframework (Gerüst) für den Agenten entworfen, da wir dessen kontinuierliche Weiterentwicklung erwarteten. Stattdessen haben wir mehrere wichtige Systemteile „entkoppelt“:

„Gehirn“ (Claude und sein Laufzeit-Framework)

„Hände“ (Sandkasten und Werkzeug, die konkrete Handlungen ausführen)

„Sitzung“ (protokolliert Ereignisprotokolle der Ausführung)

Diese drei wurden als unabhängige Schnittstellen konzipiert, die nur minimale Annahmen übereinander treffen. Jedes Teil kann unabhängig ausfallen oder ersetzt werden, ohne dass dies Auswirkungen auf das Gesamtsystem hat.

Im Artikel haben wir auch erläutert, wie diese Architektur höhere Zuverlässigkeit, Sicherheit und Flexibilität bietet und gleichzeitig Raum für die zukünftige Integration neuer Laufzeit-Frameworks, Sandboxes oder Infrastruktur-Hosting-Sessions lässt.

Abschluss

Ich bin sehr gespannt auf Projekte, die sich mit Multiagenten-Orchestrierung oder langfristigen Aufgaben beschäftigen. Was mich in der Vergangenheit immer wieder frustriert hat, ist, wie schwer es dem Ausführungsrahmen des Agenten fällt, mit den sich ständig weiterentwickelnden Fähigkeiten des Modells Schritt zu halten.

Die Bedeutung von Claude Managed Agents liegt darin, dass es sich um das Ausführungsframework und die Infrastrukturschicht kümmert, sodass Sie sich auf eine höhere Ebene konzentrieren können – indem Sie den „Agenten“ selbst als neues grundlegendes Primitiv in der Claude-API behandeln und darauf aufbauend weitere Erkundungen und Entwicklungen ermöglichen.

[ Link zum Originalbeitrag ]

Das könnte Ihnen auch gefallen

Krypto-Markt Makro-Forschung: US-Iran Waffenstillstand, Zeit zur Neubewertung von Risikoanlagen

Wie beeinflusst der US-Iran Waffenstillstand Risikoanlagen?

Hyperbeat plant die Einführung einer „Bank“ auf Hyperliquid.

Eine Kette, die für Transaktionen geschaffen wurde und nun möchte, dass Sie dort auch noch Ihren Gehaltsscheck verstecken.

Erreicht Bitcoin im Jahr 2026 seinen Tiefpunkt? Wie der Zollschock und der Waffenstillstand den Bitcoin-Kurs in Richtung 75.000 US-Dollar treiben könnten

Bitcoin könnte seinen Tiefpunkt für 2026 bei etwa 65.000 US-Dollar erreichen. Erfahren Sie, wie sich Zollschocks, ETF-Zuflüsse und der Waffenstillstand im Iran auf den nächsten Ausbruch von BTC in Richtung 75.000 US-Dollar auswirken könnten.

Stablecoins erreichen 315 Milliarden Dollar im Jahr 2026: Warum dies der größte Trend im Krypto-Bereich derzeit ist

Bitcoin könnte sein Tief im Jahr 2026 nahe 65.000 Dollar bilden. Sehen Sie, wie Tariffschocks, ETF-Zuflüsse und geopolitische Signale BTCs nächsten Ausbruch in Richtung 75.000 Dollar gestalten könnten.

Tigerforschung: Eine umfassende Analyse der profitabelsten Unternehmen und ihrer Geschäftsmodelle im Kryptobereich

Zahlungsgebühren, gemeinsam genutzte Infrastruktur und Offshore-Nachfrage sind zu neuen Schlachtfeldern geworden.

Warum ist das Waffenstillstand zwischen den USA und dem Iran dazu verdammt, nicht nachhaltig zu sein?

Ausführliche Analyse: Warum wird das US-Iran-Waffenstillstand als „nominal“ kritisiert? Wenn beide Seiten daran gewöhnt sind, ihre eigene Macht über Vereinbarungen zu stellen, ist dieser kurze Frieden ohne Vertrauen dazu verdammt, nichts als Trümmer zu sein.

Beliebte Coins

Neueste Krypto-Nachrichten

Mehr lesen