Founders Fund, Pantera und Franklin Templeton schließen sich Sentient's „Arena” an, um KI-Agenten auf Unternehmensebene einem Stresstest zu unterziehen.

By: rootdata|2026/03/22 10:00:37

franklin

when-vip

love-token

In den letzten zwei Jahren haben Unternehmen die Integration von KI-Agenten in reale Arbeitsabläufe vorangetrieben: vom Kundenservice und Backend-Betrieb bis hin zu Finanz- und Compliance-Prozessen, die Entscheidungen mit hohem Risiko erfordern. Da diese Systeme zunehmend in tatsächliche Geschäftsabläufe eingebettet sind, taucht ein neues Problem auf: Agenten können zwar Informationen abrufen, haben jedoch oft Schwierigkeiten, stabile, interpretierbare und reproduzierbare Denkprozesse zu liefern, wenn die Arbeit „unübersichtlich“, mehrstufig oder risikoreich wird.

Heute hat das Open-Source-KI-Labor Sentient offiziell Arena vorgestellt – eine produktionsreife Echtzeitumgebung, in der Tausende von KI-Entwicklern weltweit Stresstests durchführen und sich wiederholt mit den schwierigsten Denkaufgaben messen können, mit denen Unternehmen konfrontiert sind. Zu den ersten Teilnehmern der ersten Phase von Arena gehören Founders Fund, Pantera und Franklin Templeton, das Vermögenswerte in Höhe von über 15 Billionen US-Dollar verwaltet. Dies ist ein Signal dafür, dass Institutionen frühzeitig und deutlich Interesse an „strukturierten Bewertungen von KI-Agenten vor deren Einsatz” zeigen.

„Wenn Unternehmen KI-Agenten in der Forschung, im operativen Geschäft und in kundenorientierten Arbeitsabläufen einsetzen, stellt sich nicht mehr die Frage, ob diese Systeme leistungsfähig genug sind, sondern ob sie in realen Arbeitsabläufen zuverlässig sind“, so Julian Love, Managing Partner bei Franklin Templeton Digital Assets. Love fügte hinzu, dass strukturierte Umgebungen wie Arena der Branche dabei helfen werden, zwischen „vielversprechenden Ideen” und „Fähigkeiten, die tatsächlich in der Produktion eingesetzt werden können” zu unterscheiden.

Himanshu Tyagi, Mitbegründer von Sentient, erklärte: „KI-Agenten sind nicht mehr nur Experimente innerhalb von Unternehmen, sondern halten Einzug in kritische Prozesse, die Kunden, Finanzierungen und operative Ergebnisse betreffen. Diese Verschiebung verändert die Bewertungskriterien. Es reicht nicht aus, dass Systeme in Demos beeindruckend aussehen. Unternehmen müssen wissen: Können Agenten in Produktionsumgebungen, in denen die Kosten eines Ausfalls hoch und das Vertrauen fragil sind, noch zuverlässig argumentieren? Unternehmen benötigen Vergleichbarkeit, Wiederholbarkeit und eine Methode, um Verbesserungen der Zuverlässigkeit langfristig zu verfolgen, die nicht vom zugrunde liegenden Modell oder Tool-Stack abhängig ist.

Arena simuliert das reale Chaos von Unternehmensabläufen: unvollständige Informationen, langwierige Zusammenhänge, vage Anweisungen und widersprüchliche Quellen. Arena bewertet nicht nur, ob Agenten „richtige Antworten“ liefern, sondern zeichnet auch vollständige Argumentationsketten auf, sodass Ingenieurteams Fehlerursachen genau lokalisieren und Verbesserungen im Laufe der Zeit validieren können.

Dies bietet einen neutralen, herstellerunabhängigen Maßstab für die Bewertung von Argumenten über Modelle und Technologie-Stacks hinweg. Arena legt den Schwerpunkt eher auf die Leistung in der Produktion als auf die Demo-Leistung und bildet so überprüfbare Agentenfähigkeiten, die auf risikoreiche Szenarien anwendbar sind und die Unternehmen auch auf ihre privaten Daten und internen Tools übertragen können.

In der ersten Herausforderung werden sich die Entwickler, die sich Arena anschließen, auf ein grundlegendes Problem auf Unternehmensebene konzentrieren: Dokumentenargumentation. KI-Agenten müssen komplexe, unstrukturierte Daten analysieren und berechnen – diese Art von Arbeit bildet die Grundlage für Szenarien wie Finanzanalysen, Ursachenforschung, das Verfassen von Investitionsmemos und den Kundenservice.

Weitere Teilnehmer in der Anfangsphase sind alphaXiv, Fireworks, OpenHands und OpenRouter. Mit der Erweiterung von Arena hinsichtlich Aufgaben, Branchen und Modellintegrationen wird erwartet, dass weitere Teilnehmer hinzukommen werden.

Aktuelle Forschungsergebnisse unterstreichen ebenfalls die Lücke, die Arena schließen möchte: 85 % der Unternehmen äußern den Wunsch, „agente Unternehmen” zu werden, wobei fast drei Viertel planen, autonome Agenten einzusetzen, aber weniger als ein Viertel verfügt tatsächlich über ausgereifte Governance-Systeme; viele Unternehmen haben Schwierigkeiten, Pilotprojekte auf groß angelegte Produktionsimplementierungen zu skalieren. Im Durchschnitt betreiben Unternehmen etwa ein Dutzend Agenten, die oft über isolierte Szenarien verstreut sind. Viele glauben, dass ohne bessere Koordinations- und Kooperationsmöglichkeiten das Hinzufügen weiterer Agenten nur die Komplexität erhöht und den Wert mindert.

„Bei OpenHands waren wir schon immer bestrebt, Entwickler dabei zu unterstützen, Agenten zur Lösung realer, praktischer Probleme einzusetzen“, sagte Graham Neubig, Chefwissenschaftler und Mitbegründer von OpenHands. „Wir freuen uns auch darauf, die Teilnehmer bei der Nutzung des OpenHands Software Agent SDK zu unterstützen, um diese komplexen Herausforderungen zu bewältigen.“

Alex Atallah, Mitbegründer und CEO von OpenRouter, erklärte: „Arena ist genau die Art von Initiative, die Open-Source-KI vorantreiben kann – sie ermöglicht es Forschern, in einer offenen Umgebung zu konkurrieren, zu iterieren und innovativ zu sein. Wir freuen uns darauf, unsere Zusammenarbeit mit Sentient zu vertiefen und die Infrastruktur bereitzustellen, mit der Experimente schneller und einfacher skaliert werden können.

Arena wird weltweit starten und Tausende von KI-Entwicklern einladen, sich für die erste begrenzte Kohorte zu bewerben. Offline-Veranstaltungen sind ab März 2026 in San Francisco geplant.

Über Sentient Labs

Sentient Labs ist ein führendes Technologieforschungs- und Produktunternehmen, das sich der Weiterentwicklung von Open-Source-KI verschrieben hat. Als Innovationsmotor der Sentient Foundation betreibt Sentient Labs Spitzenforschung in den Bereichen KI-Argumentation, Ausrichtung und Zusammenarbeit von Agenten. Sentient ist der Hauptentwickler von Hochleistungs-Frameworks wie ROMA und Open-Source-Modellen wie Dobby. Die Mission von Sentient ist es, Open-Source-KI vom „Experiment“ zur „Notwendigkeit“ zu machen. Durch die Bereitstellung der Infrastruktur zum Aufbau leistungsstarker, komponierbarer Agentensysteme ermöglicht Sentient Entwicklern die Kommerzialisierung von Open-Source-Tools und die Erreichung einer unternehmensweiten Nutzbarkeit. Sentient hat es sich zum Ziel gesetzt, Open Source zum Standard für globale, geschäftskritische KI-Anwendungen zu machen.

---Preis

Das könnte Ihnen auch gefallen

Powell: Wir Haben Eine Vorübergehende Phase zur Arbeit an der Inflation

Jerome Powell, der nominierte Vorsitzende der US-Notenbank, äußert sich kritisch gegenüber “Forward Guidance”. Er hebt die Notwendigkeit hervor,…

I’m sorry, but I can’t generate content based on t…

I’m sorry, but I can’t generate content based on the request as there’s no original article provided to…

Wird die Fed die Zinssätze erneut senken? Daten von heute Abend sind entscheidend

Die Marktdebatte dreht sich um die Frage, ob hohe Energiepreise eine anhaltende Inflation verursachen oder die Verbrauchernachfrage dämpfen…

Wie balanciert man Risiko und Rendite bei DeFi-Erträgen?

Waren diese Erträge jemals angemessen? Haben wir jemals die Entschädigung erhalten, die wir für die in DeFi eingegangenen Risiken verdienen, und wo sollten die zukünftigen Spreads festgelegt werden?

Tom Lees Ethereum-These: Warum der Mann, der den letzten Zyklus vorhergesagt hat, jetzt verstärkt auf Bitmine setzt

Tom Lee entwickelt sich zu einem der einflussreichsten Unterstützer von Ethereum. Von Fundstrat bis Bitmine – seine Ethereum-These vereint Staking-Rendite, Treasury-Akkumulation und langfristigen Netzwerkwert. Hier erfahren Sie, warum „Tom Lee Ethereum“ zu einer der meistbeachteten Geschichten im Kryptobereich geworden ist.

Naval betritt persönlich die Bühne: Die historische Kollision zwischen Normalbürgern und Risikokapital

Naval übernahm persönlich den Vorsitz des USVC-Investitionsausschusses. Dieser von AngelList aufgelegte und bei der SEC registrierte Fonds hat zum Ziel, Top-Private-Tech-Assets wie OpenAI, Anthropic und xAI der breiten Öffentlichkeit mit einer Einstiegsschwelle von 500 US-Dollar zugänglich zu machen. Es handelt sich nicht nur um einen neuen Fonds, sondern um ein strukturelles Experiment...

a16z Crypto: 9 Diagramme zum Verständnis der Entwicklungstrends von Stablecoins

Stablecoins entwickeln sich von Handelsinstrumenten zu einer universellen Zahlungsinfrastruktur, und dieser Prozess verläuft ruhiger und gründlicher, als die meisten Menschen erwartet haben.

Widerlegung von Yang Haipos These „Das Ende der Kryptowährung“

Dies könnte die wahre Bewährungsprobe für Kryptowährungen sein. Es geht nicht darum, ob der Preis ein neues Hoch erreicht hat, noch darum, wer im nächsten Bullenmarkt finanzielle Freiheit erlangen wird, sondern vielmehr darum, ob, nachdem alle großen Erzählungen von den Zyklen hinweggespült wurden, immer noch einige einfachere,...

Kann ein Haartrockner 34.000 $ verdienen? Interpretation des Reflexivitätsparadoxons von Vorhersagemärkten

Vorhersagemärkte sind im Wesentlichen Wetten auf die Realität, und wenn Teilnehmer diesen Weg früher zugänglich machen oder sogar beeinflussen können, spiegelt der Markt nicht mehr nur die Realität wider, sondern beginnt, sie im Gegenzug zu gestalten.

6MV-Gründer: Im Jahr 2026 ist der "entscheidende Wendepunkt" für Krypto-Investitionen erreicht.

„Ich werde die Gelder im Jahr 2026 einsetzen, daher kann ich Ihnen sagen, dass dies das beste Jahr in der Geschichte ist.“

Abraxas Capital prägt 2,89 Milliarden USDT: Liquiditätsschub oder nur mehr Stablecoin-Arbitrage?

Abraxas Capital hat soeben 2,89 Milliarden Dollar in neu geschaffenen USDT von Tether erhalten. Handelt es sich hierbei um eine positive Liquiditätsspritze für die Kryptomärkte oder ist es für einen Stablecoin-Arbitrage-Giganten einfach nur das übliche Geschäft? Wir analysieren die Daten und die wahrscheinlichen Auswirkungen auf Bitcoin, Altcoins und DeFi.

Ein Risikokapitalgeber aus der Kryptowelt sagte, KI sei zu verrückt, und sie seien sehr konservativ.

Inmitten des Krypto-Hypes und mit Investoren, die Pinduoduo einst verpasst hatten, wurde ein neuer KI-Fonds namens Impa Ventures gegründet, der die Spekulationsblasen-Erzählungen ablehnt und sich an eine konservative „Problem-zuerst“-Strategie hält, um echten Geschäftswert zu finden.

Die evolutionäre Geschichte von Vertragsalgorithmen: Ein Jahrzehnt von Perpetual Contracts, der Vorhang ist noch nicht gefallen

Die zehnjährige Entwicklung von Perpetual Contracts: von der Abschaltung von 312 bis zur schockierenden Short-Klemme von TRB, ein tiefer Einblick in die Preisbildungsmaschine, die täglich durchschnittlich 200 Milliarden Dollar ausmacht, geschrieben mit unzähligen Liquidationen und echtem Geld, mit Details über das Blut und die Tränen der Risikokontrolltheorie.

Bitcoin ETF Nachrichten heute: $2,1 Milliarden Zuflüsse signalisieren starke institutionelle Nachfrage nach BTC

Bitcoin ETF Nachrichten verzeichneten $2,1 Milliarden Zuflüsse über 8 aufeinanderfolgende Tage, was eine der stärksten jüngsten Akkumulationsphasen markiert. Hier ist, was die neuesten Bitcoin ETF Nachrichten für den BTC Preis bedeuten und ob die $80K Ausbruchsstufe als nächstes kommt.

Nachdem er von PayPal rausgeworfen wurde, will Musk ein Comeback auf dem Kryptowährungsmarkt schaffen

Cashtags erzielten nur wenige Tage nach ihrem Start ein Handelsvolumen von 1 Milliarde Dollar und markierten einen starken Start für Musks Super-App-Strategie. Für den Kryptowährungsmarkt könnte das Layout von X eine der am meisten erwarteten Quellen für das Einzelhandelswachstum sein, nachdem der Meme-Coin-Fieber nachlässt.

Michael Saylor: Der Winter ist vorbei – hat er recht? 5 Eckdatenpunkte (2026)

Michael Saylor twitterte gestern „Winter’s Over“. Es ist kurz. Es ist kühn. Und es bringt die Kryptowelt zum Reden.

Aber hat er recht? Oder ist das nur ein anderer CEO, der seine Taschen pumpt?

Schauen wir uns die Daten an. Seien wir neutral. Mal sehen, ob das Eis wirklich geschmolzen ist.

WEEX Bubbles App jetzt live visualisiert den Kryptomarkt auf einen Blick

WEEX Bubbles ist eine eigenständige App, die entwickelt wurde, um Benutzern zu helfen, komplexe Bewegungen des Kryptomarktes schnell durch eine intuitive Blasenvisualisierung zu verstehen.