Das neueste Interview mit dem OpenAI-Mitgründer: Wie geht es nach dem Aus für Sora mit ChatGPT weiter?

By: blockbeats|2026/04/02 18:00:23

Videotitel: OpenAI-Präsident Greg Brockman: KI-Strategie, AGI und die Super-App
Videoautor: Alex Kantrowitz
Übersetzung: Peggy, BlockBeats

Anmerkung der Redaktion: Dieser Artikel ist die Übersetzung eines Gesprächs mit dem OpenAI-Präsidenten und Mitgründer Greg Brockman im Big Technology Podcast. Die Sendung befasst sich seit Langem mit den Veränderungen in der KI, der Technologiebranche und der Unternehmensstruktur und dient als wichtiges Fenster für Beobachtungen direkt aus dem Silicon Valley.

In diesem Gespräch verweilte Brockman nicht bei den reinen Fähigkeiten des Modells, sondern trieb die Fragestellung weiter voran: Da die Leistungsfähigkeit von KI weitgehend bestätigt ist, wie wird die Branche ihren Weg wählen, Produktformen neu gestalten und die systemischen Auswirkungen absorbieren? Das Gespräch dreht sich um die Produktstrategie von OpenAI, die kommende „Super-App“ und die Einschätzung, dass sich KI in der „Startphase“ befindet.

Dieses Gespräch lässt sich unter drei Aspekten betrachten.

Erstens: Konvergenz der Pfade.
Von der Videogenerierung bis zu Inferenzmodellen, von Fortschritten auf vielen Ebenen bis hin zu aktiven Entscheidungen – die Wahl von OpenAI ist kein bloßes Urteil über technische Überlegenheit, sondern eine Reaktion auf reale Einschränkungen: Rechenleistung ist zu einem zentralen Engpass geworden. Bei begrenzten Ressourcen beginnt sich die technische Roadmap auf zwei hebelstarke Richtungen zu konzentrieren: persönliche Assistenten und die Lösung komplexer Probleme. Das bedeutet auch, dass sich die Wettbewerbslogik der KI von „Was ist machbar?“ zu „Was muss zuerst getan werden?“ verschiebt.

Zweitens: Rekonstruktion der Form.
Der Vorschlag einer „Super-App“ ist im Grunde ein Sprung in der Produktform. KI ist nicht länger eine Sammlung verstreuter Werkzeuge, sondern ein einheitlicher Einstiegspunkt: Sie versteht den Kontext, ruft Werkzeuge auf, führt Aufgaben aus und baut kontinuierlich ein Gedächtnis für verschiedene Szenarien auf. Von ChatGPT bis Codex übernimmt KI schrittweise ganze Arbeitsabläufe, und die menschliche Rolle wandelt sich vom Ausführenden zum Planer – Ziele setzen, Aufgaben zuweisen und überwachen.

Drittens: Rhythmuswechsel.
Waren die letzten zwei Jahre eine Phase des Kapazitätsaufbaus, so erleben wir jetzt einen „Start“. Einerseits sind die Modellfähigkeiten von „Unterstützung bei etwa 20 % der Arbeit“ auf „Abdeckung von etwa 80 % der Aufgaben“ gestiegen, was direkt eine Umstrukturierung der Arbeitsabläufe auslöst; andererseits beteiligt sich KI an ihrer eigenen Evolution (KI zur Optimierung von KI), wobei Chips, Anwendungen und unternehmensseitige Koordination zu einem sich ständig beschleunigenden geschlossenen Kreislauf überlagert werden. KI ist keine punktuelle Technologie mehr, sondern entwickelt sich zu einem zentralen Motor für wirtschaftliches Wachstum.

Gleichzeitig tauchen jedoch synchron weitere Probleme auf: öffentliches Misstrauen, Unsicherheit am Arbeitsplatz, Kontroversen um Rechenzentren sowie die Grenzen von Sicherheit und Governance. Brockmans Antwort darauf ist nicht rein technischer Natur. Er betont zwei Punkte: Erstens können Risiken nicht durch „zentralisierte Kontrolle“ gelöst werden, sondern erfordern den Aufbau einer gesellschaftlichen Infrastruktur rund um KI, ähnlich wie beim Stromnetz; zweitens durchlaufen individuelle Fähigkeiten eine Transformation – die entscheidende Frage ist nicht mehr „Kannst du das Werkzeug bedienen?“, sondern „Kannst du deine Ziele mit KI erreichen?“

War die Frage früher „Was kann KI tun?“, so hat sie sich heute dahin verschoben, was man selbst tun muss, wenn die KI anfängt, das Meiste für einen zu erledigen.

Das Folgende ist der Originaltext (leicht bearbeitet für bessere Lesbarkeit):

TL;DR

AGI hat die Phase des „klaren Pfads“ erreicht: Greg Brockman (OpenAI-Mitgründer) glaubt, dass es basierend auf dem GPT-Inferenzmodell nun einen klaren Weg zur AGI gibt, die voraussichtlich in wenigen Jahren erreicht wird, wobei die Form jedoch „kantig“ bleiben wird.

Hinweis: AGI (Artificial General Intelligence) bezeichnet eine allgemeine künstliche Intelligenz, also KI-Systeme, die bei den meisten kognitiven Aufgaben über Fähigkeiten verfügen, die denen von Menschen entsprechen oder diese übertreffen. Im Gegensatz zur aktuellen „spezialisierten KI“ (wie Bilderkennung oder Empfehlungsalgorithmen) betont AGI die aufgabenübergreifende Allgemeingültigkeit und Übertragbarkeit.

Strategische Konvergenz: Von der Erkundung vieler Linien zu zwei Kernanwendungen: Unter dem Druck begrenzter Rechenleistung konzentriert OpenAI seine Ressourcen auf „persönliche Assistenten“ und „komplexe Problemlösung“, anstatt alle Richtungen gleichzeitig voranzutreiben (wie etwa die Videogenerierung).

„Super-Apps“ werden zur Form des KI-Einstiegs: Chat, Programmierung, Browsing und Wissensarbeit werden in ein einheitliches System integriert, wodurch KI vom Werkzeug zur „Ausführungsschicht“ wird und Nutzer zu „Disponenten“.

Entscheidender Wandel: KI beginnt, Arbeitsabläufe zu übernehmen, anstatt nur zu unterstützen: Die Modellfähigkeit ist von „Erledigung von 20 % der Aufgaben“ auf „Bewältigung von 80 %“ gestiegen, was Einzelpersonen und Unternehmen zwingt, ihre Arbeitsweise umzustrukturieren.

Rechenleistung wird zum zentralen Engpass und Wettbewerbsfokus: Die Nachfrage nach KI übersteigt das Angebot bei weitem. Die zukünftige Einschränkung liegt nicht in der Modellfähigkeit, sondern in den Rechenressourcen, was Rechenzentren und Infrastruktur zu kritischen Variablen macht.

Der „Start“ der KI findet statt: Selbstbeschleunigende Technologie (KI optimiert KI) in Kombination mit Synergien in der Industrie (Chips, Anwendungen, Unternehmen) treibt KI vom Werkzeug zum Motor des Wirtschaftswachstums an.

Das größte Risiko liegt nicht in der Technologie, sondern in Governance und Nutzung: Sicherheitsprobleme können nicht von einer einzelnen Instanz gelöst werden; ein offenes Ökosystem und eine soziale Infrastruktur müssen gemeinsam die Verantwortung tragen.

Die Kernkompetenz des Einzelnen wandelt sich: Zukünftige Wettbewerbsfähigkeit liegt nicht in der „Ausführung“, sondern im „Ziele setzen + KI-Systeme managen“; der proaktive Einsatz von KI wird zur grundlegenden Fähigkeit.

Zusammenfassung des Interviews:

Alex (Gastgeber):
Heute ist Greg Brockman, Mitgründer und Präsident von OpenAI, bei uns, um über die vielversprechendsten Möglichkeiten der KI zu sprechen, wie OpenAI diese nutzen will und was es mit dem Konzept der „Super-Apps“ auf sich hat. Greg ist heute bei uns im Aufnahmestudio.

Greg Brockman (OpenAI-Mitgründer & Präsident):
Schön, dich zu sehen, danke für die Einladung.

Warum wurde Sora abgeschaltet? Mangelnde Rechenleistung

Alex:
Im Moment pausiert OpenAI die Weiterentwicklung der Videogenerierung, um Ressourcen auf eine „Super-App“ zu konzentrieren, die Geschäfts- und Programmierszenarien integrieren soll. Von außen (mich eingeschlossen) wirkt es so, als hätte OpenAI im Endkundenbereich bereits die Führung übernommen, schichtet nun aber Ressourcen um. Was passiert da?

Hinweis: Im März 2026 kündigte OpenAI die Einstellung seines Videogenerierungsprodukts Sora (einschließlich App und API) an und stoppte die damit verbundenen kommerziellen Bemühungen.

Greg Brockman:
In der vergangenen Zeit haben wir diese Deep-Learning-Technologie entwickelt, mit dem Ziel zu validieren, ob sie tatsächlich den positiven Einfluss haben kann, den wir uns immer vorgestellt haben – ob sie genutzt werden kann, um Anwendungen zu bauen, die Menschen wirklich helfen und ihr Leben verbessern.

Gleichzeitig haben wir einen anderen Weg verfolgt: die Bereitstellung dieser Technologie. Einerseits, um den Geschäftsbetrieb zu unterstützen, und andererseits, um frühzeitig praktische Erfahrungen zu sammeln und uns auf den Moment vorzubereiten, in dem die Technologie wirklich ausgereift ist.

Und jetzt haben wir eine neue Stufe erreicht. Wir sehen, dass diese Technologie tatsächlich lebensfähig ist. Wir gehen von „Benchmarking“ und einigen eher abstrakten Demonstrationen der Fähigkeiten in eine neue Phase über: Wir müssen sie in die reale Welt bringen, sie an tatsächlicher Arbeit beteiligen und durch Nutzerfeedback kontinuierlich weiterentwickeln.

Ich neige also eher dazu, diesen Wandel als einen strategischen Wechsel zu verstehen, der durch einen technologischen Phasenwechsel vorangetrieben wird.

Das bedeutet nicht, dass wir uns vom „Endkundenbereich“ zum „Unternehmensbereich“ verlagern. Treffender ist, dass wir uns eine Frage stellen: Welche Anwendungen sollten wir bei begrenzten Ressourcen am stärksten priorisieren? Denn wir können nicht alles tun.

Welche Anwendungen können wirklich implementiert werden, miteinander kollaborieren und einen realen Einfluss haben? Wenn man alle Richtungen auflistet, kann der Endkundenbereich in viele Typen unterteilt werden: etwa ein persönlicher Assistent, ein System, das einen wirklich versteht, sich an den eigenen Zielen ausrichtet und einem hilft, seine Lebensziele zu erreichen; sowie Kreativität und Unterhaltung und viele andere Möglichkeiten. Auf der Unternehmensseite, wenn man es von einer höheren Ebene betrachtet, lässt es sich eigentlich auf eine Sache abstrahieren: Man hat eine komplexe Aufgabe – kann KI einem helfen, sie zu erledigen?

Für uns ist die aktuelle Priorität sehr klar, mit nur zwei Dingen im Vordergrund: erstens ein persönlicher Assistent; zweitens eine KI, die einem bei der Lösung komplexer Probleme helfen kann.

Das Problem ist: Mit unserer aktuellen Rechenleistung können wir diese beiden Dinge nicht einmal vollständig unterstützen. Sobald man mehr Anwendungsszenarien hinzufügt, ist es schlicht unmöglich, sie alle abzudecken. Das ist also ein Realitätscheck: Die Technologie reift schnell, der Einfluss steht kurz vor der Explosion, und wir müssen Entscheidungen treffen, die wichtigste Richtung wählen, um sie wirklich zum Leben zu erwecken.

Alex:
Du hast früher eine Metapher verwendet und gesagt, OpenAI sei ein bisschen wie Disney: Es hat eine Kernfähigkeit und kann dann in verschiedene Szenarien expandieren. Disney hat Mickey Mouse, die in Filmen, Themenparks und auf Disney+ verwendet werden kann. Der „Kern“ von OpenAI ist das Modell, das für Videogenerierung, als Assistent oder für Unternehmensanwendungen genutzt werden kann.

Aber jetzt scheint es, als würdest du diesen Weg der „umfassenden Expansion“ nicht mehr gehen, sondern Entscheidungen treffen müssen. Stimmt das?

Greg Brockman:
Eigentlich denke ich, dass diese Metapher jetzt noch zutreffender ist. Aber der entscheidende Punkt ist: Technisch gesehen gehören Sora (Videomodell) und GPT (Inferenzmodell) zu zwei verschiedenen technischen Zweigen. Die Art und Weise, wie sie gebaut sind, ist völlig unterschiedlich.

Das Problem ist, dass es in der aktuellen Phase sehr schwierig ist, beide technischen Zweige gleichzeitig voranzutreiben, besonders bei begrenzten Ressourcen. Also haben wir uns entschieden, die Hauptressourcen in dieser Phase auf den GPT-Pfad zu konzentrieren.

Natürlich bedeutet das nicht, dass wir andere Richtungen aufgeben. Im Bereich der Robotik setzen wir zum Beispiel die entsprechende Forschung fort. Aber die Robotik selbst steckt noch in den Kinderschuhen und ist noch nicht in eine wirklich explosive, reife Phase eingetreten.

Andererseits werden wir im kommenden Jahr sehen, dass KI im Bereich der Wissensarbeit richtig durchstartet.

Und es ist wichtig zu betonen: Der GPT-Pfad dreht sich nicht nur um „Text“. Zum Beispiel ist die bidirektionale Sprachinteraktion (Speech-to-Speech) auch Teil dieses technischen Pfads, was KI zugänglicher und praktischer macht. Diese Fähigkeiten liegen im Wesentlichen innerhalb desselben Modellrahmens, nur auf unterschiedliche Weise angepasst.

Wenn man jedoch zwei völlig unterschiedliche technische Zweige verfolgt, ist das bei begrenzter Rechenleistung auf Dauer schwer durchzuhalten. Die Rechenleistung ist begrenzt, weil die Nachfrage zu hoch ist. Fast nach jeder Modellveröffentlichung wollen die Leute mehr damit machen.

Alex:
Warum hast du dich also nicht auf den Pfad des „Weltmodells“ konzentriert? Zum Beispiel ein Videomodell, das die Beziehung zwischen Objekten verstehen muss, was auch für die Robotik entscheidend ist. Außerdem waren die Fortschritte bei Sora sehr schnell. Warum hast du dich letztendlich entschieden, auf GPT zu setzen?

Hinweis: Das „Weltmodell“ konzentriert sich auf Wahrnehmung und physikalische Intuition, mit der Kernidee, der KI zu ermöglichen, zu verstehen, „wie die Welt funktioniert“, anstatt nur „Oberflächenmuster von Daten“ zu lernen. Solche Modelle werden oft verwendet, um Systeme wie Sora zu beschreiben: Sie generieren nicht nur Bilder oder Videos, sondern modellieren auch Beziehungen zwischen Objekten (wie Menschen, Autos, Licht), die kontinuierlichen Veränderungen in der Zeit (Entwicklung zwischen Frames) und grundlegende physikalische Gesetze (wie Bewegung, Verdeckung und Kollision). Im Gegensatz dazu gehört GPT zu den Sprach- und Inferenzmodellen, die sich stärker auf abstrakte Kognition und Aufgabenausführung konzentrieren.

Greg Brockman:
Das größte Problem in diesem Bereich ist eigentlich die Fülle an Möglichkeiten.

Wir haben bei OpenAI schon früh festgestellt: Solange eine Idee mathematisch fundiert ist, funktioniert sie meistens und kann gute Ergebnisse liefern. Das zeigt die zugrunde liegende Kraft des Deep Learning, das Generierungsregeln aus Daten abstrahieren und auf neue Szenarien übertragen kann. Dies lässt sich auf verschiedene Bereiche wie Weltmodelle, wissenschaftliche Entdeckungen und Programmierung anwenden.

Aber der Schlüssel ist: Wir müssen Entscheidungen treffen.

Es gab schon immer eine Debatte darüber, wie weit Textmodelle gehen können. Können sie die Welt wirklich verstehen? Ich denke, wir haben jetzt die Antwort auf diese Frage: Textmodelle können AGI erreichen.

Wir haben einen klaren Pfad gesehen, und dieses Jahr werden noch stärkere Modelle auftauchen. Intern bei OpenAI ist einer unserer größten Schmerzpunkte, wie wir Rechenleistung zuweisen – dieses Problem wird nur schlimmer, nicht besser. Es ist also im Grunde keine Frage, „welcher Pfad wichtiger ist“, sondern eine Frage von Timing und Reihenfolge.

Jetzt werden einige Anwendungen, die wir einst für fern hielten, greifbar. Zum Beispiel die Lösung ungelöster physikalischer Probleme. Wir hatten kürzlich einen Fall, in dem ein Physiker lange an einem Problem gearbeitet hatte, es einem Modell übergab, und 12 Stunden später hatten wir eine Lösung. Er sagte, es sei das erste Mal gewesen, dass er das Gefühl hatte, ein Modell würde „denken“. Dieses Problem ist vielleicht eines, das Menschen nie lösen können, aber die KI hat es getan.

Wenn man so etwas sieht, ist die einzige Wahl, den Einsatz zu verdoppeln, zu verdreifachen. Denn es bedeutet, dass wir ein enormes Potenzial wirklich freisetzen können.

Für mich ist das also kein Wettbewerb zwischen verschiedenen Richtungen, sondern die Frage: Was ist die Mission von OpenAI? Wie bringen wir AGI in die Welt? Wie machen wir sie für alle wirklich nützlich? Und wir haben diesen Pfad gesehen, wir wissen, wie wir ihn vorantreiben können.

---Preis

Auf GPT setzen statt auf Weltmodelle: Ein Pfad zur AGI

Alex:
Nun, ich möchte auf die Modelle der nächsten Generation zurückkommen, die du vorhin erwähnt hast, aber ich möchte zuerst diese Frage nachverfolgen.

Anfang des Jahres hatte ich ein Gespräch mit Demis Hassabis von Google DeepMind. Interessanterweise sagte er, dass für ihn das AGI-Ähnlichste eigentlich ihr Bildgenerator namens Nano Banana sei.

Hinweis: Demis Hassabis ist eine der Schlüsselfiguren, die KI von der Forschung zu bahnbrechenden Anwendungen vorantreiben. Er war Mitgründer von DeepMind, das AlphaGo entwickelte und 2016 den Weltmeister im Go besiegte – ein Meilenstein in der Geschichte der KI-Entwicklung.

Seine Begründung war: Ob Bildgenerator oder Videogenerator – um solche Bilder und Videos zu generieren, muss man grundlegend die Interaktion zwischen Objekten verstehen, zumindest ein gewisses Verständnis davon haben, wie die Welt funktioniert.

Impliziert das also ein potenzielles Risiko? Ist das eine große Wette – wenn das der Fall ist, wird OpenAI dann weiterhin auf einen anderen Technologiezweig setzen und den Anschluss verlieren?

Greg Brockman:
Wenn das wirklich der Fall ist? Ich habe zwei Antworten.

Erstens: Natürlich ist das eine Möglichkeit. So ist dieser Bereich; man muss letztendlich Entscheidungen treffen, man muss wetten. Und OpenAI hat das von Anfang an getan: Wir müssen bewerten, an den Pfad zur AGI glauben und dann hochkonzentriert diesen Pfad verfolgen. Genau wie bei der Addition zufälliger Vektoren – das Ergebnis kann am Ende nahe Null liegen; aber wenn man alle Vektoren ausrichtet, können sie einen klar in eine Richtung treiben.

Der zweite Punkt ist jedoch, dass Bildgenerierung eigentlich auch eine sehr beliebte Fähigkeit in ChatGPT ist, und wir investieren weiterhin kontinuierlich in diesen Bereich und priorisieren dessen Fortschritt. Der Grund, warum wir das können, ist, dass es eigentlich nicht zum technischen Zweig der „Weltmodelle“ oder „Diffusionsmodelle“ gehört; es ist tatsächlich auf der GPT-Architektur aufgebaut. Auch wenn es mit einer anderen Datenverteilung konfrontiert ist, ist es auf einer grundlegenderen technologischen Ebene immer noch dasselbe.

Und das ist genau eines der erstaunlichsten Dinge an AGI: Manchmal können sehr unterschiedlich aussehende Anwendungen – wie Speech-to-Speech, Bildgenerierung, Textverarbeitung und die Anwendung von Text selbst in verschiedenen Szenarien wie wissenschaftlicher Forschung, Programmierung, persönlichen Gesundheitsinformationen und mehr – tatsächlich alle innerhalb desselben technischen Rahmens untergebracht werden.

Aus technischer Sicht ist eine Sache, über die ich und das Unternehmen schon immer nachgedacht haben, wie wir unsere Bemühungen so weit wie möglich vereinheitlichen können. Weil wir wirklich glauben, dass diese Technologie eine ganzheitliche Verbesserung bringen und vielleicht sogar das gesamte Wirtschaftssystem heben wird.

Und das Ausmaß dieser Sache ist zu gewaltig. Wir können sicherlich nicht alles tun, aber wir können unseren Teil dazu beitragen.

Alex:
Das ist es, was das „General“ in Artificial General Intelligence (AGI) bedeutet.

Greg Brockman:
Genau, das ist das „G“, das ist es wirklich.

Alex:
Wo wir gerade von „Vereinheitlichung“ sprechen: Wie wird diese Super-App am Ende aussehen?

Greg Brockman:
Die Super-App, wie ich sie sehe –

Alex:
Sie wird Chat, Programmierung, Browsing und Dinge wie ChatGPT alle zusammen integrieren, richtig?

Greg Brockman:
Ja. Was wir schaffen wollen, ist eine Anwendung für Endnutzer, die es einem ermöglicht, die Kraft der AGI wirklich zu erleben, das heißt ihre „Allgemeingültigkeit“.

Wenn man an heutige Chat-Produkte denkt, denke ich, dass sie sich allmählich zu deinem persönlichen Assistenten entwickeln werden, deiner persönlichen API, einer KI, die dich wirklich berücksichtigt. Sie weiß viel über dich, richtet sich an deinen Zielen aus, ist vertrauenswürdig und kann dich bis zu einem gewissen Grad in dieser digitalen Welt „repräsentieren“.

Was Codex betrifft, so kann man es sich so vorstellen: Es ist derzeit ein Werkzeug, das hauptsächlich für Softwareentwickler gebaut wurde, aber es entwickelt sich zu einem „Codex für alle“.

Jeder, der etwas erschaffen oder bauen möchte, kann Codex nutzen, um den Computer das tun zu lassen, was er will. Und es geht nicht mehr nur um „Software schreiben“; es ist eher wie „den Computer benutzen“ selbst. Zum Beispiel lasse ich mir von ihr helfen, meine Laptop-Einstellungen anzupassen. Manchmal vergesse ich, wie man aktive Ecken einrichtet, also lasse ich das einfach Codex machen, und sie tut es tatsächlich.

So sollte ein Computer natürlicherweise sein; er sollte sich an die Menschen anpassen, nicht mich dazu bringen, mich an ihn anzupassen.

Man kann sich also eine App wie diese vorstellen: Alles, was der Computer tun soll, kann man ihm direkt sagen. Sie wird die Fähigkeit beinhalten, „den Computer zu benutzen“ und „im Web zu surfen“, was es der KI ermöglicht, Webseiten wirklich zu bedienen, und man kann auch überwachen, was sie tut. Außerdem, egal ob die Interaktion durch Chatten, Coden oder allgemeine Wissensarbeit erfolgt, alle diese Konversationen werden in einem System vereinheitlicht. Die KI wird ein Gedächtnis haben und dich verstehen.

Das ist es, was wir bauen.

Aber um ehrlich zu sein, das ist nur die Spitze des Eisbergs, der Teil, der über dem Wasser sichtbar ist. Für mich ist das wirklich Wichtigere die Vereinheitlichung der zugrunde liegenden Technologie.

Wir haben die Vereinheitlichung auf der Ebene der zugrunde liegenden Modelle erwähnt, aber was sich in den letzten Jahren wirklich geändert hat, ist dies: Es geht nicht mehr nur um das „Modell“ selbst; was entscheidender ist, ist das „Bereitstellungssystem“. Mit anderen Worten: Wie erhalten Modelle Kontext? Wie verbinden sie sich mit der realen Welt? Welche Aktionen können sie ausführen? Wie funktioniert die Feedbackschleife mit den Nutzern, während ständig neue Kontexte auftauchen?

Intern hatten wir früher tatsächlich mehrere Implementierungen dieser Dinge, oder zumindest ein paar leicht unterschiedliche. Jetzt konsolidieren wir sie zu einer. Letztendlich werden wir eine einheitliche KI-Schicht haben, und dann werden wir sie auf sehr leichte Weise auf verschiedene spezifische Anwendungsfälle ausrichten.

Natürlich kann man immer noch ein kleines Plugin, eine kleine Schnittstelle speziell für Finanzen oder Recht erstellen, aber in den meisten Fällen braucht man das vielleicht gar nicht, weil diese Super-App selbst breit und allgemein genug sein wird.

Alex:
Ist diese App sowohl für Unternehmens- als auch für persönliche Anwendungsfälle gedacht?

Greg Brockman:
Ja, das ist eigentlich ihr Kern. Genau wie ein Computer, etwa dein Laptop – ist er für den persönlichen Gebrauch oder für die Arbeit? Die Antwort ist beides. Es ist in erster Linie dein Gerät, deine Schnittstelle zur digitalen Welt. Und genau das wollen wir erreichen.

Alex:
Wenn ich diese Super-App also aus einer nicht-geschäftlichen Perspektive in meinem Privatleben nutze, wofür würde ich sie verwenden? Wie würde sich mein Leben verändern?

Greg Brockman:
Mein Verständnis wäre dieses: In deinem Privatleben wird es damit beginnen, die Art und Weise zu erweitern, wie du ChatGPT derzeit nutzt.

Wie nutzt du ChatGPT derzeit? Die Leute nutzen es bereits, um eine Vielzahl erstaunlicher Aufgaben zu erledigen. Manchmal ist es so einfach wie zu sagen: „Ich brauche Hilfe beim Entwurf einer Rede für eine Hochzeit, kannst du mir helfen?“ oder „Kannst du dir diese Idee ansehen und mir Feedback geben?“ Oder sogar: „Ich betreibe ein kleines Unternehmen, kannst du mir ein paar Ideen geben?“

Einige dieser Szenarien sind persönlicher, während andere beginnen, die Grenzen zwischen Persönlichem und Beruflichem zu verwischen. Und meine Auffassung ist: All diese Arten von Anfragen sollten etwas sein, das eine Super-App bewältigen kann.

Greg Brockman:
Aber wenn man auf die Entwicklung von ChatGPT zurückblickt, hat sie sich selbst weiterentwickelt.

Früher war sie zustandslos, richtig? Für jeden war es dieselbe KI, die jedes Mal bei Null anfing, fast so, als würde man mit einem Fremden sprechen. Aber wenn sie sich an deine vergangenen Interaktionen erinnern kann, wird sie viel mächtiger. Wenn sie auf mehr Kontext zugreifen kann, wird sie auch viel mächtiger.

Zum Beispiel, sie mit deiner E-Mail, deinem Kalender zu verknüpfen, deine Vorlieben wirklich zu verstehen, einen tieferen Hintergrund über deine vergangenen Erfahrungen zu haben und dies dann zu nutzen, um dir zu helfen, deine Ziele zu erreichen. Zum Beispiel hat ChatGPT bereits eine Funktion namens Pulse, die täglich Inhalte basierend auf ihrem Verständnis von dir liefert.

Auf individueller Nutzungsebene wird die Super-App also all das umfassen und es tiefer und reichhaltiger tun.

Alex:
Wann plant ihr, sie zu starten?

Greg Brockman:
Eine genauere Art, darüber nachzudenken, ist, dass wir uns in den nächsten Monaten schrittweise in diese Richtung bewegen werden. Die vollständige Vision, von der wir sprechen, wird Schritt für Schritt geliefert, nicht alles auf einmal; sie wird in Phasen ausgerollt.

Zum Beispiel enthält die heutige Codex-App tatsächlich zwei Schichten: eine ist ein generischer Agenten-Harness, der Werkzeuge benutzen kann; die andere ist ein Agent, der gut im Schreiben von Code ist.

Und dieser generische Harness kann tatsächlich für viele andere Szenarien verwendet werden. Du verbindest ihn mit einer Tabellenkalkulation, verbindest ihn mit einem Word-Dokument, und er kann dir bei der Wissensarbeit helfen.

Unser erster Schritt ist also, die Codex-App benutzerfreundlicher für allgemeine Wissensarbeit zu machen. Weil wir innerhalb von OpenAI bereits gesehen haben, dass die Leute spontan angefangen haben, sie auf diese Weise zu nutzen.

Dies wird der erste Schritt sein, und viele weitere werden folgen.

Alex:
Als ich gestern mit einem deiner Kollegen über Codex sprach, erwähnte er, dass jemand Codex für die Videobearbeitung verwendet: Er ließ Codex ihm bei der Videobearbeitung helfen, Codex erstellte sogar ein Plugin für Adobe Premiere, um das Video zu segmentieren und dann mit der Bearbeitung zu beginnen. Ist das die Richtung, die ihr anstrebt?

Greg Brockman:
Ich liebe es besonders, von solchen Anwendungsfällen zu hören. Genau so hoffen wir, dass dieses System genutzt wird. Was wirklich interessant ist: Die Codex-App wurde ursprünglich für Softwareentwickler entworfen, daher ist ihre aktuelle Benutzerfreundlichkeit für Nicht-Programmierer eigentlich nicht sehr hoch. Denn während des Einrichtungsprozesses können viele kleine Probleme auftreten.

Entwickler können sofort verstehen, was das bedeutet und wie man es behebt; wir sind schon daran gewöhnt. Aber wenn du kein Entwickler bist, denkst du vielleicht, wenn du diese siehst: „Was ist das? Das habe ich noch nie gesehen.“

Aber selbst dann haben wir viele Leute gesehen, die noch nie Code geschrieben haben, die angefangen haben, sie zu nutzen, um Websites zu bauen oder Dinge zu tun wie das, was du gerade erwähnt hast – Interaktionen zwischen verschiedenen Softwares zu automatisieren, einen erheblichen Hebel daraus zu gewinnen. Zum Beispiel hat jemand aus unserem Kommunikationsteam sie mit Slack und E-Mail integriert, damit sie eine große Menge an Feedback verarbeitet, und sie hat sehr gute Zusammenfassungen und Analysen erstellt.

Die aktuelle Situation ist also: Diejenigen, die sehr motiviert sind, sind bereits bereit, diese Barrieren zu überwinden und dann hohe Belohnungen dafür zu ernten.

In gewisser Weise ist der schwierigste Teil bereits erledigt – wir haben eine wirklich intelligente, fähige KI geschaffen, die tatsächlich Aufgaben erledigen kann.

Was wir als Nächstes tun müssen, ist der relativ „einfache“ Teil: Sie für die breite Öffentlichkeit wirklich nützlich machen und diese Eintrittsbarrieren schrittweise abbauen.

Alex:
Wenn man sich die Wettbewerbslandschaft ansieht, hat Anthropic jetzt auch die Claude-App, die sowohl einen Chatbot als auch Claude Code enthält. Bis zu einem gewissen Grad haben sie bereits den Prototyp ihrer eigenen „Super-App“.

Wie siehst du, warum Anthropic diesen Schritt früher gemacht hat? Und wie wahrscheinlich hältst du es, dass OpenAI aufholt?

Greg Brockman:
Wenn man die Uhr 12 bis 18 Monate zurückdreht, haben wir uns eigentlich immer auf „Programmierung“ als Schlüsselbereich konzentriert und konsequent in verschiedenen Programmierwettbewerben und anderen sehr „reinen Fähigkeiten“-Tests überzeugt. Eine Sache, in die wir damals jedoch nicht genug investiert haben, war die letzte Meile der Benutzerfreundlichkeit.

Das heißt, wir haben diesem Problem nicht genug Aufmerksamkeit geschenkt: KI ist bereits sehr schlau, in der Lage, verschiedene schwierige Programmierprobleme zu lösen, aber sie hat noch nie Codebasen in der realen Welt gesehen – und reale Codebasen sind oft chaotisch, weit entfernt von den „sauberen“ Umgebungen, mit denen sie vertraut ist.

Zu diesem Zeitpunkt waren wir tatsächlich hinten dran. Aber ab etwa Mitte letzten Jahres begannen wir, das sehr ernst zu nehmen. Wir haben speziell ein Team gebildet, das sich all diese Lücken, die reale Unordnung und Komplexität ansieht, denen wir zuvor nicht wirklich begegnet waren.

Zum Beispiel: Wie baut man Trainingsdaten? Wie richtet man eine Trainingsumgebung ein? Wie fühlt es sich wirklich an, wenn KI „Software-Engineering betreibt“ – unterbrochen werden, auf seltsame Probleme stoßen, verschiedene nicht ideale Situationen und so weiter.

Ich denke, mittlerweile haben wir aufgeholt. Wenn Nutzer uns wirklich Seite an Seite mit Wettbewerbern vergleichen, neigen viele dazu, eher uns zu wählen.

Natürlich wissen wir auch, dass wir eine Lücke in der Front-End-Erfahrung haben, und wir werden diesen Teil angehen. Aber insgesamt war das unser Fokus in dieser Zeit: nicht nur ein Modell zu bauen und dann eine Produkthülle darauf zu klatschen; sondern es von Anfang an als vollständiges Produkt zu denken. Während wir forschen, denken wir auch: Wie wird es letztendlich genutzt? Das ist ein Wandel, der in dieser Zeit intern bei OpenAI stattgefunden hat.

In meiner Sicht werden wir also als Nächstes eine sehr starke Welle von Modell-Upgrades erleben. Wenn ich mir nur die Roadmap für dieses Jahr ansehe, bin ich sehr aufgeregt, es gibt wirklich viele Dinge, die erreicht werden können.

Gleichzeitig sind wir auch sehr darauf fokussiert, die letzte Meile der Benutzerfreundlichkeit zu füllen.

Alex:
Seit 2022 ist OpenAI der unbestrittene Marktführer in diesem Bereich. Offensichtlich geht es im Wettbewerb jetzt nicht mehr nur um Testergebnisse. Du hast gerade selbst die Formulierung „wir haben aufgeholt“ verwendet.

Hat sich auch die interne Atmosphäre des Unternehmens verändert? Mit anderen Worten: Ist es nicht mehr das gleiche Gefühl, bei einem Produkt wie ChatGPT weit voraus zu sein wie in der Vergangenheit, sondern tatsächlich in einen echten Wettbewerb einzutreten.

Einige externe Berichte zeigen tatsächlich diese Veränderung – wie interne Meetings, die betonen, dass OpenAI keine „Nebenaufgaben“ mehr hat und sich jeder auf diese Kernrichtung konzentrieren sollte. Welche Veränderungen haben sich also jetzt im internen Umfeld und in der Atmosphäre ergeben?

Greg Brockman:
Ich würde sagen, für mich persönlich war der beunruhigendste Moment bei OpenAI eigentlich, nachdem wir ChatGPT veröffentlicht hatten.

Ich erinnere mich, dass ich auf der Firmen-Weihnachtsfeier war, und es lag dieses Gefühl von „Wir haben es geschafft“ in der Luft. Das hatte ich noch nie zuvor gefühlt. Meine Reaktion damals war: Nein, wir sind nicht die Leute, die es geschafft haben, wir sind der Underdog.

Und das waren wir schon immer. Die Wettbewerber in diesem Bereich sind meist etablierte Großunternehmen mit mehr Finanzierung, mehr Leuten, mehr Daten und fast allen Ressourcen im Überfluss.

Warum kann OpenAI also konkurrieren? Bis zu einem gewissen Grad ist die Antwort, dass wir uns nie wohl gefühlt haben. Wir haben uns immer als Herausforderer gesehen.

Tatsächlich war es für mich eine sehr gesunde Sache, zu sehen, wie der Markt diese Wettbewerbsdynamik wirklich annimmt, zu sehen, wie andere Wettbewerber auftauchen und sich gut schlagen.

Denn aus meiner Sicht kann man sich nie darauf fixieren, wo die Wettbewerber sind. Wenn man nur darauf schaut, wo sie jetzt sind, sind sie schon weitergezogen, bis man dort ankommt.

Und ich habe das Gefühl, dass es in letzter Zeit eigentlich umgekehrt war: Viele Leute haben sich darauf konzentriert, wo wir sind, und wir konnten weiter voranschreiten. Das hat uns intern ein Gefühl von Ausrichtung und Einheit gegeben.

Ich habe vorhin erwähnt, dass wir früher „Forschung“ und „Bereitstellung“ fast als zwei getrennte Dinge behandelt haben; und jetzt wollen wir sie wirklich integrieren. Für mich ist das eine wunderbare Sache.

Ich würde also sagen, die Phase, in der wir uns jetzt befinden, ist keine Phase, in der ich das Gefühl habe, wir hätten jemals „sicher gewonnen“ oder wären plötzlich in einer Krise. Weißt du, externe Wahrnehmungen von dir sind meistens weder so gut, wie sie sagen, noch so schlecht.

Ich habe das Gefühl, wir waren insgesamt ziemlich stabil. Und was die Entwicklung der Kernmodelle angeht, bin ich sehr zuversichtlich in unsere Roadmap und die Forschungsarbeit, die wir hineingesteckt haben. Was die Produktseite angeht, habe ich das Gefühl, dass wir jetzt eine wirklich gute Energie haben, jeder kommt zusammen, um diese Dinge wirklich in die Welt zu bringen.

Alex:
Du hast vorhin mehrfach erwähnt, dass einige sehr starke neue Modelle kommen werden. Was genau sind sie?

The Information berichtete, dass ihr das Vortraining für „Spud“ abgeschlossen habt; und Sam Altman sagte OpenAI-Mitarbeitern intern auch, dass sie innerhalb weniger Wochen ein sehr starkes Modell sehen sollten. Das war vor ein paar Wochen. Das Team intern glaubt, dass es sogar wirtschaftliche Beschleunigung wirklich vorantreiben könnte und die Dinge schneller voranschreiten, als viele Leute erwartet hatten.

Also, was genau ist „Spud“?

Greg Brockman:
Es ist ein großartiges Modell. Aber ich denke, der Fokus liegt nicht wirklich auf einem einzelnen Modell.

Unser Forschungsprozess ist ungefähr so: Zuerst kommt das Vortraining, um ein neues Basismodell zu produzieren, und dann werden alle weiteren Verbesserungen auf diesem Basismodell aufgebaut. Und dieser Schritt erfordert oft, dass viele interne Teams innerhalb des Unternehmens einen riesigen Aufwand betreiben. Tatsächlich habe ich die letzten 18 Monate den Großteil meiner Zeit hier verbracht: hauptsächlich rund um die GPU-Infrastruktur, die Unterstützung der Teams, die für das Trainings-Framework verantwortlich sind, und das tatsächliche Ausführen dieser groß angelegten Trainingsaufgaben.

Dann kommt die Phase des Reinforcement Learning. Hier beginnt diese KI, die bereits viel Weltwissen gelernt hat, dieses Wissen wirklich anzuwenden.

Als Nächstes kommt der Fine-Tuning-Prozess. In dieser Phase sagst du ihr tatsächlich – nun, da du weißt, wie man Probleme löst, mach weiter und übe in verschiedenen Szenarien.

Schließlich gibt es eine „letzte Meile“-Phase bezüglich Verhalten und Benutzerfreundlichkeit.

Ich würde Spud also als eine neue Grundlage sehen, ein neues Vortrainingsmodell. Und darauf kann man sagen, dass unsere Forschung der letzten zwei Jahre beginnt, wirklich Ergebnisse zu zeigen. Es wird sehr aufregend.

Ich denke, was die Außenwelt letztendlich spüren wird, ist eine allgemeine Verbesserung der Fähigkeiten. Aber für mich war das nie nur ein Problem der einmaligen Veröffentlichung. Denn sobald diese Version herauskommt, ist sie eigentlich nur eine frühe Version von vielen weiteren Fortschritten, die noch kommen werden. Wir werden in jeder Phase dieses Verbesserungsprozesses weiterhin mehr tun.

Ich denke also, wir sind jetzt eher wie ein sich ständig beschleunigender Motor des Fortschritts, und Spud ist nur ein Meilenstein auf diesem Weg.

Alex:
Also, was denkst du, kann es tun, was heutige Modelle nicht können?

Greg Brockman:
Ich denke, es wird in der Lage sein, schwierigere Probleme zu lösen und nuancierter zu werden. Es wird Anweisungen und Kontext besser verstehen.

Manchmal sprechen Leute von einem Gefühl namens „Big Model Smell“ – das bedeutet, wenn das Modell wirklich klüger und fähiger ist, kann man es deutlich spüren. Es wird deiner Absicht genauer folgen und besser zu deinen Bedürfnissen passen.

Wenn du eine Frage stellst und die KI nicht wirklich versteht, was du meinst, ist dieses Gefühl immer noch sehr enttäuschend. Du kannst nicht anders, als zu denken: Das ist etwas, das du eigentlich klar von selbst herausfinden können solltest.

Ich würde also sagen, in gewissem Sinne wird dies ein Ergebnis der Ansammlung vieler „quantitativer Veränderungen“ sein, die zu einer „qualitativen Veränderung“ führen. Einerseits wird es signifikante Verbesserungen in verschiedenen Metriken geben; andererseits werden einige völlig neue Szenarien auftauchen: Früher warst du vielleicht zu faul, KI zu benutzen, weil sie nicht zuverlässig genug war, aber jetzt würdest du sie ohne Zögern benutzen.

Ich denke, dies wird eine umfassende Veränderung sein. Ich freue mich besonders darauf zu sehen, wie sie die Grenze der Fähigkeiten weiter nach oben verschieben wird. Wir haben bereits ihre Leistung in Szenarien wie der physikalischen Forschung gesehen, und ich denke, als Nächstes wird sie in der Lage sein, offenere Probleme anzugehen und längere Zeitrahmen zu umspannen.

Gleichzeitig freue ich mich auch darauf zu sehen, wie sie den Boden der Fähigkeiten anheben wird – was bedeutet, dass sie, egal was du tun willst, viel nützlicher sein wird als heute.

Alex:
Aber für den durchschnittlichen Nutzer ist es manchmal nicht einfach, diese Art von Veränderung zu spüren. Zum Beispiel gab es vor der Veröffentlichung von GPT-5 tatsächlich viel Hype und Vorfreude; als es dann herauskam, war die erste öffentliche Reaktion jedoch bis zu einem gewissen Grad enttäuschend. Später entdeckten alle langsam, dass es in bestimmten spezifischen Aufgaben tatsächlich sehr mächtig war.

Glaubst du also, dass es bei den Modellen der nächsten Generation hauptsächlich in bestimmten professionellen Szenarien spürbar sein wird, oder wird es eine Art von Verbesserung sein, die intuitiver und universeller von jedem gespürt wird?

Greg Brockman:
Ich denke, die Geschichte könnte ähnlich sein. Nachdem das Modell veröffentlicht wurde, werden einige Leute sofort das Gefühl haben, dass es eine vollständige Transformation im Vergleich zu dem ist, was sie zuvor gesehen haben. Aber es wird auch einige Anwendungsfälle geben, bei denen der Engpass nicht in der „Intelligenz“ liegt. Wenn du also das Modell nur klüger machst, werden die Nutzer in diesen Bereichen den Unterschied vielleicht nicht sofort spüren.

Im Laufe der Zeit denke ich jedoch, dass jeder die Veränderung schließlich spüren wird. Denn was sich wirklich ändert, ist: In welchem Ausmaß du anfängst, dich auf dieses System zu verlassen.

Wenn du darüber nachdenkst, wie wir jetzt mit KI interagieren, hat jeder eigentlich ein mentales Modell davon, „was sie tun kann“. Und dieses mentale Modell ändert sich nicht schnell. Es entwickelt sich normalerweise, wenn du Erfahrung sammelst, und dann tut sie gelegentlich etwas Magisches für dich, und du merkst plötzlich: Wow, sie kann das tatsächlich tun, etwas, an das ich nie zuvor gedacht habe.

Zum Beispiel haben wir in Szenarien wie dem Zugriff auf medizinische Informationen bereits ähnliche Fälle gesehen. Ich habe einen Freund, der ChatGPT nutzte, um verschiedene Behandlungsoptionen für seinen Krebs zu erforschen. Der Arzt hatte ihm zuvor gesagt, es sei Spätstadium, und es könne nichts mehr getan werden. Aber er nutzte ChatGPT, um viele verschiedene Ideen zu recherchieren, und fand tatsächlich eine Behandlung deswegen.

In einem Szenario wie diesem ist die Prämisse eigentlich: Du musst ein gewisses Maß an Vertrauen in die Fähigkeit der KI haben, in diesem Kontext zu helfen, bevor du bereit bist, so viel Mühe in das Extrahieren von Wert aus dem System zu investieren.

Ich denke also, was wir als Nächstes sehen werden, ist: In jedem ähnlichen Anwendungsszenario wird das, womit KI dir helfen kann, für jeden offensichtlicher werden.

Daher geht es nicht nur darum, dass die Technologie selbst stärker wird, sondern auch darum, dass sich unser Verständnis der Technologie ändert und mit ihr Schritt hält.

Alex:
Also wirst du dich zunehmend darauf verlassen. Innerhalb von OpenAI entwickelt ihr auch einen automatisierten KI-Forscher, der diesen Herbst starten soll. Was genau ist das?

KI tritt in ihre „Startphase“ ein

Greg Brockman:
Ich denke, aus einer allgemeinen Trendperspektive befinden wir uns jetzt im frühen Stadium dieses technologischen Starts.

Alex:
Was bedeutet „Start“?

Greg Brockman:
Start bezieht sich darauf, dass KI kontinuierlich entlang einer exponentiellen Kurve stärker wird. Und ein Teil des Grundes dafür ist: Wir können KI bereits nutzen, um uns zu helfen, die KI selbst zu verbessern, sodass der gesamte Forschungsprozess auch beschleunigt wird.

Aber ich denke, dass „Start“ nicht nur eine technologische Angelegenheit ist; es bedeutet auch die Freisetzung realer Auswirkungen. Die Entwicklung vieler Technologien folgt einer S-Kurve; und wenn man sich mehrere S-Kurven über einen längeren Zeitraum ansieht, konvergieren sie schließlich in eine Form von nahezu exponentiellem Wachstum.

Ich denke, wir befinden uns derzeit in einer solchen Phase. Das heißt, die Technologie selbst schreitet in einem immer schnelleren Tempo voran, und dieser Motor des Fortschritts gewinnt kontinuierlich an Dynamik.

Gleichzeitig bilden sich in der Außenwelt viele Rückenwinde: Chip-Entwickler erhalten mehr Ressourcen; viele Leute arbeiten an verschiedenen Anwendungen, versuchen, KI in verschiedene Szenarien einzubetten, und suchen nach den Konvergenzpunkten zwischen ihr und verschiedenen spezifischen Bedürfnissen.

All diese Energie sammelt sich ständig an und treibt die KI kollektiv in eine „Startphase“, die sie von einer marginalen Existenz zum primären Motor für wirtschaftliches Wachstum macht.

Und das passiert nicht nur innerhalb der Mauern unserer Organisation. Es betrifft die ganze Welt, das gesamte Wirtschaftssystem, wie man diese Technologie kollektiv vorantreibt und wie ihre Praktikabilität kontinuierlich fortschreitet.

Alex:
Was wird dieser „Forscher“ also spezifisch tun?

Greg Brockman:
Der sogenannte „Forscher“ bezieht sich im Wesentlichen darauf: Da der Anteil der Aufgaben, die KI übernehmen kann, zunimmt, sollten wir ihr erlauben, autonomer zu agieren.

Natürlich gibt es viele Aspekte dahinter, die sorgfältige Überlegung erfordern. Es bedeutet nicht: Wir veröffentlichen sie, lassen sie eine Weile alleine laufen und kommen dann später zurück, um zu sehen, ob sie gute Ergebnisse produziert hat.

Ich denke, wir werden immer noch sehr tief in ihr Management involviert sein. Genau wie jetzt: Wenn du einen Junior-Forscher hast und ihn zu lange alleine lässt, wird er wahrscheinlich einen Weg einschlagen, der nicht viel Wert bietet. Aber wenn du einen Senior-Forscher hast oder jemanden mit einem echten Sinn für Richtung, der sie führt, müssen sie vielleicht nicht einmal alle spezifischen operativen Fähigkeiten persönlich beherrschen, können aber dennoch kontinuierliches Feedback zu dem geben, was die Person produziert, es überprüfen und Anleitung zur Richtung geben: Was genau ich hoffe, dass du erreichen wirst.

Das System, wie ich es verstehe, ist also eine Reihe von Mechanismen, die wir bauen, die die Geschwindigkeit unseres Modellausstoßes erheblich erhöhen, neue Forschungsdurchbrüche vorantreiben und diese Modelle in der realen Welt nützlicher und nutzbarer machen werden. Und all das wird in einem immer schnelleren Tempo geschehen.

Alex:
Was wird er spezifisch tun? Wirst du ihm direkt sagen „Finde AGI“, und dann wird er es alleine versuchen?

Greg Brockman:
Bis zu einem gewissen Grad sehe ich das so, zumindest im ersten Sinne. Aber wenn man es aus einer praktischeren Perspektive betrachtet, würde ich es so verstehen: Den gesamten Arbeitsablauf eines unserer Forschungswissenschaftler von Anfang bis Ende nehmen und versuchen, ihn so weit wie möglich in einem siliziumbasierten System auszuführen.

Alex:
Eine andere Art, „Start“ zu verstehen, ist: Der Fortschritt der KI wird sich von inkrementeller Verbesserung zur Anhäufung von Dynamik verschieben, was sich schließlich zu einem nahezu unaufhaltsamen Antriebsprozess hin zu einer intelligenteren Intelligenz als der menschlichen entwickelt.

Bist du besorgt, dass, während sich die Dinge in eine positive Richtung entwickeln könnten, dieser Fortschritt selbst auch außer Kontrolle geraten, abweichen könnte?

Greg Brockman:
Ich denke, natürlich wird es das, das ist ohne Zweifel. Ich glaube, um die Vorteile dieser Technologie zu genießen, muss man auch ihre Risiken ernsthaft in Betracht ziehen.

Wenn du dir unseren Ansatz zur technischen Entwicklung ansiehst, wirst du feststellen, dass wir viel Mühe in Sicherheit und Schutz gesteckt haben. Ein gutes Beispiel sind Prompt-Injection-Angriffe. Wenn du eine sehr schlaue, mächtige KI erschaffen willst, die Zugriff auf viele Werkzeuge hat, willst du sicherlich sicherstellen, dass sie nicht in die Irre geführt oder von jemandem manipuliert wird, der ihr einen seltsamen Befehl gibt.

Das ist etwas, in das wir viel Mühe gesteckt haben, und ich denke, wir haben sehr gute Ergebnisse erzielt. Wir haben auch ein sehr starkes Team, das für diese Arbeit verantwortlich ist.

Interessanterweise können einige dieser Probleme tatsächlich mit Menschen analogisiert werden. Menschen sind auch anfällig für Phishing-Angriffe, können in die Irre geführt werden und handeln möglicherweise ohne vollen Kontext.

Wir bringen diese Analogien in unseren eigenen F&E-Prozess ein. Wann immer wir ein Modell veröffentlichen, ein Modell entwickeln, denken wir immer: Wie stellen wir sicher, dass es sich wirklich an menschlichen Zielen ausrichtet, wie stellen wir sicher, dass es tatsächlich hilft? Das ist etwas, das uns sehr am Herzen liegt.

Natürlich gibt es auch einige größere Probleme, die die ganze Welt, die gesamte Wirtschaft betreffen: Wie wird sich alles ändern? Wie kann jeder von dieser Technologie profitieren? Das sind nicht nur technische Probleme, noch kann OpenAI sie alleine lösen. Aber ja, ich denke oft darüber nach, nicht nur die Technologie voranzutreiben, sondern auch sicherzustellen, dass sie wirklich einen positiven Einfluss haben kann, der ihrem Potenzial entspricht.

Alex:
Das Problem ist, das sieht wie ein Rennen aus. Was innerhalb der Mauern des OpenAI-Hauptquartiers passiert, wird auch schnell von vielen Open-Source-Akteuren repliziert. Und diese Akteure sind oft viel schwächer in Bezug auf Sicherheitsgrenzen und Schutzmaßnahmen.

Ich erinnere mich, dass du früher etwas gesagt hast, der Kern davon war: Kreative Leistungen erfordern, dass viele Leute viele Dinge richtig machen, aber destruktive Ergebnisse erfordern vielleicht nur einen böswilligen Akteur. Das ist zumindest der Ort, an dem ich am meisten besorgt bin. Weil das eindeutig ein Rennen ist und der Fortschritt schnell ist. Viele deiner Kollegen haben gesagt, wenn alle zustimmen aufzuhören, sind sie auch bereit aufzuhören. Aber jetzt scheint es, als gäbe es kein Anzeichen dafür, dass dieses Rennen überhaupt langsamer wird.

Also, ist die Belohnung es wirklich wert, solche Risiken einzugehen?

Greg Brockman:

Ich glaube, die Belohnung ist es wert. Ich habe jedoch auch das Gefühl, dass eine solche Antwort immer noch zu breit und zu simpel ist.

Seit der Gründung von OpenAI haben wir uns gefragt: Welche Zukunft stellt eine gute Zukunft dar? Wie kann diese Technologie wirklich die Situation jedes Einzelnen verbessern?

Man kann diese Frage in zwei Perspektiven unterteilen. Eine ist eine „zentralisierte“ Sicht: der Gedanke, dass der beste Weg, diese Technologie sicher zu machen, darin besteht, dass nur eine Entität sie entwickelt. Dann gibt es keinen Wettbewerbsdruck, und man kann die Dinge sorgfältig richtig machen, und wenn man bereit ist, entscheiden, wie man sie an alle liefert. Diese Idee ist verständlich, aber bis zu einem gewissen Grad ist sie auch eine sehr schwierige Lösung zu akzeptieren.

Und ein anderer Pfad, der auch der Pfad ist, zu dem wir tendieren, ist, aus der Perspektive der „Resilienz“ zu denken. Mit anderen Worten: es als ein offenes System zu sehen: Viele Teilnehmer treiben die Entwicklung dieser Technologie voran, aber der Fokus liegt nicht nur auf der Technologie selbst, sondern mehr auf dem Aufbau der sozialen Infrastruktur rund um diese Technologie, was es ihr ermöglicht, sicherer angenommen zu werden.

Man kann über die Entwicklung von Elektrizität nachdenken. Elektrizität wird auch von vielen verschiedenen Menschen und Institutionen produziert, und sie selbst birgt Risiken und Gefahren. Gleichzeitig haben wir jedoch mehrere Schichten von Sicherheitsinfrastruktur um sie herum aufgebaut: Es gibt Stromsicherheitsstandards, verschiedene Nutzungsspezifikationen, regulatorische Ansätze, die verschiedenen Skalen entsprechen. In sehr großem Maßstab gibt es sogar spezialisierte regulatorische Anforderungen. Viele Menschen können Elektrizität auf demokratisierte Weise nutzen, zusammen mit Inspektoren und einer ganzen Reihe von unterstützenden Systemen, die allmählich um die Eigenschaften dieser Technologie herum etabliert wurden.

Und ich denke, KI ist dasselbe. Was wir wirklich sehen, ist, dass es eine breite soziale Diskussion um KI geben muss. Wenn diese Technologie wirklich ankommen und das Leben jedes Einzelnen verändern soll, dann müssen die Menschen einbezogen werden. Sie kann nicht allein von einer zentralisierten kleinen Gruppe im Geheimen vorangetrieben und entschieden werden.

Für mich war das also immer ein sehr zentrales Problem: Auf welche Weise sollte sich diese Technologie entfalten? Und woran wir wirklich glauben, ist ein „resilientes Ökosystem“, das allmählich um die Technologieentwicklung herum gebildet wird.

Alex:
Sagst du also, dass wir uns derzeit im Prozess des „Starts“ befinden und wir alle eigentlich schon darin sind? NVIDIA-CEO Jensen Huang sagte kürzlich, er glaube, AGI sei erreicht worden. Stimmst du zu?

Greg Brockman:
Ich denke, AGI hat für verschiedene Menschen unterschiedliche Definitionen. Und tatsächlich würden viele Leute argumentieren, dass die Technologie, die wir heute haben, bereits als AGI betrachtet wird.

Das kann debattiert werden. Aber ich denke, der wirklich interessante Teil ist, dass die Technologie, die wir heute haben, immer noch sehr „grob“ ist, mit einem klaren Gefühl der Fragmentierung.

Bei vielen Aufgaben, wie dem Schreiben von Code, ist sie bereits übermenschlich. KI kann es tun, und sie hat die Reibung beim Erschaffen von Dingen erheblich reduziert. Aber gleichzeitig gibt es immer noch einige sehr grundlegende Dinge, die Menschen leicht tun können, mit denen KI aber immer noch kämpft.

Wo zieht man also die Grenze? Bis zu einem gewissen Grad ist es eher ein „Gefühl“, ein atmosphärisches Urteil, anstatt eine Frage, die in diesem Moment streng wissenschaftlich definiert werden kann.

Für mich selbst denke ich also, dass wir diesen Moment eindeutig durchlaufen. Wenn du mir diese Systeme heute vor fünf Jahren gezeigt hättest, hätte ich gesagt: Ja, das ist es, worüber wir damals gesprochen haben. Es ist nur so, dass die Realität herausgewachsen ist und ganz anders aussieht, als wir uns ursprünglich vorgestellt haben. Sie unterscheidet sich von jeder Form, die wir uns einst vorgestellt haben.

Ich denke also, wir müssen unsere mentalen Modelle entsprechend anpassen.

Alex:
Du meinst also, wir sind noch nicht da?

Greg Brockman:
Ich würde sagen, wir sind wahrscheinlich schon bei 70 % bis 80 %. Ich denke also, wir sind eigentlich sehr nah dran.

Und ich glaube, eine Sache ist sehr klar: In den nächsten Jahren werden wir definitiv AGI erleben. Ihre Leistung mag immer noch etwas „kantig“ sein, nicht überall ganz glatt und perfekt. Aber die Untergrenze der Aufgaben, die sie bewältigen kann, wird sehr hoch angehoben – fast für jede intellektuelle Aufgabe, die du auf einem Computer ausführen musst, kann KI es tun.

Also muss ich jetzt eine etwas unsichere Antwort geben, weil es tatsächlich ein bisschen ein „Unschärfeprinzip“ darin gibt – du kannst es aus verschiedenen Definitionen argumentieren. Aber meiner persönlichen Definition nach denke ich, dass wir fast da sind. Noch einen Schritt vorwärts, und wir sind absolut da.

Wichtiger Wendepunkt: Die Übergabe der Arbeit von 20 % auf 80 %

Alex:

Was ist im Dezember 2025 genau passiert? Weil das wie ein Wendepunkt schien, die Idee, „die Maschine mehrere Stunden am Stück ununterbrochen Code schreiben zu lassen“, verschob sich plötzlich von einer theoretischen Idee dazu, dass jeder anfing zu sagen: „Ich glaube, ich kann ihr vertrauen, dass sie eine Weile alleine weiterläuft.“

Was ist also zu dieser Zeit wirklich passiert?

Greg Brockman:
Nach der Veröffentlichung des neuen Modells sprang der Prozentsatz der Aufgaben, die KI ausführen konnte, auf einen Schlag von etwa 20 % deiner Arbeit auf 80 %. Das war ein extrem signifikanter Wandel. Denn es war nicht mehr nur „ein ziemlich gutes kleines Werkzeug“, sondern es wurde: Du musstest deinen Arbeitsablauf um diese KIs herum neu organisieren.

Für mich persönlich hatte ich auch einen sehr typischen viszeralen Moment. Über die Jahre hatte ich ein Test-Stichwort: Lass KI eine Website für mich bauen. Diese Website war eigentlich eine, die ich von Hand gebaut hatte, als ich Coden lernte, was mich mehrere Monate kostete.

Und bis 2025 dauerte es wahrscheinlich immer noch vier Stunden und mehrere Runden von Prompts hin und her, um etwas Anständiges zu bekommen. Aber bis Dezember fragte ich einmal, und die KI tat es einmal, und sie tat es sehr gut.

Alex:
Wie haben diese Modelle also diesen Sprung gemacht?

Greg Brockman:
Ein großer Teil des Grundes ist, dass das Basismodell selbst stärker geworden ist. OpenAI hat seine Vortrainingstechniken kontinuierlich verbessert. Und an diesem Punkt sahen wir einen Hinweis darauf, wie der Rest des Jahres aussehen würde. Aber gleichzeitig war es nicht nur ein einzelner Durchbruchspunkt. Treffender ist, dass wir auf allen Dimensionen der Innovation vorangetrieben haben.

Eine interessante Sache an diesen Modellen ist: In gewissem Sinne magst du das Gefühl haben, dass sie diese Momente der „Diskontinuität“ immer und immer wieder hatten; aber aus einer anderen Perspektive war alles eine kontinuierliche Evolution. Es sprang nicht plötzlich von 0 % auf 80 %, sondern eher von 20 % auf 80 %. Man könnte also in gewisser Weise auch sagen, dass es einfach besser wurde.

Und ich denke, dieser Fortschritt setzt sich eigentlich in jedem nachfolgenden kleinen Versions-Update fort. Zum Beispiel, von 5.2 auf 5.3, habe ich einen eng zusammenarbeitenden Ingenieur, der anfangs das Modell nicht dazu bringen konnte, die Low-Level-Hardcore-Systemarbeit zu erledigen, für die er verantwortlich war; aber bei der neuen Version konnte das Modell seine Designdokumente übernehmen, sie wirklich implementieren, Metrik-Monitoring und Observability hinzufügen, einen Profiler für Performance-Analyse ausführen, weiter optimieren und letztendlich das Ergebnis erzielen, das er ursprünglich hoffte, mit seinen eigenen Händen zu liefern.

Ich würde also sagen, es ist eher ein Prozess von „inkrementellem Fortschritt, und dann hat sich plötzlich alles geändert“. Aber all das wurde eigentlich durch die Fähigkeiten vorweggenommen, die derzeit im Spiel sind. Spätestens innerhalb eines Jahres werden viele Dinge, einige sogar viel schneller, extrem zuverlässig werden.

Alex:
Überrascht dich das nicht auch? Weil ich mich erinnere, dass du vor nicht allzu langer Zeit in einem Interview erwähnt hast, dass Werkzeuge wie Codex, ein automatisches Programmierwerkzeug, ursprünglich nur für Softwareentwickler waren. Aber früher im heutigen Gespräch hast du gesagt, dass eigentlich jeder diese Arten von Werkzeugen benutzen kann.

Was hat dich dazu gebracht, deine Meinung zu ändern?

Greg Brockman:
Ich habe Codex eigentlich immer im Kontext von „Code schreiben“ gerahmt. Schließlich hat sein Name Code darin, also ist es natürlich, es als Werkzeug für Programmierer zu sehen. Und innerhalb von OpenAI sind viele von uns selbst Softwareingenieure, die Werkzeuge für uns selbst bauen, also war es sehr natürlich, auf diese Weise zu denken.

Aber als diese Technologie voranschritt, begannen wir etwas zu realisieren: Die zugrunde liegende Technologie, die wir eigentlich gebaut haben, hat meistens gar nichts mit „Code“ zu tun, es geht grundlegend um „Probleme lösen“.

Im Kern geht es darum, Kontext zu verwalten, ein Ausführungs-Framework zu bauen und darüber nachzudenken, wie KI in echte Arbeit eingesteckt werden sollte, wie man Dinge tatsächlich erledigt bekommt. Und sobald das etabliert ist, bedeutet es plötzlich selbst in einem Programmierkontext, dass jeder diese Fähigkeit haben kann. Weil du wirklich ein System hast, das die Arbeit für dich erledigen kann. Solange du eine Vision hast, ein Ziel zu erreichen, und deine Absicht klar beschreiben kannst, kann KI losgehen und ausführen, kann Dinge erledigt bekommen.

Aber das wird dich auch dazu bringen, anzufangen zu fragen, warum konzentriere ich mich nur auf die „Nicht-Programmierung“ oder „Programmierung“-Trennung? Tatsächlich gibt es eine Menge Arbeit, die im Wesentlichen nur irgendeine Art von mechanischer Fähigkeit ist. Wie Excel-Tabellen, wie Präsentationen machen. Wenn KI bereits genug Kontext und ausreichende rohe Intelligenz hat, kann sie diese Dinge jetzt tatsächlich sehr gut tun.

Also, wenn wir sie nur zugänglicher, benutzerfreundlicher machen, wird es sich von „Codex ist für Programmierer“ plötzlich zu „Codex ist für alle“ verschieben.

Alex:
Und nachdem wir diesen deutlich sichtbaren Fortschritt sahen, sah das Silicon Valley schnell ein weiteres fast stilles Phänomen auftauchen, das Open Claw ist, richtig? Oder breiter gefasst, die gesamte Tech-Community beginnt, KI auf die Art und Weise zu vertrauen, die du gerade erwähnt hast – wie Desktop-Kontrolle an einen KI-Roboter abzugeben oder einen Mac mini einzurichten, ihm Berechtigungen für E-Mail, Kalender, Dateien zu geben und dann bis zu einem gewissen Grad, ihn „das Leben übernehmen“ zu lassen.

Später brachte OpenAI den Gründer von Open Claw ins Unternehmen. Könntest du also ein bisschen mehr über diese Art von KI sprechen, die „dir hilft, dein Leben zu managen“? Das Open-Claw-Team einzubringen, ist die zugrunde liegende Vision so etwas wie das?

Greg Brockman:
Ich würde sagen, der Kernaspekt dieser Technologie ist: herauszufinden, wie sie nützlich sein kann, wie Menschen sie tatsächlich nutzen wollen, was die Vision des intelligenten Agenten ist, wie er in das Leben der Menschen eintreten wird – das sind alles sehr schwierige Fragen.

Was ich in dieser Evolution der Technologie wiederholt gesehen habe, ist, dass diejenigen, die wirklich bereit sind, sich tief zu engagieren, voller Neugier sind und eine starke Vorstellungskraft haben, das an sich eine sehr reale Fähigkeit ist, und sie wird eine zunehmend wertvolle Fähigkeit in der neuen Wirtschaft werden.

Der Gründer von Open Claw, Peter, ist meiner Meinung nach so eine Person; er hat eine sehr starke Vorstellungskraft und einen starken kreativen Impuls. In gewisser Weise hängt dies also mit einer spezifischen Technologie zusammen; aber in anderer Weise ist es überhaupt kein rein technisches Problem. Es bezieht sich wirklich darauf: Wie betten wir diese Fähigkeiten in das Leben der Menschen ein, finden, wo sie wirklich hingehören.

Als Technologe ist das sicherlich aufregend; aber als jemand, der sich wirklich darum kümmert, den Nutzern praktischen Wert zu liefern, investieren wir jetzt stark darin, investieren viel.

Alex:
Du hattest kürzlich einen interessanten Kommentar dazu. Du sagtest, wenn du anfängst, diese autonomen KI-Agenten für dich arbeiten zu lassen, wirst du zum „CEO einer Flotte von Tausenden von intelligenten Agenten“, die für dich arbeiten, um deine Ziele, Visionen und Aufgaben zu erreichen, und du bist nicht mehr tief in die Details involviert, wie verschiedene Probleme gelöst werden.

Aber du hast auch erwähnt, dass diese neue Art zu arbeiten Menschen das Gefühl geben kann, dass sie den „Puls“ des Problems selbst verlieren.

Greg Brockman:
Ist das wirklich eine gute Sache? Ich denke, es ist ein zweischneidiges Schwert.

Ich denke also, was wir tun müssen, ist einerseits die wahre Kraft anzuerkennen, die diese Werkzeuge bringen können, und andererseits zu versuchen, die Schwächen, die sie bringen, so weit wie möglich zu mildern. Zum Beispiel den Menschen einen größeren Hebel zu geben, den Menschen eine größere Handlungsfähigkeit zu geben – wenn du eine Vision hast, etwas, das du erreichen willst, dann kannst du eine ganze Flotte von Agenten mobilisieren, um es für dich zu tun, was natürlich sehr mächtig ist.

Aber wenn du darüber nachdenkst, wie die Welt funktioniert, muss am Ende jemand verantwortlich sein. Angenommen, du baust eine Website und dein Agent vermasselt Dinge, was letztendlich den Nutzer betrifft, streng genommen ist es nicht die Schuld des Agenten, es ist deine Schuld. Also musst du dich darum kümmern.

Ich denke, jeder, der diese Werkzeuge wirklich nutzen will, muss anerkennen: menschliche Handlungsfähigkeit, menschliche Verantwortung sind Kernteile des gesamten Systems. Wie Menschen KI nutzen, ist grundlegend wichtig.

Ich denke also, der wichtigste Punkt ist: als Nutzer dieser Agenten – wir sind auch so innerhalb von OpenAI – kannst du Verantwortung nicht abgeben. Du kannst nicht einfach sagen: „KI wird sich von selbst um alles kümmern.“

Alex:
Natürlich. Aber was du gerade über „das Gefühl, den Puls des Problems zu verlieren“ gesagt hast, scheint anders zu sein als „Verantwortung“.

Greg Brockman:
Für mich sind diese beiden eigentlich verbunden. Weil der Schlüssel ist: wenn du ein CEO bist, aber zu weit von den Details entfernt bist – wie wenn du ein Team leitest, ein Unternehmen führst, aber den Kontakt zur Frontlinie verloren hast, führt das normalerweise nicht zu guten Ergebnissen. Was ich also gerade ausdrücken wollte, ist nicht, dass „Menschen endlich nichts mehr wissen können“ etwas ist, das es wert ist, verfolgt zu werden.

Natürlich können einige Details tatsächlich vertrauensvoll übergeben werden. Wie wenn du einen Generalunternehmer beauftragst, dein Haus zu bauen, gibt es viele Details, die du wahrscheinlich nicht persönlich beaufsichtigen musst, weil du darauf vertraust, dass die andere Partei es gut handhaben wird. Aber letztendlich, wenn einige wichtige Details schiefgehen, solltest du dich immer noch darum kümmern und du solltest immer noch Bescheid wissen.

Hier ist also ein sehr wichtiger subtiler Unterschied: Du kannst nicht einfach blind sagen: „Ich bin bereit, dieses Gefühl des Griffs auf das Problem zu verlieren.“ Stattdessen sollten wir aktiv sagen: Ich muss immer noch dieses Bewusstsein aufrechterhalten, um die Stärken und Schwächen des Systems wirklich zu verstehen.

Und während du beginnst, dich aus einigen der eher niedrigschwelligen, eher mechanistischen Transaktionen herauszuziehen, sollte der Grund, warum du das tun kannst, sein, dass du bereits Vertrauen in dieses System aufgebaut hast und bestätigst, dass es die Dinge tatsächlich richtig erledigt.

Alex:
Bezüglich der Modelle habe ich eine letzte Frage. Du hast einen Pfad der Modell-Evolution erwähnt: vom Vortraining über das Fine-Tuning bis zum Reinforcement Learning, wodurch es besser darin wird, Probleme Schritt für Schritt zu lösen und Aufgaben im Internet ausführen zu können.

Und jetzt haben wir eine Stufe erreicht, in der das Modell gelernt hat, Werkzeuge durch diesen Prozess zu benutzen. Wenn ich richtig verstehe, was wäre der nächste Schritt auf diesem Evolutionspfad?

Greg Brockman:
Ich denke, die Welt, in der wir uns jetzt befinden, ist eine Welt, in der Maschinenfähigkeiten kontinuierlich vertieft und erweitert werden. Ein Teil davon dreht sich sicherlich um die Nutzung von Werkzeugen, aber gleichzeitig müssen wir auch die „Werkzeuge“ selbst gut genug machen. Zum Beispiel, wenn KI bereits „Computeroperationen“ durchführen und Desktop-Systeme wie Menschen benutzen kann, dann kann sie im Prinzip alles tun, was du tun kannst.

Aber gleichzeitig müssen wir auch viele Dinge auf Infrastrukturebene für die Maschine bereitstellen. Zum Beispiel, in einer Unternehmensumgebung, wie machst du Identitätsauthentifizierung und Autorisierungsmanagement? Wie machst du Audit-Trails und Observability? Um mit der Entwicklung der zugrunde liegenden Fähigkeiten des Modells Schritt zu halten, müssen viele unterstützende Technologien gebaut werden.

Und aus einer allgemeinen Richtung denke ich, dass es Dinge wie ein „sehr natürliches Sprachinterface“ beinhalten wird. Das heißt, du kannst eine natürliche Konversation mit einem Computer führen, wie du es jetzt tust, wo er dich wirklich verstehen, tun kann, was du von ihm brauchst, und wertvolle Vorschläge machen kann.

Zum Beispiel wird er dich proaktiv erinnern: Etwas, an dem du gearbeitet hast, steckt jetzt fest, und das Problem liegt hier. Oder wenn du morgens aufwachst, wird er zu dir sagen: Hier ist dein tägliches Briefing, wie viel Arbeit haben deine Agenten letzte Nacht vorangebracht.

Vielleicht führt er sogar ein Geschäft für dich – ich denke, das wäre eine riesige Anwendung dieser Technologie. Die Demokratisierung des Unternehmertums wird definitiv passieren. Er wird dir sagen: Diese Bereiche sind problematisch; ein Kunde ist jetzt sehr unzufrieden und möchte mit einer echten Person sprechen, du solltest es besser selbst handhaben. Diese Dinge werden passieren.

Dann denke ich, die nächste Stufe beinhaltet auch: Die Obergrenze der Herausforderungen für Menschen wird durch diese Technologie weiter angehoben. Wir sind eigentlich schon an der Spitze dieses Trends. Was mich am meisten begeistert, ist fast analog zu AlphaGos Move 37 – dieser Zug ist etwas, das Menschen nie gemacht hätten, er ist kreativ, und er hat das Verständnis vieler Leute für das Spiel verändert.

Diese Art von Ding wird in jedem Bereich passieren. Es wird in Wissenschaft, Mathematik, Physik, Chemie passieren; es wird in Materialwissenschaft, Biologie, Gesundheitswesen, Medikamentenentwicklung passieren; und es mag sogar in Literatur, Poesie und vielen anderen Bereichen passieren. Es wird neue Räume menschlicher Kreativität und Verständnis auf Arten erschließen, die wir uns heute noch nicht vorstellen können.

Alex:
Aber wenn das Modell bereits so mächtig ist, wie du sagst, warum ist das bis jetzt nicht wirklich passiert?

Greg Brockman:
Ich denke, hier spielt eine „Fähigkeitsverzögerung“ eine Rolle – das bedeutet, es gibt immer noch eine signifikante Lücke zwischen den tatsächlichen Fähigkeiten des Modells und der Art und Weise, wie die Leute es derzeit nutzen. Bis zu einem gewissen Grad entwickelt sich unser Verständnis dessen, was „im Inneren“ des Modells ist, immer noch.

Ich glaube also, selbst wenn der technologische Fortschritt ab diesem Punkt stoppen würde, würde die Welt immer noch eine massive Veränderung durchlaufen – eine berechnungsgetriebene, KI-getriebene Wirtschaft wird immer noch ankommen.

Aber gleichzeitig gibt es eine weitere Ebene dazu: Was wir derzeit am besten können, ist Modelle auf Aufgaben zu trainieren, die „messbar“ sind. Also begannen wir anfangs mit Matheproblemen, Programmieraufgaben, weil diese Aufgaben sehr klare Validatoren haben: Entweder ist die Antwort korrekt oder nicht, was es einfach macht zu beurteilen. Und im Laufe der Zeit ist der Grund, warum wir die Modelle allmählich auf offenere Fragen drängen konnten, die Erweiterung des Umfangs dessen, „was validiert, evaluiert werden kann“.

KI selbst kann auch dabei helfen. Wenn KI schlau genug ist, die Aufgabe versteht und ein Bewertungskriterium erhält, kann sie allmählich lernen. Aufgaben wie kreatives Schreiben, wie „wie gut ist dieses Gedicht“, sind jedoch schwer zu bewerten.

Daher war es in der Vergangenheit in solchen Szenarien tatsächlich herausfordernd, KI dazu zu bringen, wirklich durch kontinuierliches Ausprobieren und Feedback zu lernen. All das ändert sich jedoch, und wir haben bereits eine ziemlich klare Sicht auf den Pfad, der vor uns liegt.

Alex:
Das ist ziemlich interessant. Peter Thiel sagte einmal etwas in der Art von: Wenn du gut in Mathe bist, könnte der Einfluss, den du vor diesen Modellen erlebst, sogar größer sein als der einer Person, die „gut mit Worten“ ist. Und du warst damals auch Mitglied im Matheclub. Bist du darüber nicht besorgt?

Greg Brockman:
Ich denke, die Leute neigen dazu, mehr von dem zu sehen, was sie verloren haben, als von dem, was sie gewonnen haben. Es liegt daran, dass wir eine tiefe Erfahrung davon haben, „wie ich das früher gemacht habe“. Zum Beispiel habe ich früher an Mathe-Wettbewerben teilgenommen, und jetzt kann KI auch Mathe-Wettbewerbe machen. Aber die Sache ist, das ging nie wirklich um „Mathe-Wettbewerbe“ an sich, oder? Das ist nicht die Kernsache, die den menschlichen Fortschritt vorantreibt.

Wenn du dir ansiehst, wie wir jetzt arbeiten – vor einer Box sitzen, auf einer anderen tippen – wir haben vor hundert Jahren nicht so gelebt. Das ist kein natürlicher Zustand, noch ist es wirklich, wie wir in dieser digitalen Welt existieren sollten, in die wir hineingezogen wurden.

Das ist nicht das Wesen des „Menschseins“. Was wirklich zählt, ist präsent zu sein, im Moment zu leben und sich mit anderen zu verbinden.

Und ich glaube, was wir gleich sehen werden, ist: KI wird eine erhebliche Menge an Zeit freisetzen, was Menschen mehr Möglichkeiten gibt, Verbindungen untereinander zu stärken, mehr Bindungen zwischen Menschen aufzubauen.

Das begeistert mich sehr.

Alex:
Richtig. Also, während ihr euch weiter auf diese agentenähnlicheren Anwendungen zubewegt, entsteht eine Diskussion darüber, ob große Trainingsaufgaben in der Zukunft noch notwendig sein werden?

Besonders wenn das Modell bereits gut genug ist, scheint es, als könntest du es einfach in die reale Welt bereitstellen und eine signifikante Verbesserung durch viele Stufen erzielen, die nicht auf Vortraining angewiesen sind. Und diejenigen, die wirklich massive Rechenzentrumsunterstützung erfordern, sind eigentlich hauptsächlich für das Vortraining.

Du warst immer für die Skalierung verantwortlich, treibst diese Bemühung voran. Wie siehst du dieses Argument?

Greg Brockman:
Ich denke, dieses Argument übersieht einen sehr wichtigen Punkt im technologischen Fortschritt. Tatsächlich verstärkt jeder Schritt in der Modellproduktions-Pipeline die Effekte der anderen. Also würdest du wollen, dass jeder Schritt stärker wird.

Wir sehen, dass: sobald das Vortraining stärker wird, jeder nachfolgende Schritt viel einfacher wird. Das ergibt eigentlich Sinn. Weil das Modell von Anfang an fähiger ist, lernt es schneller; es schreitet auch schneller voran, während es verschiedene Ansätze ausprobiert, aus seinen Fehlern lernt und schneller mit weniger Fehlern aufgrund seines stärkeren Fundaments vorankommt.

Daher ist die wirklich große Änderung nicht, dass wir von „Training eines rein geschlossenen, selbstableitenden rationalen Systems“ dazu übergehen, „es einfach Fehler in der realen Welt machen zu lassen“. Stattdessen erkennen wir, dass wir nicht nur das Modell selbst größer und stärker machen müssen, sondern es auch Dinge ausprobieren lassen, verstehen müssen, wie Menschen es in der realen Welt nutzen, und dieses Nutzungsfeedback zurück in den Trainingsprozess speisen müssen. Dies schmälert nicht den Wert, diese Forschung weiter voranzutreiben, noch schmälert es ihre Bedeutung.

Ich denke auch, es gibt eine weitere Änderung: In der Vergangenheit haben wir uns hauptsächlich darauf konzentriert, die rohen Fähigkeiten während der Vortrainingsphase zu verbessern, aber nicht so sehr die Fähigkeit während der Argumentations- oder Inferenzphase betont. Und in den letzten 24 Monaten war ein signifikanter Wandel, dass wir beginnen, die Notwendigkeit eines Gleichgewichts zwischen beiden zu erkennen.

Mit anderen Worten: Du kannst ein Modell mit sehr starker Fähigkeit haben, aber es muss auch effizient genug während der Inferenz und der tatsächlichen Bereitstellung sein. Weil, wenn du Reinforcement Learning betreiben und es wirklich in der realen Welt bereitstellen willst, erfordert all das sehr starke Inferenz-Effizienz.

Das bedeutet auch, dass du die Trainingsskala nicht unbedingt auf das theoretisch größtmögliche pushen musst, weil du auch nachfolgende groß angelegte Nutzungsszenarien berücksichtigen musst.

Was du wirklich willst, ist: der optimale Punkt des Produkts zwischen Intelligenzniveau und Kosten, anstatt nur eine Dimension zu optimieren.

Alex:
Wenn sich die Zukunft hauptsächlich in Richtung Inferenz verschiebt, würdest du Nvidias GPUs nicht mehr so sehr brauchen?

Greg Brockman:
Wir brauchen sie immer noch absolut.

Alex:
Warum?

Greg Brockman:
Es gibt viele Gründe.

Einer davon ist: egal wie sich das Verhältnis zwischen Training und Inferenz ändert, super groß angelegtes Training ist immer noch etwas, das nur getan werden kann, indem massive Rechenleistung auf ein Problem konzentriert wird, und derzeit gibt es keinen alternativen Weg, dies zu tun.

Ich denke also, was in der Zukunft eher passieren wird, ist: der Anteil der Rechenleistung auf der Bereitstellungsseite wird signifikant zunehmen; aber gleichzeitig wird es immer noch Momente geben, in denen du eine besonders große Vortrainingsaufgabe ausführen musst, und zu dieser Zeit musst du immer noch eine große Menge an Rechenleistung konzentrieren.

Und ich denke auch, dass Nvidias Team wirklich herausragend ist, die Arbeit, die sie leisten, ist erstaunlich. Also ja, wir arbeiten sehr eng mit ihnen zusammen.

Alex:
Wird es einen Tag geben, an dem die Leute anfangen zu sagen: „Wir haben genug vortrainiert, das Modell ist bereits schlau genug“?

Greg Brockman:
Ich denke, das ist ein bisschen wie zu sagen: wenn Menschen alle Probleme vor sich gelöst haben, können wir vielleicht sagen, dass wir das können. Aber ich denke, dass die Grenze dessen, was wir erreichen wollen, eigentlich viel höher ist.

In den letzten 50 Jahren hat sich unsere Ambition für viele Ziele bis zu einem gewissen Grad eigentlich verringert. Zum Beispiel scheinen einige Probleme sehr klar zu sein – können wir sicherstellen, dass jeder eine Krankenversicherung hat? Und nicht nur „behandeln, wenn es ein Problem gibt“, sondern wirklich präventive Gesundheitsversorgung erreichen, sich auf den Lebensstil konzentrieren, Menschen früh helfen, potenzielle Risiken erkennen, bevor eine Krankheit auftritt. Ich denke, wir können tatsächlich intelligentere Modelle nutzen, um diese Art von Problemen wirklich zu lösen.

Natürlich gibt es vielleicht ein Niveau, auf dem dieses Problem gründlich adressiert wurde, und an diesem Punkt könntest du fragen: Brauche ich immer noch ein Modell, das doppelt so schlau ist? Aber gleichzeitig wird es sicherlich andere Probleme geben, die ein höheres Maß an Intelligenz fordern.

Rechenleistung ist keine Kosten, sondern ein Umsatzmotor

Alex:
Lass uns über die Zahlen hinter dem Bau dieser Rechenzentren sprechen. Anfang des Jahres habt ihr 110 Milliarden Dollar aufgebracht. Wie hat die Rechnung da funktioniert? Geht dieses Geld direkt in Rechenzentren? Wie denkst du darüber nach, dieses Geld in Zukunft an Investoren zurückzugeben? Sprich über diese Logik in der Berechnung.

Greg Brockman:
Ich denke, grundlegend ist das sehr einfach: Unsere größte Ausgabe derzeit ist Rechenleistung. Aber du kannst Rechenleistung nicht nur als Kostenstelle betrachten; sie ist eher eine Umsatzstelle.

Du kannst es dir wie das Einstellen eines Vertriebsteams vorstellen. Wie viele Verkäufer bist du bereit einzustellen? Solange dein Produkt verkauft werden kann, solange du einen Mechanismus hast, um den Verkauf dieses Produkts zu skalieren, desto mehr Verkäufer du einstellst, desto höher der Umsatz.

Und die Welt, in der wir uns gerade befinden, ist, dass wir ständig feststellen, dass wir einfach nicht schnell genug Rechenleistung bauen können, um mit der Nachfrage Schritt zu halten. Das kann ich gerade sehr konkret spüren. Wir müssen sehr schmerzhafte Entscheidungen treffen: welche Funktionen live gehen können, welche Funktionen vorerst nicht; wo Rechenleistung zuerst hingeht und wo nicht.

Und ich denke, während sich die gesamte Wirtschaft in Richtung einer KI-getriebenen Wirtschaft verschiebt, wird diese Situation viel breiter spürbar sein.

Was reale zukünftige Probleme sein werden: welche Probleme können diese Art von massiver Rechenleistung bekommen? Wie skalierst du so, dass jeder seine eigene persönliche KI hat? Wie bringst du jeden dazu, Systeme wie Codex zu nutzen?

Derzeit gibt es einfach nicht genug Rechenleistung auf der Welt, um diese Dinge zu unterstützen. Also bereiten wir uns im Voraus auf dieses Problem vor.

Alex:
Aber das ist letztendlich eine ganz neue Kategorie, richtig? Und du nutzt einen sehr starken Determinismus, um darauf zu wetten – eine so große Menge, fast ungesehen in der Welt. Wenn du eine neue Kategorie erschaffst, wie kannst du so sicher sein, dass sie letztendlich Bestand haben wird?

Greg Brockman:
Ich denke, es gibt mehrere Komponenten dazu.

Erstens gibt es jetzt tatsächlich einen historischen Präzedenzfall. Von dem Moment an, als ChatGPT veröffentlicht wurde, erinnere ich mich, ein sehr klares Gespräch mit mir selbst und dem Team geführt zu haben. Jemand fragte mich: Wie viel Rechenleistung sollten wir kaufen? Ich sagte: Alles davon. Dann fragte jemand noch einmal: Nein, im Ernst, wie viel sollten wir kaufen? Ich sagte: Egal wie wir bauen, ich weiß, dass wir mit der Nachfrage nicht Schritt halten können.

Und jedes Jahr seitdem hat diesen Punkt bewiesen. Die Herausforderung ist, dass solche Hash-Power-Beschaffungen typischerweise 18 Monate im Voraus festgeschrieben werden müssen, manchmal 24 Monate oder sogar länger. Also musst du die Entscheidung treffen, lange bevor die Maschinen tatsächlich geliefert werden. Das bedeutet, du musst unglaublich vorausschauend sein.

Und die Welt, auf die wir uns zubewegen, ist: Bis heute stammt der Großteil unseres Umsatzes immer noch aus Endkunden-Abonnements, die auch in Zukunft sehr wichtig bleiben werden. Natürlich schaffen wir auch andere Einnahmequellen.

Aber die aufkommende, größere Gelegenheit jetzt ist Wissensarbeit.

Und das haben wir bereits sehr konkret gesehen: Fast jedes Unternehmen beginnt zu realisieren, dass diese Technologie tatsächlich nützlich ist, und wenn sie wettbewerbsfähig bleiben wollen, müssen sie sie adoptieren. Du kannst diese sehr natürliche Dynamik sehen, viele Softwareingenieure nutzen sie bereits; und jetzt fängst du an, eine breitere Verbreitung zu sehen, Leute innerhalb des Unternehmens integrieren sie in verschiedene Wissensarbeitsszenarien. Und die Zahlungsbereitschaft, die in dieser Industrie entstanden ist, und das Umsatzwachstum, das du siehst, ist sehr klar.

Das passiert gerade jetzt. Du musst es nur extrapolieren. Und eine Sache, die wir vielleicht klarer sehen als andere, ist: Wir können besser sehen, wie sich diese Modelle als Nächstes entwickeln werden.

Wenn man all diese Dinge zusammennimmt, realisiert man: diese Wirtschaft selbst ist eine extrem massive Sache, fast unvorstellbar so. Und von nun an wird der primäre Wachstumstreiber für diese Wirtschaft KI sein – wie gut du KI nutzen kannst und wie viel Hash-Power du hast, um sie anzutreiben.

Alex:
Du hast gerade erwähnt, dass Endkunden-Abonnements derzeit deine größte Einnahmequelle sind. Ist also deine Einschätzung, dass dies in der Zukunft umgekehrt wird und Unternehmen zur größten Einnahmequelle werden?

Greg Brockman:
Ich denke, es ist jetzt sehr klar, dass diese „Unternehmensseite“ schnell wächst. Natürlich entwickelt sich der Begriff „Unternehmensseite“ selbst auch. Weil das, worauf er wirklich hinweist, ist: Menschen, die KI in produktiver Wissensarbeit nutzen.

Und in Bezug auf die Preisgestaltung denke ich nicht, dass die Kategorien notwendigerweise so klar getrennt sein werden, wie sie es früher waren. Zum Beispiel ist das aktuelle Nutzungsmodell von Codex: Wenn du ein Endkunden-Abonnement für ChatGPT hast, hast du bereits Zugriff auf Codex.

Ich denke also nicht, dass die Zukunft eine so deutliche Trennung zwischen B2B und B2C sein wird. Das wahrscheinlichere Szenario ist: als Nutzer wirst du einen einheitlichen Einstiegspunkt haben – genau wie dein Laptop, der dein Gateway zur digitalen Welt ist.

Und echter Umsatz wird grundlegend von hier kommen.

Alex:
Dario sagte einmal etwas, und ich denke, er könnte über dich gesprochen haben: Einige Akteure haben das Risikorad zu hoch gedreht, und er ist sehr besorgt darüber. Ich denke, er bezog sich auf eure massive Infrastrukturwette. Was ist deine Meinung zu dieser Aussage?

Greg Brockman:
Ich stimme nicht zu. Ich denke, wir waren immer sehr vorsichtig, und wir haben tatsächlich gesehen, was als Nächstes kommt. Ich glaube, dass selbst wenn man nur auf dieses Jahr schaut, alle, die wirklich teilgenommen haben, den „Rechenleistungs-Engpass“ spüren werden.

Und ich denke, wir haben das einfach früher realisiert als andere, und uns früher darauf vorbereitet, wie sich die Technologie entfalten würde.

Was ich stattdessen gesehen habe, ist, dass viele andere Teilnehmer das wahrscheinlich erst Ende letzten Jahres realisiert haben und dann losstürmten, um Rechenleistung zu finden, nur um festzustellen, dass fast keine mehr zu kaufen war.

Ich denke also, es ist einfach, solche Dinge zu sagen. Aber die Realität ist, jeder realisiert jetzt: diese Technologie ist lebensfähig, sie ist hier, sie ist real. Software-Engineering ist nur das erste klare Beispiel dafür.

Und was uns wirklich einschränkt, ist die verfügbare Berechnung.

Alex:
Er sagte auch, dass seine Firma bankrottgehen könnte, wenn seine Vorhersage auch nur leicht abweicht. Stehst du vor demselben Risiko?

Greg Brockman:
Ich denke, es gibt hier eigentlich eher eine „Falltür“. Wenn du anfängst, ernsthaft über die Kehrseite nachzudenken – und ich denke, das ist eine vollkommen faire Frage –, wirst du feststellen, dass diese Wette bis zu einem gewissen Grad eigentlich nicht wirklich auf irgendein Unternehmen war.

Es war wirklich auf die gesamte Industrie. Es ist eine Wette auf: Glaubst du, dass diese Technologie gemacht werden kann, und kann sie den enormen Wert liefern, den wir heute sehen?

Ich kehre immer wieder zu diesen direktesten Beweisen zurück. Wie Software-Engineering – wenn du kein Softwareingenieur bist, wenn du Codex nicht wirklich benutzt hast, ist es schwer, den Unterschied in der Erfahrung durch Lesen zu verstehen. Dieser Unterschied ist eigentlich schwer zu beschreiben. Aber ich denke, die Leute werden ihn bald wirklich spüren.

Vor sechs Monaten war diese Art von spürbarer Erfahrung meist intern bei uns; später gab es auch klare externe Beweise. Und in weiteren sechs Monaten denke ich, wird es jeder spüren. Und bis dahin werden wir alle eine andere Art von Schmerz spüren: es gibt großartige Modelle da draußen, aber du kannst sie nicht benutzen, weil es einfach nicht genug Rechenleistung auf der Welt gibt.

Alex:
Ja, aber als wir Vorhersagen für 2026 in der Show machten, gab es Ende letzten Jahres eine Diskussion. Ranjan Roy war auch da, und er sagte, 2026 wäre das Jahr, in dem „jeder einen intelligenten Agenten benutzt“. Meine Reaktion damals war: Ich werde es glauben, wenn ich es mit meinen eigenen Augen sehe und wenn ich tatsächlich anfange, selbst einen intelligenten Agenten zu benutzen.

Greg Brockman:
Also jetzt, haben wir diesen Moment nicht erreicht? Wofür benutzt du ihn jetzt?

Alex:
Ich benutze ihn, um einige interne Werkzeuge zu bauen, um den Leuten, mit denen ich arbeite, zu helfen, besser zu synchronisieren, wenn Videos online gehen, wie Thumbnails gemacht werden sollten und solche Dinge. Ich ziehe auch einige Daten von YouTube, damit wir die Videoperformance basierend auf Faktoren wie Thumbnails analysieren können. Bis zu einem gewissen Grad ist dies eine Reihe von Software, die ich selbst angepasst habe, und wenn ich es auf traditionelle Weise tun würde, würde ich wahrscheinlich kein Geld ausgeben, um sie überhaupt zu kaufen.

Ich denke, das ist es, was es gerade interessant macht: Software wurde ursprünglich in Massen für die breite Öffentlichkeit produziert, aber genau deshalb gibt es immer viele Stellen darin, die nicht auf dich zugeschnitten sind. Und vielleicht ist die Änderung, die durch KI herbeigeführt wird, dass sie uns endlich erlaubt, auf natürlichere Weise mit Software zu interagieren.

Greg Brockman:
Ich denke, das ist der Schlüssel. Und eine Sache, über die ich ständig nachgedacht habe, ist: Die Art und Weise, wie wir Computer heute bauen, zieht uns eigentlich in eine digitale Welt.

Denk darüber nach, wie viel Zeit du damit verbringst, ständig Inhalte auf deinem Handy zu scrollen. Dann denk darüber nach, wie viel Zeit du damit verbringst, kontinuierlich verschiedene Knöpfe zu klicken, zu versuchen, dieses System mit jenem System zu verbinden – warum müssen diese Dinge von dir selbst erledigt werden? Was KI wirklich tun sollte, ist, die Maschine näher an dich heranzubringen, sie maßgeschneiderter für dich zu machen und verständnisvoller für das, was du erreichen willst.

Diese Idee war schon immer Teil unserer Popkultur: du kannst direkt mit dem Computer sprechen, und dann erledigt er Dinge für dich. Und jetzt fängt diese Sache an, Realität zu werden, wirklich etwas zu werden, das du tun kannst. Das Ausmaß dieser Änderung ist wirklich erstaunlich, und viele Male musst du es selbst ausprobieren, um es wirklich zu verstehen. Also habe ich wirklich das Gefühl, dass wir uns in einem sehr besonderen Moment befinden.

Alex:
Dann frage ich mich, warum ist die öffentliche Wahrnehmung von KI so negativ? Zum Beispiel zeigen YouGov-Daten, dass in den Vereinigten Staaten dreimal so viele Menschen glauben, dass KI einen negativen Einfluss auf die Gesellschaft haben wird, im Vergleich zu denen, die glauben, dass sie einen positiven Einfluss haben wird.

Was denkst du, ist der Grund dafür? Bist du besorgt über das öffentliche Image von KI?

Greg Brockman:
Ich denke, eine Sache, die wir wirklich tun müssen, ist: den Menschen dieses Landes zu zeigen, warum KI für sie vorteilhaft ist. Und nicht nur aus makroökonomischer Sicht, nicht nur zu sagen, dass sie das BIP-Wachstum und andere große Worte wie diese antreiben wird, sondern: wie sie ihr Leben tatsächlich spezifisch verbessert.

Tatsächlich höre ich jeden Tag sehr spezifische Geschichten. Zum Beispiel gibt es eine Familie, deren Kind ständige Kopfschmerzen und einige andere Gesundheitsprobleme hatte, aber ihr MRT-Scan wurde nicht genehmigt. Später nutzten sie ChatGPT, um die Symptome zu erforschen, und realisierten, dass sie dies tatsächlich nutzen konnten, um einen stärkeren Fall gegenüber der Versicherungsgesellschaft zu machen. Sie taten dies, und es stellte sich heraus, dass das Kind tatsächlich einen Tumor im Gehirn hatte. Und es war, weil sie die richtigen Informationen durch ChatGPT bekamen, dass das Leben des Kindes gerettet wurde.

Das ist nur eine Geschichte. Es gibt viele, viele ähnliche Geschichten. Das Leben der Menschen wurde durch diese Technologie tiefgreifend verbessert, und einige wurden sogar durch sie gerettet. Der Schlüssel ist, dass sie sich wirklich im wirklichen Leben mit dieser Technologie auseinandergesetzt haben.

Aber ich habe das Gefühl, dass diese Art von Geschichten nicht wirklich weit verbreitet wurden. Ich denke, das passiert im Leben vieler Menschen, aber aus irgendeinem Grund ist es noch nicht wirklich zu einem Mainstream-Narrativ geworden.

Ich habe auch bemerkt, dass die Populärkultur, besonders die Vorstellungskraft, die seit den 1990er Jahren besteht, sehr negativ über KI ist, immer betont, was schiefgehen könnte. Aber sobald die Leute tatsächlich anfangen, KI zu benutzen, finden sie, dass sie praktischen Wert hat, dass sie hilfreich ist.

Also kümmere ich mich sehr darum: wir haben es nicht wirklich geschafft, den Menschen zu helfen zu verstehen, warum diese Welle von Technologie ihr Leben verbessern wird, warum sie engere Verbindungen zwischen menschlichen Wesen fördern wird.

Das ist ein sehr wichtiger Fokus für mich. Und wenn du deine Perspektive ein bisschen erweiterst, um zu sehen, warum KI so wichtig ist, denke ich, dass sie in Zukunft eine bedeutende Quelle wirtschaftlicher Macht und nationaler Sicherheit werden wird. Sie wird die Wettbewerbsfähigkeit eines Landes beeinflussen. Und andere Länder wie China haben eine fast völlig entgegengesetzte Richtung in KI gezeigt.

Also ja, ich denke, das ist sehr wichtig. Wir müssen uns dem stellen, und wir müssen wirklich herausfinden, wie wir sicherstellen können, dass jeder von den Vorteilen dieser Technologie profitieren kann.

Alex:
Aber wir befinden uns auch in einem extrem instabilen Moment gerade. Die Leute sind sehr besorgt um Jobs. Jedes Mal, wenn ich mit jemandem über KI spreche, fragen sie fast immer: Wie lange kann ich meinen Job behalten?

Und dann, wenn es um Rechenzentren geht, ist die Wahrnehmung der Öffentlichkeit von ihnen sogar noch schlechter als von KI selbst. Wenn du dir diese Meinungsumfragen ansiehst, wirst du feststellen, dass mehr Menschen glauben, dass Rechenzentren einen negativen Einfluss auf die Umwelt, die häuslichen Energiekosten und die Lebensqualität der umliegenden Bewohner haben werden, anstatt einen positiven Einfluss.

Wir befinden uns also in einem Moment, in dem gute Jobs immer schwerer zu bekommen sind, und die Leute sehen Rechenzentren in ihre Gemeinde kommen und denken: „Dieses Ding ist weder umweltfreundlich noch kosteneffektiv in Bezug auf Energie, und es wird unsere Lebensqualität senken.“

Haben sie unrecht?

Greg Brockman:
Ich denke, es gibt tatsächlich viele Fehlinformationen rund um Rechenzentren.

Ein sehr typisches Beispiel ist das Problem des Wasserverbrauchs. Wenn du tatsächlich hingehst und dir unsere Einrichtung in Abilene ansiehst, die die weltweit größte ist, oder zumindest eine der größten, Supercomputing-Einrichtungen, ist ihr gesamter jährlicher Wasserverbrauch eigentlich äquivalent zu dem eines durchschnittlichen Haushalts für ein Jahr. Mit anderen Worten, der Wasserverbrauch ist eigentlich minimal.

Aber es gibt viele Fehlinformationen da draußen, die die Leute dazu bringen zu glauben, dass diese Rechenzentren eine große Menge an Wasserressourcen verbrauchen.

Elektrizität ist eine ähnliche Situation. Wir haben uns verpflichtet, die Kosten selbst zu tragen und den Druck steigender Strompreise nicht an die Bewohner weiterzugeben. Das ist wichtig, und jetzt beginnt die gesamte Industrie, ähnliche Verpflichtungen einzugehen, weil die Verbesserung der lokalen Gemeinschaft tatsächlich sehr wichtig ist. Und wenn wir ein Rechenzentrum bauen, engagieren wir uns auch wirklich mit diesen lokalen Gemeinschaften, um zu verstehen, was lokal passiert und was wir tun können, um zu helfen. Rechenzentren bringen Steuereinnahmen und schaffen Jobs. Es bringt tatsächlich viele Vorteile.

Ich denke also, der Schlüssel ist immer noch, wie wir auftreten, und das ist eine Verantwortung, die wir sehr ernst nehmen.

Alex:
Okay, aber wenn die Stromrechnungen der Bewohner nicht steigen, musst du immer noch Elektrizität hereinbringen, was mehr Verschmutzung bedeuten könnte. Ist das nicht ein Problem?

Greg Brockman:
Ich denke, es gibt tatsächlich viele feinere Schichten dazu.

Wenn du dir ansiehst, wie das Stromnetz heute operiert, wirst du feststellen, dass es eigentlich eine Menge „ungenutzten Strom“ gibt – das heißt, eine Menge Strom ist bereits da, wird aber nicht voll genutzt. Gleichzeitig muss das Übertragungssystem selbst modernisiert werden. Und der Schlüssel ist, dass diese Modernisierungskosten von uns getragen werden sollten, nicht von gewöhnlichen Stromzahlern, was sehr wichtig ist. Es gibt viele Orte, an denen saubere Energie verfügbar ist, aber dieser Strom wird eigentlich nicht voll genutzt und wird sogar bis zu einem gewissen Grad verschwendet.

Also, wenn die Nachfrage von Rechenzentren hereinkommt, bringt sie tatsächlich einen echten Impuls, diese alternden, veralteten Netze zu modernisieren. Und diese Modernisierung bringt tatsächlich echte Vorteile für die Gemeinschaft. Zum Beispiel haben wir in North Dakota gesehen, dass der Bau eines lokalen Rechenzentrums tatsächlich geholfen hat, die Versorgungs-Infrastruktur zu verbessern, was zu einem Rückgang der Strompreise für Wohngebäude führte.

Alex:
Okay, eine letzte politische Frage. Du hast 25 Millionen Dollar an MAGA Inc. gespendet, was ein politisches Aktionskomitee ist, das Trump unterstützt.

Greg Brockman:
Du hast das auch schon mit Kara besprochen.

HINWEIS: Kara Swisher, eine prominente amerikanische Tech-Journalistin, bekannt für ihre scharfe Fragestellung und ihren direkten Stil, hat lange über das Silicon Valley und Internetunternehmen berichtet.

Alex:
Richtig. Du sagtest damals: „Alles, was dieser Technologie hilft, wirklich jedem zu nützen, werde ich tun.“ Wenn dich das zu einem „Single-Issue-Wähler“ oder „Single-Issue-Spender“ macht, dann sei es so. Aber was ich mich immer gefragt habe, ist: Für diese Art von „Single-Issue-Lager“, sollte nicht der ultimative Nordstern jeder politischen Aktion „dieses Land stärker zu machen“ selbst sein?

Mit anderen Worten, selbst wenn ein Kandidat nicht voll unterstützt, was du tust, wenn er dieses Land stärker machen kann, sollte das nicht auch ein Schlüsselkriterium für politische Unterstützung sein? Wenn ja, ist das auch Teil deiner Spendenüberlegung?

Greg Brockman:
So sehe ich das: Diese Spende war eine Entscheidung, die meine Frau und ich zusammen getroffen haben. Wir haben auch an Super-PACs auf beiden Seiten des Ganges gespendet.

Ich habe das Gefühl, dass diese Technologie sehr schnell kommt. In den nächsten paar Jahren wird sie wirklich alles verändern und zum Fundament der gesamten Wirtschaft werden. Aber sie ist noch nicht populär. Also wollen wir sehr stark jene politischen Figuren unterstützen, die wirklich bereit sind, diese Technologie zu umarmen, die diese Technologie wirklich verstehen.

Natürlich, auf einer breiteren Ebene, verbessert diese Technologie selbst tatsächlich die Fähigkeiten unseres Landes. In gewissem Sinne bin ich tatsächlich ein „Single-Issue-Wähler“, weil ich glaube, dass dies der Bereich ist, in dem ich einen einzigartigen Beitrag leisten kann. Aber letztendlich geht es immer noch darum, eine Unterstützung auszudrücken: als Land sollten wir diese Technologie proaktiv umarmen.

Zukünftige Kernkompetenz: Nicht KI nutzen, sondern „KI managen“

Alex:
Wenn gerade jemand vor dir sitzt, der sehr Angst vor KI hat, denkt, KI wird ihm seinen Job wegnehmen, seine Gemeinschaft ruinieren, die Welt zu schnell verändern, was würdest du ihm sagen?

Greg Brockman:
Das eine, was ich am meisten sagen möchte, ist: Geh und probiere diese Werkzeuge selbst aus. Weil du erst, wenn du die KI, die heute bereits existiert, wirklich erlebt hast, wirklich verstehen wirst, was sie für dich tun kann.

Und heute haben wir bereits zu viele Möglichkeiten, Potenziale und Befähigungen von dieser Technologie gesehen. Du hast gerade gesagt, was du jetzt damit tun kannst, richtig? Leute, die noch nie eine Website gemacht haben, können jetzt eine machen; wenn du ein kleines Unternehmen gründen willst, warst du früher vielleicht von verschiedenen Backend-Prozessen und operativen Details überwältigt, aber jetzt kann KI dir bei vielen dieser Dinge helfen.

Ich denke also, für dein eigenes Leben solltest du darüber nachdenken: Kann sie dir helfen, deine Gesundheit zu managen? Kann sie dir helfen, dich um deine Lieben zu kümmern? Kann sie dir helfen, Geld zu verdienen? Kann sie dir helfen, Geld zu sparen? All das werden echte Optionen sein.

Ich denke, die Leute finden es immer einfacher zu sehen, „was sich ändern wird“, aber nicht so einfach zu sehen, „was sie gewinnen werden“. Ich glaube jedoch, es ist es wert, ihr eine faire Chance zu geben, um wirklich zu verstehen, was jede Seite der Skala wirklich repräsentiert.

Alex:
Übrigens ist das auch ein Punkt, der in Umfragen selten diskutiert wird. Diejenigen, die nur „von KI gehört haben“, aber sie nie wirklich selbst benutzt haben, oder kaum KI benutzt haben, neigen dazu, negativer zu sein. Sobald du ein Heavy-User wirst, oder sogar nur ein regelmäßiger Nutzer, ist deine Sicht auf diese Technologie normalerweise viel positiver.

Greg Brockman:
Für mich persönlich denken wir seit vielen Jahren über diese Technologie nach. Und jetzt ist die Art und Weise, wie ich die Realität sich entfalten sehe, noch erstaunlicher und vorteilhafter, als wir uns jemals vorgestellt haben, und sie wird einen viel positiveren Einfluss haben, als wir erwartet haben.

Alex:
Eine letzte Frage. Wenn dich jemand fragt: „Wie sollte ich mich auf die Zukunft vorbereiten?“, wie würdest du antworten?

Und diese Antwort kann nicht nur „geh ein Werkzeug benutzen“ sein. Weil ich wirklich Freunde habe, die zu mir kommen und fragen: „Ich weiß nicht, was mit meinem Job passieren wird, weiß nicht, was mit dieser Welt passieren wird, ich will nur wissen, was ich jetzt tun soll.“

Greg Brockman:
Ich denke immer noch, das erste ist, diese Technologie zu verstehen. Wir haben gesehen, dass diejenigen, die am meisten von dieser Technologie profitieren, oft diejenigen sind, die ihr mit Neugier begegnen. Sie werden sie wirklich in ihren Arbeitsablauf integrieren, sich bemühen, die anfängliche Schwelle zu überwinden – einem leeren Eingabefeld gegenüberzustehen und diesem Gefühl von „was soll ich überhaupt damit tun“.

Du musst allmählich ein Gefühl für Handlungsfähigkeit kultivieren: Ich kann ein Manager sein; ich kann Richtungen vorgeben; ich kann Aufgaben delegieren; ich kann überwachen. Und du musst diese Fähigkeit wirklich entwickeln, weil sie zu einer sehr grundlegenden Fähigkeit werden wird.

Wir bauen diese Technologie, um der Menschheit zu helfen, mehr Verbindungen zwischen Menschen zu fördern, den Menschen mehr Zeit zu geben, das zu tun, was sie wirklich tun wollen. Also wird die Frage letztendlich werden: Was willst du wirklich? Und das wirklich Wichtige ist, dies zu klären und diese Technologie zu nutzen, um es zu erreichen.

Alex:
Das stimmt. Vielen Dank, dass du in die Show gekommen bist.

Greg Brockman:

Danke für die Einladung.

Alex:
Auch danke an alle fürs Zuhören und Zuschauen. Bis zum nächsten Mal im Big Technology Podcast.

[Video Link]

Das könnte Ihnen auch gefallen

Sharplink-CEO: Die Zukunft von Ethereum entfaltet sich

Der Markt konzentriert sich auf den ETH-Kurs und Kontroversen um die Stiftung, übersieht dabei aber das große Ganze: Ethereum ist bei Stablecoin-Abwicklungen, RWA und DeFi weit voraus und hat die Voraussetzungen für eine institutionelle Adoption bereits erfüllt.

Von Casino-Tools zu globalen Preismaschinen: Die Perspektive des NYSE-Chefs auf Hyperliquid

„Warum dürfen die das, und wir nicht?“ Diese rhetorische Frage offenbart nicht nur die Besorgnis traditioneller Börsen, sondern spiegelt auch das subtile und komplexe Kräftemessen zwischen TradFi und DeFi wider, nachdem sich unbefristete Terminkontrakte (Perpetuals) von Glücksspielinstrumenten zu einer globalen Infrastruktur für die Preisfindung gewandelt haben.

Sind es Hacker und Regulierungsbehörden, die DeFi ruiniert haben?

Die Zukunft von DeFi wird sich entweder in Richtung einer strengeren Selbstregulierung der Branche und eines Compliance-Rahmens bewegen, wobei Kompromisse bei den Prinzipien der Dezentralisierung eingegangen werden müssen; oder sie wird aufgrund des anhaltenden Ungleichgewichts zwischen Angriff und Verteidigung allmählich das Vertrauen des Marktes verlieren, was zu einer langfristigen Marginalisierung führt.

Chris Lee: Vom Krypto-OG zu Großinvestitionen in die drei Speicher-Giganten, Prognosen zu KI-Bullenmarkt-Korrekturen, Web4 und Chancen für die junge Generation

Die Web3-Ära ist vorbei, dem Kapitalfluss folgend.

He Yidengs Rang: Wenn du schon einmal hier bist, kannst du es auch versuchen

He Yi von Binance wurde in die Liste der "Most Powerful Women in Business" von Fortune aufgenommen, drückte der Community ihren Dank aus und kündigte die neue Vision von Binance an: den Aufbau einer Finanzinfrastruktur für 3 Milliarden Menschen weltweit.

Sechs große Kritikpunkte eines Ethereum-Entwicklers

Ethereum hat nicht den Markt verpasst, sondern sich selbst.

WEEX GOGOGO Folge 3｜LALIGA Road to Gold – 6 explosive Momente, 1 WM-Ticket und eine Nacht, die niemand vergessen wird

WEEX ging am 24. Mai mit LALIGA, KI-Trading, Gold ohne Gebühren und 100 % effektivem Jahreszins an den Start. Der Chat explodierte. Die Belohnungen flossen. Und ein glücklicher Fan ging mit einem WM-Ticket nach Hause. Hier ist, was passiert ist.

2 Jahre, 225-fache Rendite? Wir enthüllen die KI-„Flaschenhals“-Anlagestrategie des mysteriösen Forschers Serenity

Der ehemalige WSB-Trader Serenity hat auf der X-Plattform innerhalb von zwei Jahren eine beeindruckende 225-fache Rendite erzielt. Seine originelle Theorie zum „Lieferketten-Flaschenhals“ und mehrere klassische Fallstudien zu Micro-Cap-Reverse-Sniper-Trades haben große Aufmerksamkeit am Markt erregt.

B.AI kooperiert mit BNB Chain zum Start der „Billion AI Token Subsidy“-Feier und entfacht das On-Chain-Ökosystem für intelligente Agenten

B.AI kooperiert mit BNB Chain für ein Subventionsprogramm in Höhe von hundert Milliarden Punkten, ergänzt durch einen speziellen Anreiz von 8.000 USDT im Gesamtpreispool, um Web3-Nutzern den barrierefreien Zugang zu führenden Large Models und eine Full-Stack-KI-Finanzinfrastruktur zu ermöglichen.

Der Billionen-Dollar-Rausch beim Speicherverkauf: Gewinne beim Speicherkauf halbiert

Die Nachfrage nach Rechenleistung und Speicher durch KI könnte tatsächlich struktureller Natur sein, und LTA hat möglicherweise die Branchenregeln grundlegend neu geschrieben; ein Marktwert von einer Billion Dollar ist womöglich erst der Anfang.

Morgenbericht | Binance startet DYOR-Recherche-Tool; YZi Labs startet Rekrutierungsplattform YZi Talent; Vitalik erklärt, dass die Ethereum Foundation „verkleinern“ und den Verkauf von ETH reduzieren wird

Überblick über wichtige Marktereignisse am 25. Mai

Der Mars-Traum von SuperEx: Digitale Währungen als Schlüssel für den wirtschaftlichen Austausch im interstellaren Zeitalter

SuperEx hat Börsen stets dazu aufgerufen, sich nicht auf interne Konflikte und Wettbewerb zu konzentrieren, sondern gemeinsam die Entwicklung digitaler Währungen voranzutreiben, um zu einer treibenden Kraft für das kommende interstellare Zeitalter zu werden.

Morgennachrichten | Michael Saylor gab an, diese Woche Anleihen statt Bitcoin gekauft zu haben; StablR wurde angegriffen und verlor etwa 2,8 Millionen Dollar; der US-Kongress treibt den Bitcoin Reserve Act erneut voran

Überblick über wichtige Marktereignisse am 24. Mai

Wichtigste Erkenntnisse: Volltext der Rede von Google-Chef-Wissenschaftler Shanahan

Die Londoner Rede des Google DeepMind-Chef-Wissenschaftlers Shanahan: Dekonstruktion der mentalen Attribute großer Sprachmodelle (LLMs) unter Verwendung des Wittgenstein-Rahmenwerks und Analyse des Trends zur „fremdartigen Selbstidentität“ im Kontext von Allwetter-Agenten.

Agentic Design Patterns: Ein Buch, das mich dazu brachte, „Was genau ist ein Agent?“ zu überdenken

Das neue Buch eines Google Engineering Directors analysiert tiefgreifend: 21 Design-Patterns für KI-Agenten. Dieser Artikel enthüllt die Kernentwicklung vom „nackten LLM“ zu fortschrittlichen intelligenten Agenten und erläutert Context Engineering, den dualen Agenten-Reflektionsmechanismus (Producer-Critic) sowie das Drei-Schichten-Speichermodell, u. a.

Der reichste Fed-Chef seit 112 Jahren ist da: Kevin Warsh schreibt die Regeln neu

Der „reichste“ neue Vorsitzende der Federal Reserve, Kevin Warsh, hat sein Amt offiziell angetreten. Sein alternativer Vorschlag einer „Bilanzverkürzung bei gleichzeitiger Zinssenkung“ zielt nicht nur darauf ab, den Entscheidungsmechanismus umzugestalten, sondern auch das US-Finanzministerium, den Dollar und die globale...

Vitalik über die Zukunft der Ethereum Foundation: Ein kleineres, markanteres und beständigeres Schiff

Vitalik erläuterte seine persönlichen Ansichten zur Ausrichtung der Ethereum Foundation: Die EF ist nicht das „Zentrum von Ethereum“, sondern einer von vielen Knotenpunkten. Mit begrenzten Ressourcen setzt die EF auf Langfristigkeit statt auf Überlastung und konzentriert sich auf Kernaufgaben, die „ohne die EF nicht stattfinden würden“ –...

Neue Formen der Informationswäsche auf Prognosemärkten: Wie Geheimnisse in Investitionssignale einfließen

Die harte Realität ist, dass Informationswäsche keine von Menschen geschaffene Lücke im Prognosemarkt ist, sondern ein Nebenprodukt seines grundlegenden Funktionsmechanismus.

Chris Lee: Vom Krypto-OG zu Großinvestitionen in die drei Speicher-Giganten, Prognosen zu KI-Bullenmarkt-Korrekturen, Web4 und Chancen für die junge Generation

Die Web3-Ära ist vorbei, dem Kapitalfluss folgend.

He Yidengs Rang: Wenn du schon einmal hier bist, kannst du es auch versuchen

Sechs große Kritikpunkte eines Ethereum-Entwicklers

Ethereum hat nicht den Markt verpasst, sondern sich selbst.

Inhalte

Beliebte Coins

Neueste Krypto-Nachrichten

00:42

Daten: In den letzten 24 Stunden beliefen sich die Liquidationen netzwerkweit auf 151 Millionen USD, wobei Long-Positionen im Wert von 76,45 Millionen USD und Short-Positionen im Wert von 74,63 Millionen USD liquidiert wurden

Laut Coinglass-Daten beliefen sich die Liquidationen in den letzten 24 Stunden netzwerkweit auf 151 Millionen USD, wobei Long-Positionen mit 76,45 Millionen USD und Short-Positionen mit 74,62 Millionen USD liquidiert wurden. Davon entfielen 12,12 Millionen USD auf Bitcoin-Long-Positionen und Bitcoin-Short-Positio...

BTC

ETH

00:42

Daten: Der aktuelle 8-Stunden-durchschnittliche Finanzierungssatz für BTC im gesamten Netzwerk liegt bei 0,002 %

Laut Coinglass-Daten liegt der aktuelle 8-Stunden-durchschnittliche Finanzierungssatz für BTC im gesamten Netzwerk bei 0,002 %. Unter den gängigen Börsen liegt der Satz für Binance bei 0,0062 %, für OKX bei 0,0014 %, für Bybit bei 0,0039 % und für Gate bei -0,0011 %.

22:42

Daten: Fällt ETH unter 1.921 $, erreicht die kumulierte Long-Liquidationsintensität an großen CEX 781 Millionen $

Laut Coinglass-Daten erreicht die kumulierte Long-Liquidationsintensität an führenden CEX 781 Millionen $, sollte ETH unter 1.921 $ fallen. Sollte ETH hingegen über 2.121 $ steigen, erreicht die kumulierte Short-Liquidationsintensität an führenden CEX 720 Millionen $.

22:42

Daten: Fällt BTC unter 70.126 $, erreicht die kumulierte Long-Liquidationsintensität an großen CEX 1,207 Milliarden $

Laut Coinglass-Daten erreicht die kumulierte Long-Liquidationsintensität an großen CEX 1,207 Milliarden $, falls BTC unter 70.126 $ fällt. Sollte BTC hingegen über 77.270 $ steigen, erreicht die kumulierte Short-Liquidationsintensität an großen CEX 1,192 Milliarden $.

21:42

Grayscale: Hyperliquid könnte sich zu einem Giganten der On-Chain-Finanzinfrastruktur entwickeln und den traditionellen Derivatemarkt herausfordern

Laut CoinDesk weist das Digital-Asset-Management-Unternehmen Grayscale in seinem neuesten Bericht darauf hin, dass sich die dezentrale Handelsplattform Hyperliquid rasant von einer Krypto-Perpetual-Börse zu einer Blockchain-Finanzinfrastruktur entwickelt und möglicherweise traditionelle...

HOOD

HYPE