Sie haben 15 Jahre lang kostenlos Googles KI trainiert, und Sie wussten es nicht einmal

By: blockbeats|2026/03/18 18:03:08

Originaltitel: Sie haben 15 Jahre lang Googles KI trainiert. Sie hatten keine Ahnung.

Ursprünglicher Autor: Sharbel, Mitbegründer von Unfungible

Ursprünglicher Übersetzer: Lila, BlockBeats

Hinweis des Herausgebers: CAPTCHA, die Zahlen oder Bilder, die Sie jedes Mal anklicken müssen, wenn Sie sich auf einer Website anmelden, sind jedem Internetnutzer vertraut. Aber wenn Sie immer wieder auf "Ich bin kein Roboter" klicken, denken Sie vielleicht, dass Sie nur Ihre Identität überprüfen, während Sie tatsächlich an der größten und geheimsten Datenproduktion der Welt teilnehmen. Luis von Ahns reCAPTCHA hat verstreutes menschliches Verhalten zu einem Datenfundament aggregiert, das Google und dessen Tochtergesellschaft, das selbstfahrende Unternehmen Waymo, unterstützt.

Unter der Fassade von "kostenlos" und "sicher" hat das Internet leise eine neue Form von Arbeitsbeziehungen umgestaltet: Sie verbringen Zeit damit, zu beweisen, dass Sie menschlich sind, tragen aber tatsächlich zur KI-Trainierung bei, und sobald die KI lernt, wird diese Arbeit vollständig ersetzt. Dieser Artikel hat in weniger als 20 Stunden über 9,5 Millionen Aufrufe auf Twitter erhalten. Der folgende Inhalt ist original:

Ungefähr 500.000 Stunden menschlicher Arbeit werden täglich kostenlos von Google ausgebeutet. Und die Menschen, die dazu beitragen, wollen einfach nur auf ihr Online-Banking zugreifen.

reCAPTCHA ist die erfolgreichste unsichtbare Datenoperation in der Internetgeschichte. Zu seinem Höhepunkt haben täglich 200 Millionen Menschen den Verifizierungsprozess abgeschlossen. Aber fast niemand erkannte, was jeder Klick hinter den Kulissen bedeutete.

Die selbstfahrende Autocompany von Google, Waymo, wird jetzt mit 45 Milliarden Dollar bewertet. Und die meisten ihrer grundlegenden Trainingsdaten werden von Ihnen kostenlos bereitgestellt, während Sie auf verschiedene Websites zugreifen.

Hier ist die ganze Geschichte:

Ursprung: Eine clevere Idee

Im Jahr 2000 richteten Spam-Bots im Internet Chaos an. Foren waren überflutet, Postfächer liefen über, und Websites benötigten eine Möglichkeit, zwischen Menschen und Maschinen zu unterscheiden.

Der Professor der Carnegie Mellon University, Luis von Ahn, löste dieses Problem. Er erfand CAPTCHA: verzerrten Text, den nur Menschen lesen konnten, nicht Bots.

Aber von Ahn sah mehr als das. Millionen von Menschen hatten ihre Energie diesen Herausforderungen gewidmet. Was wäre, wenn diese Energie zwei Dinge gleichzeitig tun könnte?

Im Jahr 2007 führte er reCAPTCHA ein. Seine Brillanz: nicht mehr zufällig verzerrten Text anzuzeigen, sondern zwei Wörter. Ein Wort war dem System bekannt, das andere ein echtes gescanntes Buchwort, das Computer noch nicht erkennen konnten. Und Ihre Antwort half bei der Digitalisierung dieser Bücher.

Diese Bücher stammten aus den Archiven der New York Times und Google Books und umfassten insgesamt bis zu 130 Millionen.

Sie dachten, Sie würden sich nur in eine normale Website einloggen, aber Sie führten tatsächlich OCR (Optische Zeichenerkennung) für die größte digitale Bibliothek der Welt durch.

Im Jahr 2009 erwarb Google offiziell reCAPTCHA.

Sie haben 15 Jahre lang kostenlos Googles KI trainiert, und Sie wussten es nicht einmal

Später änderte Google das Spiel

Die Ära des "verzerrten Textes" endete etwa 2012.

Google sah sich einer neuen Herausforderung gegenüber: Die Street View-Autos hatten jede Straße weltweit fotografiert, aber die Bilder waren nur rohe Daten. Damit KI ihre Magie entfalten kann, muss sie verstehen, was sie sieht: Verkehrsschilder, Zebrastreifen, Ampeln, Schaufenster.

Also hat Google reCAPTCHA v2 neu gestaltet. Anstelle von verzerrtem Text gab es Fotogitter. "Klicken Sie auf alle Kästchen mit Ampeln." "Wählen Sie jeden Zebrastreifen aus." "Identifizieren Sie Schaufenster."

Diese Bilder stammen direkt von Google Street View. Ihre Klicks dienten als Tags.

Jede Auswahl informierte das Computer Vision-Modell von Google: diese Pixel bilden eine Ampel, diese Form ist ein Zebrastreifen. Sie haben keinen Test gemacht; Sie haben einen Datensatz erstellt.

Eine unvorstellbare Skala

Auf dem Höhepunkt wurden täglich 200 Millionen reCAPTCHAs gelöst. Jede Herausforderung dauerte 10 Sekunden, was 2 Milliarden Sekunden menschlicher Arbeit pro Tag bedeutet. Das sind 500.000 Stunden jeden Tag.

Die Kosten für bezahlte Datenkennzeichnung liegen bei etwa 10 bis 50 Dollar pro Stunde. Berechnet zum niedrigsten Satz: Der tägliche Wert der kostenlos extrahierten Arbeit erreichte bis zu 5 Millionen Dollar.

Darüber hinaus existiert reCAPTCHA nicht nur in einer bestimmten App. Es ist in jeder Bank, jedem Regierungsportal und jeder E-Commerce-Website präsent. Du hast keine Wahl: Möchtest du dich in dein Konto einloggen? Zuerst hilf dabei, den Datensatz zu annotieren. Google hat nie nach deiner Meinung gefragt, dir einen Cent Gehalt gezahlt oder dir sogar davon erzählt.

Wozu hat das alles geführt?

Diese Daten fließen direkt in zwei Produkte ein:

-Google Maps: Das weltweit am häufigsten verwendete Navigationswerkzeug. Seine Fähigkeit, Verkehrsschilder, Geschäfte und Stadtgeografie zu erkennen, wird teilweise den Milliarden von menschlichen Annotationen zugeschrieben, die beim Einloggen in Websites gemacht wurden.

-Waymo: Das selbstfahrende Projekt von Google. Für eine sichere Navigation müssen autonome Fahrzeuge fast perfekt Tausende von visuellen Mustern identifizieren.

Die Grundwahrheits-Trainingsdaten für diese Identifikationsarbeit sind genau das, was Millionen von Menschen unwissentlich durch reCAPTCHA annotiert haben. Waymo hat 2024 über 4 Millionen bezahlte Fahrten abgeschlossen, die mit 45 Milliarden Dollar bewertet werden. Sein Grundpfeiler wurde von den "unbezahlten Internetnutzern" gelegt, die einfach nur ihre E-Mails abrufen wollten.

Warum kann niemand dieses Modell replizieren?

Datenannotation ist extrem kostspielig. Unternehmen wie Scale AI, Appen und Labelbox existieren, um dieses Problem zu lösen; sie stellen Hunderttausende von Arbeitern ein und zahlen manchmal weniger als 1 Dollar pro Stunde.

Google hat einen anderen Ansatz für das Problem gewählt: Sie haben die Annotation zur Voraussetzung gemacht. Keine Zahlung erforderlich, keine Zustimmung nötig, sondern als "Ticket" um in jede Ecke des Internets einzutreten. Das Ergebnis: Milliarden von gekennzeichneten Bildern, globale Abdeckung, bei jedem Wetter, in jeder Stadt der Welt. Keine Annotationfirma kann dies erreichen. Das Internet selbst ist eine Fabrik, und jeder Netizen ist ein undocumented Mitarbeiter.

Du nimmst immer noch teil

reCAPTCHA v3, gestartet im Jahr 2018, zeigt nicht einmal mehr Herausforderungen an. Es beobachtet, wie du die Maus bewegst, die Scrollgeschwindigkeit, die Verweildauer. Dein Verhaltensfingerabdruck informiert darüber, ob du menschlich bist. Diese Verhaltensdaten fließen auch in Googles KI-Systeme zurück.

Du hast nie aktiv gewählt, beizutreten, hattest nie ein Kästchen zum Ankreuzen. Doch gerade jetzt machst du das auf den meisten Websites, die du besuchst, immer noch.

Störende Ironie

Die ursprüngliche Absicht von Luis von Ahn war brillant: die Energie, die Menschen bereits verschwenden, in nützliche Ergebnisse umzuwandeln. Was Google jedoch mit dieser Vision gemacht hat, ist eine ganz andere Geschichte. Sie haben einen Sicherheitsmechanismus, den die Nutzer verwenden mussten, im gesamten Web eingesetzt und die Ergebnisse geerntet, um ein Geschäftsprodukt im Wert von Hunderten von Milliarden Dollar aufzubauen. Die Nutzer erhielten nichts im Gegenzug, nicht einmal ein Bewusstsein.

Die tiefste Ironie ist: du hast Jahre damit verbracht, zu beweisen, dass du menschlich bist, indem du visuelle Erkennungsaufgaben abgeschlossen hast, die KI damals nicht erledigen konnte. Aber sobald KI lernte, diese Aufgaben zu erledigen, waren menschliche visuelle Annotationen nicht mehr nötig.

Sie haben bewiesen, dass Sie menschlich sind, nur um sich letztendlich ersetzbar zu machen.

Link zum Originalbeitrag

---Preis

Das könnte Ihnen auch gefallen

Wie balanciert man Risiko und Rendite bei DeFi-Erträgen?

Waren diese Erträge jemals angemessen? Haben wir jemals die Entschädigung erhalten, die wir für die in DeFi eingegangenen Risiken verdienen, und wo sollten die zukünftigen Spreads festgelegt werden?

Tom Lees Ethereum-These: Warum der Mann, der den letzten Zyklus vorhergesagt hat, jetzt verstärkt auf Bitmine setzt

Tom Lee entwickelt sich zu einem der einflussreichsten Unterstützer von Ethereum. Von Fundstrat bis Bitmine – seine Ethereum-These vereint Staking-Rendite, Treasury-Akkumulation und langfristigen Netzwerkwert. Hier erfahren Sie, warum „Tom Lee Ethereum“ zu einer der meistbeachteten Geschichten im Kryptobereich geworden ist.

Naval betritt persönlich die Bühne: Die historische Kollision zwischen Normalbürgern und Risikokapital

Naval übernahm persönlich den Vorsitz des USVC-Investitionsausschusses. Dieser von AngelList aufgelegte und bei der SEC registrierte Fonds hat zum Ziel, Top-Private-Tech-Assets wie OpenAI, Anthropic und xAI der breiten Öffentlichkeit mit einer Einstiegsschwelle von 500 US-Dollar zugänglich zu machen. Es handelt sich nicht nur um einen neuen Fonds, sondern um ein strukturelles Experiment...

a16z Crypto: 9 Diagramme zum Verständnis der Entwicklungstrends von Stablecoins

Stablecoins entwickeln sich von Handelsinstrumenten zu einer universellen Zahlungsinfrastruktur, und dieser Prozess verläuft ruhiger und gründlicher, als die meisten Menschen erwartet haben.

Widerlegung von Yang Haipos These „Das Ende der Kryptowährung“

Dies könnte die wahre Bewährungsprobe für Kryptowährungen sein. Es geht nicht darum, ob der Preis ein neues Hoch erreicht hat, noch darum, wer im nächsten Bullenmarkt finanzielle Freiheit erlangen wird, sondern vielmehr darum, ob, nachdem alle großen Erzählungen von den Zyklen hinweggespült wurden, immer noch einige einfachere,...

Kann ein Haartrockner 34.000 $ verdienen? Interpretation des Reflexivitätsparadoxons von Vorhersagemärkten

Vorhersagemärkte sind im Wesentlichen Wetten auf die Realität, und wenn Teilnehmer diesen Weg früher zugänglich machen oder sogar beeinflussen können, spiegelt der Markt nicht mehr nur die Realität wider, sondern beginnt, sie im Gegenzug zu gestalten.

6MV-Gründer: Im Jahr 2026 ist der "entscheidende Wendepunkt" für Krypto-Investitionen erreicht.

„Ich werde die Gelder im Jahr 2026 einsetzen, daher kann ich Ihnen sagen, dass dies das beste Jahr in der Geschichte ist.“

Abraxas Capital prägt 2,89 Milliarden USDT: Liquiditätsschub oder nur mehr Stablecoin-Arbitrage?

Abraxas Capital hat soeben 2,89 Milliarden Dollar in neu geschaffenen USDT von Tether erhalten. Handelt es sich hierbei um eine positive Liquiditätsspritze für die Kryptomärkte oder ist es für einen Stablecoin-Arbitrage-Giganten einfach nur das übliche Geschäft? Wir analysieren die Daten und die wahrscheinlichen Auswirkungen auf Bitcoin, Altcoins und DeFi.

Ein Risikokapitalgeber aus der Kryptowelt sagte, KI sei zu verrückt, und sie seien sehr konservativ.

Inmitten des Krypto-Hypes und mit Investoren, die Pinduoduo einst verpasst hatten, wurde ein neuer KI-Fonds namens Impa Ventures gegründet, der die Spekulationsblasen-Erzählungen ablehnt und sich an eine konservative „Problem-zuerst“-Strategie hält, um echten Geschäftswert zu finden.

Die evolutionäre Geschichte von Vertragsalgorithmen: Ein Jahrzehnt von Perpetual Contracts, der Vorhang ist noch nicht gefallen

Die zehnjährige Entwicklung von Perpetual Contracts: von der Abschaltung von 312 bis zur schockierenden Short-Klemme von TRB, ein tiefer Einblick in die Preisbildungsmaschine, die täglich durchschnittlich 200 Milliarden Dollar ausmacht, geschrieben mit unzähligen Liquidationen und echtem Geld, mit Details über das Blut und die Tränen der Risikokontrolltheorie.

Bitcoin ETF Nachrichten heute: $2,1 Milliarden Zuflüsse signalisieren starke institutionelle Nachfrage nach BTC

Bitcoin ETF Nachrichten verzeichneten $2,1 Milliarden Zuflüsse über 8 aufeinanderfolgende Tage, was eine der stärksten jüngsten Akkumulationsphasen markiert. Hier ist, was die neuesten Bitcoin ETF Nachrichten für den BTC Preis bedeuten und ob die $80K Ausbruchsstufe als nächstes kommt.

Nachdem er von PayPal rausgeworfen wurde, will Musk ein Comeback auf dem Kryptowährungsmarkt schaffen

Cashtags erzielten nur wenige Tage nach ihrem Start ein Handelsvolumen von 1 Milliarde Dollar und markierten einen starken Start für Musks Super-App-Strategie. Für den Kryptowährungsmarkt könnte das Layout von X eine der am meisten erwarteten Quellen für das Einzelhandelswachstum sein, nachdem der Meme-Coin-Fieber nachlässt.

Michael Saylor: Der Winter ist vorbei – hat er recht? 5 Eckdatenpunkte (2026)

Michael Saylor twitterte gestern „Winter’s Over“. Es ist kurz. Es ist kühn. Und es bringt die Kryptowelt zum Reden.

Aber hat er recht? Oder ist das nur ein anderer CEO, der seine Taschen pumpt?

Schauen wir uns die Daten an. Seien wir neutral. Mal sehen, ob das Eis wirklich geschmolzen ist.

WEEX Bubbles App jetzt live visualisiert den Kryptomarkt auf einen Blick

WEEX Bubbles ist eine eigenständige App, die entwickelt wurde, um Benutzern zu helfen, komplexe Bewegungen des Kryptomarktes schnell durch eine intuitive Blasenvisualisierung zu verstehen.

Polygon-Mitbegründer Sandeep: Nach dem Kettenbrückenunglück

Innerhalb von drei Wochen wurden Drift, Hyperbridge und KelpDAO nacheinander gehackt, was zu Verlusten von fast 900 Millionen Dollar führte. Der CEO von Polygon schrieb, dass das Problem nicht bei einem einzelnen Team liege, sondern in der branchenweit verbreiteten Architektur im "Notar"-Stil – bei der ein oder zwei Unterzeichner die Unterschrift leisten…

Wichtige Aktualisierung auf der Website: Über 10 fortgeschrittene Chart-Stile für tiefere Marktanalysen

Um leistungsstärkere und professionellere Analysetools bereitzustellen, hat WEEX ein großes Upgrade für seine Web-Handelscharts eingeführt – jetzt mit Unterstützung für bis zu 14 fortgeschrittene Chart-Stile.