Sie haben 15 Jahre lang kostenlos Googles KI trainiert, und Sie wussten es nicht einmal
Originaltitel: Sie haben 15 Jahre lang Googles KI trainiert. Sie hatten keine Ahnung.
Ursprünglicher Autor: Sharbel, Mitbegründer von Unfungible
Ursprünglicher Übersetzer: Lila, BlockBeats
Hinweis des Herausgebers: CAPTCHA, die Zahlen oder Bilder, die Sie jedes Mal anklicken müssen, wenn Sie sich auf einer Website anmelden, sind jedem Internetnutzer vertraut. Aber wenn Sie immer wieder auf "Ich bin kein Roboter" klicken, denken Sie vielleicht, dass Sie nur Ihre Identität überprüfen, während Sie tatsächlich an der größten und geheimsten Datenproduktion der Welt teilnehmen. Luis von Ahns reCAPTCHA hat verstreutes menschliches Verhalten zu einem Datenfundament aggregiert, das Google und dessen Tochtergesellschaft, das selbstfahrende Unternehmen Waymo, unterstützt.
Unter der Fassade von "kostenlos" und "sicher" hat das Internet leise eine neue Form von Arbeitsbeziehungen umgestaltet: Sie verbringen Zeit damit, zu beweisen, dass Sie menschlich sind, tragen aber tatsächlich zur KI-Trainierung bei, und sobald die KI lernt, wird diese Arbeit vollständig ersetzt. Dieser Artikel hat in weniger als 20 Stunden über 9,5 Millionen Aufrufe auf Twitter erhalten. Der folgende Inhalt ist original:
Ungefähr 500.000 Stunden menschlicher Arbeit werden täglich kostenlos von Google ausgebeutet. Und die Menschen, die dazu beitragen, wollen einfach nur auf ihr Online-Banking zugreifen.
reCAPTCHA ist die erfolgreichste unsichtbare Datenoperation in der Internetgeschichte. Zu seinem Höhepunkt haben täglich 200 Millionen Menschen den Verifizierungsprozess abgeschlossen. Aber fast niemand erkannte, was jeder Klick hinter den Kulissen bedeutete.
Die selbstfahrende Autocompany von Google, Waymo, wird jetzt mit 45 Milliarden Dollar bewertet. Und die meisten ihrer grundlegenden Trainingsdaten werden von Ihnen kostenlos bereitgestellt, während Sie auf verschiedene Websites zugreifen.
Hier ist die ganze Geschichte:
Ursprung: Eine clevere Idee
Im Jahr 2000 richteten Spam-Bots im Internet Chaos an. Foren waren überflutet, Postfächer liefen über, und Websites benötigten eine Möglichkeit, zwischen Menschen und Maschinen zu unterscheiden.
Der Professor der Carnegie Mellon University, Luis von Ahn, löste dieses Problem. Er erfand CAPTCHA: verzerrten Text, den nur Menschen lesen konnten, nicht Bots.
Aber von Ahn sah mehr als das. Millionen von Menschen hatten ihre Energie diesen Herausforderungen gewidmet. Was wäre, wenn diese Energie zwei Dinge gleichzeitig tun könnte?
Im Jahr 2007 führte er reCAPTCHA ein. Seine Brillanz: nicht mehr zufällig verzerrten Text anzuzeigen, sondern zwei Wörter. Ein Wort war dem System bekannt, das andere ein echtes gescanntes Buchwort, das Computer noch nicht erkennen konnten. Und Ihre Antwort half bei der Digitalisierung dieser Bücher.
Diese Bücher stammten aus den Archiven der New York Times und Google Books und umfassten insgesamt bis zu 130 Millionen.
Sie dachten, Sie würden sich nur in eine normale Website einloggen, aber Sie führten tatsächlich OCR (Optische Zeichenerkennung) für die größte digitale Bibliothek der Welt durch.
Im Jahr 2009 erwarb Google offiziell reCAPTCHA.

Später änderte Google das Spiel
Die Ära des "verzerrten Textes" endete etwa 2012.
Google sah sich einer neuen Herausforderung gegenüber: Die Street View-Autos hatten jede Straße weltweit fotografiert, aber die Bilder waren nur rohe Daten. Damit KI ihre Magie entfalten kann, muss sie verstehen, was sie sieht: Verkehrsschilder, Zebrastreifen, Ampeln, Schaufenster.
Also hat Google reCAPTCHA v2 neu gestaltet. Anstelle von verzerrtem Text gab es Fotogitter. "Klicken Sie auf alle Kästchen mit Ampeln." "Wählen Sie jeden Zebrastreifen aus." "Identifizieren Sie Schaufenster."
Diese Bilder stammen direkt von Google Street View. Ihre Klicks dienten als Tags.
Jede Auswahl informierte das Computer Vision-Modell von Google: diese Pixel bilden eine Ampel, diese Form ist ein Zebrastreifen. Sie haben keinen Test gemacht; Sie haben einen Datensatz erstellt.

Eine unvorstellbare Skala
Auf dem Höhepunkt wurden täglich 200 Millionen reCAPTCHAs gelöst. Jede Herausforderung dauerte 10 Sekunden, was 2 Milliarden Sekunden menschlicher Arbeit pro Tag bedeutet. Das sind 500.000 Stunden jeden Tag.
Die Kosten für bezahlte Datenkennzeichnung liegen bei etwa 10 bis 50 Dollar pro Stunde. Berechnet zum niedrigsten Satz: Der tägliche Wert der kostenlos extrahierten Arbeit erreichte bis zu 5 Millionen Dollar.
Darüber hinaus existiert reCAPTCHA nicht nur in einer bestimmten App. Es ist in jeder Bank, jedem Regierungsportal und jeder E-Commerce-Website präsent. Du hast keine Wahl: Möchtest du dich in dein Konto einloggen? Zuerst hilf dabei, den Datensatz zu annotieren. Google hat nie nach deiner Meinung gefragt, dir einen Cent Gehalt gezahlt oder dir sogar davon erzählt.

Wozu hat das alles geführt?
Diese Daten fließen direkt in zwei Produkte ein:
-Google Maps: Das weltweit am häufigsten verwendete Navigationswerkzeug. Seine Fähigkeit, Verkehrsschilder, Geschäfte und Stadtgeografie zu erkennen, wird teilweise den Milliarden von menschlichen Annotationen zugeschrieben, die beim Einloggen in Websites gemacht wurden.
-Waymo: Das selbstfahrende Projekt von Google. Für eine sichere Navigation müssen autonome Fahrzeuge fast perfekt Tausende von visuellen Mustern identifizieren.
Die Grundwahrheits-Trainingsdaten für diese Identifikationsarbeit sind genau das, was Millionen von Menschen unwissentlich durch reCAPTCHA annotiert haben. Waymo hat 2024 über 4 Millionen bezahlte Fahrten abgeschlossen, die mit 45 Milliarden Dollar bewertet werden. Sein Grundpfeiler wurde von den "unbezahlten Internetnutzern" gelegt, die einfach nur ihre E-Mails abrufen wollten.
Warum kann niemand dieses Modell replizieren?
Datenannotation ist extrem kostspielig. Unternehmen wie Scale AI, Appen und Labelbox existieren, um dieses Problem zu lösen; sie stellen Hunderttausende von Arbeitern ein und zahlen manchmal weniger als 1 Dollar pro Stunde.
Google hat einen anderen Ansatz für das Problem gewählt: Sie haben die Annotation zur Voraussetzung gemacht. Keine Zahlung erforderlich, keine Zustimmung nötig, sondern als "Ticket" um in jede Ecke des Internets einzutreten. Das Ergebnis: Milliarden von gekennzeichneten Bildern, globale Abdeckung, bei jedem Wetter, in jeder Stadt der Welt. Keine Annotationfirma kann dies erreichen. Das Internet selbst ist eine Fabrik, und jeder Netizen ist ein undocumented Mitarbeiter.

Du nimmst immer noch teil
reCAPTCHA v3, gestartet im Jahr 2018, zeigt nicht einmal mehr Herausforderungen an. Es beobachtet, wie du die Maus bewegst, die Scrollgeschwindigkeit, die Verweildauer. Dein Verhaltensfingerabdruck informiert darüber, ob du menschlich bist. Diese Verhaltensdaten fließen auch in Googles KI-Systeme zurück.
Du hast nie aktiv gewählt, beizutreten, hattest nie ein Kästchen zum Ankreuzen. Doch gerade jetzt machst du das auf den meisten Websites, die du besuchst, immer noch.
Störende Ironie
Die ursprüngliche Absicht von Luis von Ahn war brillant: die Energie, die Menschen bereits verschwenden, in nützliche Ergebnisse umzuwandeln. Was Google jedoch mit dieser Vision gemacht hat, ist eine ganz andere Geschichte. Sie haben einen Sicherheitsmechanismus, den die Nutzer verwenden mussten, im gesamten Web eingesetzt und die Ergebnisse geerntet, um ein Geschäftsprodukt im Wert von Hunderten von Milliarden Dollar aufzubauen. Die Nutzer erhielten nichts im Gegenzug, nicht einmal ein Bewusstsein.
Die tiefste Ironie ist: du hast Jahre damit verbracht, zu beweisen, dass du menschlich bist, indem du visuelle Erkennungsaufgaben abgeschlossen hast, die KI damals nicht erledigen konnte. Aber sobald KI lernte, diese Aufgaben zu erledigen, waren menschliche visuelle Annotationen nicht mehr nötig.
Sie haben bewiesen, dass Sie menschlich sind, nur um sich letztendlich ersetzbar zu machen.
Das könnte Ihnen auch gefallen

Wie balanciert man Risiko und Rendite bei DeFi-Erträgen?

Tom Lees Ethereum-These: Warum der Mann, der den letzten Zyklus vorhergesagt hat, jetzt verstärkt auf Bitmine setzt
Tom Lee entwickelt sich zu einem der einflussreichsten Unterstützer von Ethereum. Von Fundstrat bis Bitmine – seine Ethereum-These vereint Staking-Rendite, Treasury-Akkumulation und langfristigen Netzwerkwert. Hier erfahren Sie, warum „Tom Lee Ethereum“ zu einer der meistbeachteten Geschichten im Kryptobereich geworden ist.

Naval betritt persönlich die Bühne: Die historische Kollision zwischen Normalbürgern und Risikokapital

a16z Crypto: 9 Diagramme zum Verständnis der Entwicklungstrends von Stablecoins

Widerlegung von Yang Haipos These „Das Ende der Kryptowährung“

Kann ein Haartrockner 34.000 $ verdienen? Interpretation des Reflexivitätsparadoxons von Vorhersagemärkten

6MV-Gründer: Im Jahr 2026 ist der "entscheidende Wendepunkt" für Krypto-Investitionen erreicht.

Abraxas Capital prägt 2,89 Milliarden USDT: Liquiditätsschub oder nur mehr Stablecoin-Arbitrage?
Abraxas Capital hat soeben 2,89 Milliarden Dollar in neu geschaffenen USDT von Tether erhalten. Handelt es sich hierbei um eine positive Liquiditätsspritze für die Kryptomärkte oder ist es für einen Stablecoin-Arbitrage-Giganten einfach nur das übliche Geschäft? Wir analysieren die Daten und die wahrscheinlichen Auswirkungen auf Bitcoin, Altcoins und DeFi.

Ein Risikokapitalgeber aus der Kryptowelt sagte, KI sei zu verrückt, und sie seien sehr konservativ.

Die evolutionäre Geschichte von Vertragsalgorithmen: Ein Jahrzehnt von Perpetual Contracts, der Vorhang ist noch nicht gefallen

Bitcoin ETF Nachrichten heute: $2,1 Milliarden Zuflüsse signalisieren starke institutionelle Nachfrage nach BTC
Bitcoin ETF Nachrichten verzeichneten $2,1 Milliarden Zuflüsse über 8 aufeinanderfolgende Tage, was eine der stärksten jüngsten Akkumulationsphasen markiert. Hier ist, was die neuesten Bitcoin ETF Nachrichten für den BTC Preis bedeuten und ob die $80K Ausbruchsstufe als nächstes kommt.

Nachdem er von PayPal rausgeworfen wurde, will Musk ein Comeback auf dem Kryptowährungsmarkt schaffen

Michael Saylor: Der Winter ist vorbei – hat er recht? 5 Eckdatenpunkte (2026)
Michael Saylor twitterte gestern „Winter’s Over“. Es ist kurz. Es ist kühn. Und es bringt die Kryptowelt zum Reden.
Aber hat er recht? Oder ist das nur ein anderer CEO, der seine Taschen pumpt?
Schauen wir uns die Daten an. Seien wir neutral. Mal sehen, ob das Eis wirklich geschmolzen ist.

WEEX Bubbles App jetzt live visualisiert den Kryptomarkt auf einen Blick
WEEX Bubbles ist eine eigenständige App, die entwickelt wurde, um Benutzern zu helfen, komplexe Bewegungen des Kryptomarktes schnell durch eine intuitive Blasenvisualisierung zu verstehen.

Polygon-Mitbegründer Sandeep: Nach dem Kettenbrückenunglück

Wichtige Aktualisierung auf der Website: Über 10 fortgeschrittene Chart-Stile für tiefere Marktanalysen
Um leistungsstärkere und professionellere Analysetools bereitzustellen, hat WEEX ein großes Upgrade für seine Web-Handelscharts eingeführt – jetzt mit Unterstützung für bis zu 14 fortgeschrittene Chart-Stile.

Morgenbericht | Aethir sichert sich einen 260-Millionen-Dollar-Unternehmensvertrag mit Axe Compute; New Fire Technology übernimmt das Handelsteam der Avenir Group; Kalshi übertrifft Polymarkets Handelsvolumen.

Powell: Wir Haben Eine Vorübergehende Phase zur Arbeit an der Inflation
Jerome Powell, der nominierte Vorsitzende der US-Notenbank, äußert sich kritisch gegenüber “Forward Guidance”. Er hebt die Notwendigkeit hervor,…
Wie balanciert man Risiko und Rendite bei DeFi-Erträgen?
Tom Lees Ethereum-These: Warum der Mann, der den letzten Zyklus vorhergesagt hat, jetzt verstärkt auf Bitmine setzt
Tom Lee entwickelt sich zu einem der einflussreichsten Unterstützer von Ethereum. Von Fundstrat bis Bitmine – seine Ethereum-These vereint Staking-Rendite, Treasury-Akkumulation und langfristigen Netzwerkwert. Hier erfahren Sie, warum „Tom Lee Ethereum“ zu einer der meistbeachteten Geschichten im Kryptobereich geworden ist.







