شما به مدت 15 سال به صورت رایگان هوش مصنوعی گوگل را آموزش دادهاید و حتی نمیدانستید
عنوان اصلی: شما به مدت 15 سال هوش مصنوعی گوگل را آموزش دادهاید. شما هیچ ایدهای نداشتید.
نویسنده اصلی: شاربل، همبنیانگذار Unfungible
مترجم اصلی: لیلا، BlockBeats
یادداشت ویرایشگر: CAPTCHA، شمارهها یا تصاویری که هر بار هنگام ورود به یک وبسایت باید روی آنها کلیک کنید، برای هر کاربر اینترنت آشناست. اما وقتی بارها روی "من ربات نیستم" کلیک میکنید، ممکن است فکر کنید فقط هویت خود را تأیید میکنید، در حالی که در واقع در بزرگترین و مخفیترین تولید دادههای جهان شرکت میکنید. reCAPTCHA لوئیس فون آن، رفتار انسانی پراکنده را به یک سنگبنای دادهای تبدیل کرده است که از گوگل و شرکت زیرمجموعهاش، شرکت خودران Waymo، حمایت میکند.
زیر ظاهر "رایگان" و "ایمن"، اینترنت به آرامی یک نوع جدید از رابطه کار را شکل داده است: شما زمان صرف میکنید تا ثابت کنید انسان هستید، اما در واقع در حال کمک به آموزش هوش مصنوعی هستید و هنگامی که هوش مصنوعی یاد میگیرد، این کار به طور کامل جایگزین میشود. این مقاله در کمتر از 20 ساعت بیش از 9.5 میلیون بازدید در توییتر داشته است. محتوای اصلی به شرح زیر است:
تقریباً 500,000 ساعت کار انسانی به صورت رایگان هر روز توسط گوگل استثمار میشود. و افرادی که به این موضوع کمک میکنند فقط میخواهند به بانکداری آنلاین وارد شوند.
reCAPTCHA موفقترین عملیات داده نامرئی در تاریخ اینترنت است. در اوج خود، 200 میلیون نفر هر روز فرآیند تأیید را تکمیل کردند. اما تقریباً هیچکس متوجه نشد که هر کلیک در پشت صحنه چه معنایی دارد.
شرکت خودران گوگل، ویمو، اکنون به ارزش ۴۵ میلیارد دلار رسیده است. و بیشتر دادههای آموزشی اصلی آن بهطور رایگان توسط شما در دسترس است وقتی که به وبسایتهای مختلف دسترسی پیدا میکنید.
در اینجا داستان کامل است:
منشأ: یک ایده هوشمندانه
در سال ۲۰۰۰، رباتهای هرزنامه در اینترنت آشوب به پا کرده بودند. انجمنها پر شده بودند، صندوقهای ورودی پر از پیام بودند و وبسایتها به روشی برای تمایز بین انسانها و ماشینها نیاز داشتند.
استاد دانشگاه کارنگی ملون، لوئیس فون آهان، این مشکل را حل کرد. او CAPTCHA را اختراع کرد: متنی تحریفشده که فقط انسانها میتوانستند بخوانند، نه رباتها.
اما فون آهان بیشتر از این را دید. میلیونها نفر انرژی خود را صرف این چالشها کرده بودند. اگر آن انرژی بتواند دو کار را همزمان انجام دهد چه؟
در سال ۲۰۰۷، او reCAPTCHA را معرفی کرد. درخشش آن: دیگر متنی تصادفی و نامفهوم نشان نمیداد، بلکه دو کلمه نشان میداد. یک کلمه برای سیستم شناخته شده بود، و دیگری کلمهای واقعی از یک کتاب اسکنشده که کامپیوترها هنوز نمیتوانستند آن را شناسایی کنند. و پاسخ شما در دیجیتالیسازی این کتابها کمک کرد.
این کتابها از آرشیو نیویورک تایمز و گوگل بوکس آمدهاند و مجموعاً به ۱۳۰ میلیون میرسند.
شما فکر میکردید که فقط به یک وبسایت عادی وارد میشوید، اما در واقع در حال انجام OCR (شناسایی نوری کاراکترها) برای بزرگترین کتابخانه دیجیتال جهان بودید.
در سال ۲۰۰۹، گوگل بهطور رسمی reCAPTCHA را خرید.

بعداً، گوگل بازی را تغییر داد
عصر "متن پیچیده" حدود سال ۲۰۱۲ به پایان رسید.
گوگل با چالش جدیدی مواجه شد: ماشینهای خیاباننگاری هر جادهای را در سطح جهانی عکاسی کرده بودند، اما تصاویر فقط دادههای خام. بودند. برای اینکه هوش مصنوعی جادو کند، نیاز داشت آنچه را که میبیند درک کند: علائم جاده، گذرگاهها، چراغهای راهنمایی، فروشگاهها.
بنابراین گوگل reCAPTCHA v2 را طراحی مجدد کرد. به جای متنهای تحریف شده، شبکههای عکسی وجود داشت. "روی تمام مربعها با چراغهای راهنمایی کلیک کنید." "هر گذرگاه را انتخاب کنید." "فروشگاهها را شناسایی کنید."
این تصاویر به طور مستقیم از گوگل استریت ویو آمده بودند. کلیکهای شما به عنوان برچسب عمل میکردند.
هر انتخاب به مدل بینایی کامپیوتری گوگل اطلاع میداد: این پیکسلها یک چراغ راهنمایی را تشکیل میدهند، آن شکل یک گذرگاه است. شما در حال انجام یک آزمون نبودید؛ شما در حال ساخت یک مجموعه داده بودید.

مقیاس غیرقابل تصور
در اوج خود، ۲۰۰ میلیون reCAPTCHA روزانه حل میشد. هر چالش ۱۰ ثانیه طول میکشید، به این معنی که ۲ میلیارد ثانیه کار انسانی در روز. این معادل ۵۰۰,۰۰۰ ساعت در هر روز است.
هزینه برچسبگذاری دادههای پرداختی حدود ۱۰ تا ۵۰ دلار در ساعت است. با محاسبه در پایینترین نرخ: ارزش روزانه کار آزاد استخراج شده به ۵ میلیون دلار رسید.
علاوه بر این، reCAPTCHA فقط در یک برنامه خاص وجود ندارد. این موضوع در هر بانکی، هر پرتال دولتی و هر وبسایت تجارت الکترونیک وجود دارد. شما هیچ انتخابی ندارید: آیا میخواهید به حساب کاربری خود وارد شوید؟ اول، به ما در حاشیهنویسی مجموعه داده کمک کنید. گوگل هرگز از شما نظر نخواسته، یک سنت به شما حقوق نداده و حتی درباره این موضوع به شما نگفته است.

این همه به چه چیزی منجر شده است؟
این دادهها به طور مستقیم به دو محصول تغذیه میشود:
-نقشههای گوگل: پرکاربردترین ابزار ناوبری در سطح جهانی. توانایی آن در شناسایی علائم جاده، فروشگاهها و جغرافیای شهری به بخشی از میلیاردها حاشیهنویسی انسانی که در حین ورود به وبسایتها انجام شده است، نسبت داده میشود.
-وایمو: پروژه خودران گوگل. برای ناوبری ایمن، وسایل نقلیه خودران نیاز دارند که تقریباً به طور کامل هزاران الگوی بصری را شناسایی کنند.
دادههای آموزشی حقیقت زمینی برای آن شناسایی دقیقاً همان چیزی است که میلیونها نفر به طور ناخواسته از طریق reCAPTCHA حاشیهنویسی کردهاند. وایمو بیش از ۴ میلیون سفر پرداختی در سال ۲۰۲۴ انجام داد که ارزش آن ۴۵ میلیارد دلار بود. سنگ بنای آن، توسط آن "کاربران اینترنتی بدون حقوق" که فقط میخواستند ایمیل خود را چک کنند، گذاشته شد.
چرا هیچکس نمیتواند این مدل را تکرار کند؟
حاشیهنویسی دادهها بسیار پرهزینه است. شرکتهایی مانند Scale AI، Appen و Labelbox برای حل این مشکل وجود دارند؛ آنها صدها هزار کارگر استخدام میکنند و گاهی کمتر از ۱ دلار در ساعت پرداخت میکنند.
گوگل رویکرد متفاوتی به این مشکل اتخاذ کرد: آنها حاشیهنویسی را به یک الزام تبدیل کردند. هیچ پرداختی لازم نیست، هیچ رضایتی مورد نیاز نیست، اما به عنوان "بلیط" برای ورود به هر گوشهای از اینترنت. نتیجه: میلیاردها تصویر برچسبگذاری شده، پوشش جهانی، در هر آب و هوا، هر شهری در جهان. هیچ شرکتی در زمینه حاشیهنویسی نمیتواند به این دست یابد. اینترنت خود یک کارخانه است و هر کاربر اینترنتی یک کارمند بدون مدرک است.

شما هنوز در حال مشارکت هستید
reCAPTCHA v3، که در سال 2018 راهاندازی شد، دیگر حتی چالشها را نمایش نمیدهد. این نحوه حرکت ماوس، سرعت اسکرول و زمان توقف شما را مشاهده میکند. اثر انگشت رفتاری شما به آن اطلاع میدهد که آیا شما انسان هستید. این دادههای رفتاری همچنین به سیستمهای هوش مصنوعی گوگل بازخورد میدهد.
شما هرگز به طور فعال انتخاب نکردید که بپیوندید، هرگز یک کادر برای علامتگذاری نداشتید. با این حال، در حال حاضر، در اکثر وبسایتهایی که بازدید میکنید، هنوز این کار را انجام میدهید.
آیرونی نگرانکننده
هدف اصلی لوئیس ون آن درخشان بود: تبدیل انرژی که انسانها در حال حاضر هدر میدهند به خروجی مفید. با این حال، آنچه گوگل با این دیدگاه انجام داد داستان کاملاً متفاوتی است. آنها یک مکانیزم امنیتی که کاربران باید از آن استفاده میکردند را گرفتند، آن را در سراسر وب پیادهسازی کردند و خروجی را برای ساخت یک محصول تجاری به ارزش صدها میلیارد دلار برداشت کردند. کاربران در عوض هیچ چیزی دریافت نکردند، حتی آگاهی.
عمیقترین آیرونی این است: شما سالها برای اثبات اینکه انسان هستید با انجام وظایف شناسایی بصری که هوش مصنوعی در آن زمان نمیتوانست انجام دهد، وقت صرف کردید. اما به محض اینکه هوش مصنوعی یاد گرفت که این وظایف را انجام دهد، حاشیهنویسیهای بصری انسانی دیگر لازم نبود.
شما ثابت کردید که انسان هستید، فقط برای اینکه خودتان را قابل جایگزینی کنید.
ممکن است شما نیز علاقهمند باشید

بتا، مطابق با جریان نقدی

سهام توکنیزه شده چگونه کار میکند؟ گفتگو با رئیس بخش داراییهای دیجیتال در بلکراک

آیا بازگشت به حالت اولیه یک توهم است؟ بازار اوراق قرضه قبلاً پاسخ را ارائه داده است

پایان حق بیمه کریپتو؟ مشاهده تغییر منطق بازار از معضل پس از فهرست شدن Gemini

دور سوم بازخرید و انهدام توسط JST طبق برنامه انجام شده است و مقیاس بازخرید و انهدام از 21 میلیون دلار فراتر رفته است.

نحوه پیگیری جریانهای ETF بیت کوین در سال 2026: بهترین ردیابهای رایگان مورد استفاده تحلیلگران
از سال ۲۰۲۴، ETF های بیت کوین به یکی از کانالهای اصلی ورود سرمایههای نهادی به بازار کریپتو تبدیل شدهاند. برخلاف دادههای سنتی حجم مبادلات ارزهای دیجیتال، دادههای جریان ETF منعکسکننده تصمیمات تخصیص سبد سهام از سوی سرمایهگذاران بزرگ است که اغلب بر جهت قیمت بلندمدت تأثیر میگذارند تا گمانهزنیهای کوتاهمدت.

آیا ETF بیت کوین قیمت بیت کوین را در سال 2026 افزایش خواهد داد؟
آیا ETF بیت کوین قیمت بیت کوین را در سال 2026 افزایش خواهد داد؟ ببینید ورود ETFها چه سیگنالی در مورد تقاضای نهادی، شتاب بازار و چشمانداز بلندمدت بیتکوین میدهد.

ETF بیت کوین در مقابل ETF اتریوم: چه تفاوتی در سال ۲۰۲۶ وجود دارد؟
ETF بیت کوین در مقابل ETF اتریوم: تفاوت چیست و کدام را باید در سال ۲۰۲۶ انتخاب کنید؟ قبل از سرمایهگذاری، ریسک، روندهای پذیرش و نقشهای پرتفوی را مقایسه کنید.

بیت کوین ETF چیست؟ آیا بیت کوین ETF یک ورودی سرمایهگذاری خوب برای مبتدیان کریپتو در سال 2026 است؟
بیت کوین ETF چیست و چرا در سال 2026 اهمیت دارد؟ یاد بگیرید که بیت کوین ETF چگونه کار میکند، چرا مؤسسات از آنها استفاده میکنند و چگونه دسترسی به بازار کریپتو را در سطح جهانی تغییر دادهاند.

آیا جهش یک توهم است؟ بازار اوراق قرضه پاسخ داده است

روی دیگر صعود بازار سهام: بازآرایی انرژی، تنگنای موقعیتهای فروش کوتاهمدت بیتکوین و جابجایی بازار

درخواست کلود برای تأیید هویت، واکنش اپراتور رله را در پی دارد

پین پت × ویلا: اولین موتور مبادله اتمی و پروتکل پوشش دهی بازده سولانا، بازتعریف پارادایم مالی دیفای

از کوینبیس تا اوپنایآی: وقتی متخصصان لابیگری شروع به فرار از ارزهای دیجیتال میکنند

درک مسائل کلیدی توکنسازی در یک مقاله

استیو بلنک، استاد کارآفرینی سیلیکون ولی: در عصر هوش مصنوعی، استارتاپهای بالای دو سال باید دوباره راهاندازی شوند

چقدر خطرناک است میتوس؟ چرا آنتروپیک تصمیم گرفته است مدل جدید را منتشر نکند

این ۲۵ واژه قدرتمند کلود به شما کمک میکنند تا هر هفته ۱۵ ساعت اضافی به دست آورید.
بتا، مطابق با جریان نقدی
سهام توکنیزه شده چگونه کار میکند؟ گفتگو با رئیس بخش داراییهای دیجیتال در بلکراک
آیا بازگشت به حالت اولیه یک توهم است؟ بازار اوراق قرضه قبلاً پاسخ را ارائه داده است
پایان حق بیمه کریپتو؟ مشاهده تغییر منطق بازار از معضل پس از فهرست شدن Gemini
دور سوم بازخرید و انهدام توسط JST طبق برنامه انجام شده است و مقیاس بازخرید و انهدام از 21 میلیون دلار فراتر رفته است.
نحوه پیگیری جریانهای ETF بیت کوین در سال 2026: بهترین ردیابهای رایگان مورد استفاده تحلیلگران
از سال ۲۰۲۴، ETF های بیت کوین به یکی از کانالهای اصلی ورود سرمایههای نهادی به بازار کریپتو تبدیل شدهاند. برخلاف دادههای سنتی حجم مبادلات ارزهای دیجیتال، دادههای جریان ETF منعکسکننده تصمیمات تخصیص سبد سهام از سوی سرمایهگذاران بزرگ است که اغلب بر جهت قیمت بلندمدت تأثیر میگذارند تا گمانهزنیهای کوتاهمدت.






