logo

سرعت کشف آسیب‌پذیری‌ها توسط هوش مصنوعی از سرعت وصله کردن آن‌ها پیشی گرفته است.

By: blockbeats|2026/03/30 18:01:18
0
اشتراک‌گذاری
copy

در ۲۷ مارس، یک مخزن داده ناامن در شرکت آنتروپیک حدود ۳۰۰۰ فایل داخلی را در معرض دید عموم قرار داد. یکی از پیش‌نویس‌های پست وبلاگ، مدل جدید آینده، میتوس، را فاش کرد که آنتروپیک آن را «از نظر توانایی امنیت سایبری بسیار فراتر از هر مدل هوش مصنوعی» ارزیابی کرده است. در همان روز، سهام CrowdStrike و Okta هر کدام ۷ درصد کاهش یافت، در حالی که سهام Palo Alto Networks 6 درصد سقوط کرد.

وحشت بازار به این دلیل نیست که یک مدل قدرتمندتر ظهور کرده است. به این دلیل است که خالق این مدل اظهار داشت که پیشرفت آن در سمت حمله از سرعتی که سمت دفاع می‌تواند با آن همگام شود، پیشی گرفته است.

تسلط بر امنیت سایبری هوش مصنوعی

طبق نتایج آزمون معیار دانشگاهی CAIBench، در آزمون Cybench که یک محیط واقعی حمله-دفاع را شبیه‌سازی می‌کند، کلود سونت به میزان موفقیت ۴۶٪ دست یافته است. GPT-5 که در رتبه دوم قرار داشت، با 28 درصد، Gemini 2.5 Pro گوگل تنها به 18 درصد و مدل متن‌باز qwen3-32B حتی به 10 درصد کاهش یافت.

سرعت کشف آسیب‌پذیری‌ها توسط هوش مصنوعی از سرعت وصله کردن آن‌ها پیشی گرفته است.

اگرچه ممکن است ۴۶٪ زیاد به نظر نرسد، اما این میزان موفقیت در وظایف نفوذ پیچیده، از جمله مراحلی مانند کشف آسیب‌پذیری، ایجاد زنجیره‌های بهره‌برداری و افزایش امتیاز است. در یک آزمایش پایه‌ی ابتدایی‌تر، میزان موفقیت کلود به ۷۵ درصد رسیده و به سقف خود نزدیک شده است.

تفاوت در این نیست که چه کسی کمی بهتر است، بلکه در بزرگی است. قابلیت پیچیده حمله-دفاع کلود ۱.۶ برابر GPT-5 و ۲.۵ برابر Gemini است. در این بُعد از امنیت سایبری، توزیع توانایی‌ها بین مدل‌ها نردبانی نیست، بلکه یک شکاف است.

دو برابر شدن در ۶ ماه

آنچه بیشتر ارزش بررسی دارد، نه شکاف افقی، بلکه سرعت عمودی است.

طبق داده‌های رسمی آنتروپیک، Sonnet 3.7 که در فوریه ۲۰۲۵ منتشر شد، در Cybench به میزان موفقیت ۳۵.۹٪ (۱۰ تلاش) دست یافت. در نیمه دوم همان سال، Sonnet 4.5 به 76.5٪ رسید. نتیجه‌گیری تیم تحقیقاتی آنتروپیک این است: ظرف ۶ ماه، میزان موفقیت دو برابر شد.

این سرعت یعنی چی؟ در یک مقایسه سناریوی دنیای واقعی: در ماه مارس امسال، از Claude Opus 4.6 برای بررسی کدبیس فایرفاکس استفاده شد. طبق گزارش InfoQ، طی دو هفته ۲۲ آسیب‌پذیری امنیتی کشف شد که ۱۴ مورد از آنها پرخطر بودند. این آسیب‌پذیری‌ها علیرغم سال‌ها ممیزی دستی و میلیون‌ها ساعت آزمایش فاز CPU، کشف نشده بودند. تیم امنیتی آنتروپیک پیش از این فاش کرده بود که کلود بیش از ۵۰۰ آسیب‌پذیری پرخطر را در چندین پروژه متن‌باز در سطح تولید کشف کرده است که برخی از آنها برای دهه‌ها وجود داشته‌اند.

و جدول زمانی استاندارد صنعتی برای تست نفوذ سنتی ۲ تا ۳ هفته است، و این فقط برای یک درخواست است. طبق گزارش بررسی‌های نقض داده ورایزن در سال ۲۰۲۵، میانگین زمان از افشای عمومی یک آسیب‌پذیری حیاتی تا بهره‌برداری گسترده توسط مهاجمان ۵ روز است و میانگین زمان لازم برای ارائه وصله امنیتی ۳۲ تا ۳۸ روز می‌باشد.

سرعت کشف آسیب‌پذیری‌ها توسط هوش مصنوعی به صورت تصاعدی در حال افزایش است، در حالی که سرعت وصله کردن آن‌ها توسط انسان خطی است. تفاوت در زمان، پنجره حمله است.

در پیش‌نویس فاش‌شده‌ی Mythos، شرکت Anthropic نوشت که این مدل «موج جدیدی از مدل‌هایی را نوید می‌دهد که می‌توانند از آسیب‌پذیری‌ها به روشی بسیار فراتر از تلاش‌های مدافع سوءاستفاده کنند.» بر اساس منحنی قابلیت که برای عموم شناخته شده است، این اغراق نیست.

هرچه انتشار سریع‌تر باشد، هشدار فوری‌تر است

اگر اقدامات شرکت آنتروپیک را در طول سه سال گذشته روی یک جدول زمانی قرار دهید، یک الگوی واضح خواهید دید: هر بار که یک مدل قوی‌تر منتشر می‌شود، به سرعت با یک واکنش امنیتی سطح بالاتر دنبال می‌شود.

در ژوئیه ۲۰۲۳، کاخ سفید یک تعهد داوطلبانه امضا کرد و پس از آن اولین سیاست مقیاس‌پذیری مسئولانه (RSP نسخه ۱.۰) در سپتامبر همان سال منتشر شد. در اکتبر ۲۰۲۴، RSP به نسخه ۲.۰ ارتقا یافت و آستانه‌ای برای قابلیت‌های سلاح‌های بیوشیمیایی اضافه شد. در نوامبر ۲۰۲۵، شرکت آنتروپیک حادثه GTG-1002 را افشا کرد. یک گروه تهدید تحت حمایت چین با استفاده از کد کلود، حدود ۳۰ سازمان را مورد سوءاستفاده قرار داد و هوش مصنوعی به طور مستقل ۸۰ تا ۹۰ درصد از عملیات تاکتیکی را در طول این عملیات اجرا کرد. این اولین کمپین جاسوسی بین سازمانیِ مستندِ هماهنگ‌شده با هوش مصنوعی در مقیاس بزرگ بود.

در فوریه ۲۰۲۶، RSP به نسخه ۳.۰ به‌روزرسانی شد و همزمان Claude Code Security نیز منتشر شد. در همان ماه، پنتاگون شرکت آنتروپیک را به عنوان یک «خطر زنجیره تأمین» معرفی کرد، زیرا آنتروپیک از لغو بندهایی در قرارداد که نظارت گسترده و سلاح‌های کاملاً خودمختار را ممنوع می‌کرد، خودداری کرد. یک ماه بعد، افشاگری Mythos نشان داد که شرکت Anthropic در پیش‌نویس اذعان کرده است که این مدل «خطرات امنیتی شبکه بی‌سابقه‌ای» ایجاد می‌کند.

سرعت آزادسازی قابلیت‌ها رو به افزایش است. از کلود ۱ تا کلود ۳ یک سال و از اپوس ۴.۵ تا اپوس ۴.۶ کمتر از سه ماه فاصله است. واکنش‌های امنیتی نیز در حال شتاب گرفتن هستند، اما همیشه واکنشی هستند: ابتدا از قابلیت‌ها سوءاستفاده می‌شود و وصله‌های سیاستی بعداً ارائه می‌شوند. افت جمعی سهام امنیت سایبری در ۲۷ مارس، قیمت‌گذاری این دلتای زمانی است.

یک نظرسنجی Dark Reading در اوایل سال جاری نشان داد که ۴۸ درصد از متخصصان امنیت سایبری، عوامل مبتنی بر هوش مصنوعی را به عنوان عامل اصلی حمله برای سال ۲۰۲۶ شناسایی کرده‌اند. دو سال پیش، این گزینه به سختی در صدر فهرست قرار داشت.

استراتژی انتشار Mythos شرکت Anthropic شامل دسترسی زودهنگام به سازمان‌های دفاعی است که «به آنها مزیت پیشگام بودن می‌دهد». این گفته خود، عدم تقارن حمله و دفاع را تصدیق می‌کند. اگر مدافعان به مزیت اولین حرکت نیاز نداشته باشند، به این معنی است که مهاجمان هنوز به دروازه نرسیده‌اند.

قیمت --

--

ممکن است شما نیز علاقه‌مند باشید

خروج Chaos Labs، چه کسی ریسک Aave را بر عهده خواهد گرفت؟

با خروج مدیریت ریسک، ارزش‌گذاری امنیتی دیفای بازنگرفته می‌شود.

جنگ مالی پنهان؟ ایران عوارض ترانزیت تنگه را با استیبل‌کوین دریافت می‌کند

این اولین بار است که یک کشور مستقل یک استیبل‌کوین را در زیرساخت پرداخت استراتژیک خود گنجانده است.

اوپن آلیس: یک نفر، این یک خیابان جین است | نمای کلی پروژه

تیم کمی مبتنی بر هوش مصنوعی، ۲۴/۷ یک عامل معاملاتی محلی را اجرا می‌کند

برچسب‌گذاری مدل‌های بزرگ هوش مصنوعی توسط جوانان شهرهای کوچک

پشت‌صحنهٔ یک انقلاب فناوری همیشه مصرف مقیاس‌پذیر نیروی کار ارزان است.

گزارش صبحگاهی | شرکت Strategy هفته گذشته دارایی‌های خود را ۴۸۷۱ بیت‌کوین افزایش داد؛ Toss قصد دارد بلاکچین خود را توسعه دهد و یک ارز دیجیتال بومی منتشر کند؛ مدیر مالی OpenAI به طور خصوصی زمان عرضه اولیه سهام در سال ۲۰۲۶ را زیر سوال برد.

مروری بر رویدادهای مهم بازار در 6 آوریل

تحقیق: حجم معاملات استیبل کوین‌ها سالانه ۳۵ تریلیون دلار است، چه مقدار از آن پرداخت واقعی است؟

حجم معاملات استیبل کوین‌ها ۳۵ تریلیون است که ۹۹٪ آن مربوط به نقل و انتقالات داخلی است. مک‌کینزی می‌گوید که پرداخت‌های واقعی به پشتیبانی B2B متکی هستند.

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب