logo

چرا قیمت کارت‌های گرافیک کنترل‌ناپذیر سر به فلک می‌کشد؟

By: blockbeats|2026/04/07 00:12:44
0
اشتراک‌گذاری
copy
عنوان اصلی: کمبود عظیم GPU – ظرفیت اجاره – راه‌اندازی شاخص قیمت اجاره یک‌ساله H100 ما
نویسندگان اصلی: دانیل نیشبال، جردن نانوس، چیانگ کانگ ون و غیره.
ترجمه: پگی، بلاک‌بی‌تس

یادداشت ویراستار: با گذار هوش مصنوعی از یک «ابزار» به «زیرساخت گردش کار»، قیمت‌های اجاره GPU وارد فاز افزایش شتابانه‌ای شده‌اند و عرضه همچنان تنگ‌تر می‌شود.

از افزایش تقریباً ۴۰ درصدی قیمت یک‌ساله H100، تا قفل شدن قدرت هش تا نیمه دوم ۲۰۲۶، و علاوه بر آن قفل شدن مداوم عرضه توسط آزمایشگاه‌های هوش مصنوعی از طریق قراردادهای بلندمدت و سازوکارهای تمدید، منطق عملیاتی بازار پردازنده‌های گرافیکی تغییرات قابل‌توجهی را تجربه کرده است: قیمت‌ها دیگر عمدتاً توسط هزینه‌های سخت‌افزاری تعیین نمی‌شوند، بلکه به‌طور جمعی تحت تأثیر مصرف توکن، قابلیت‌های مدل و کارایی تولید شکل می‌گیرند.

تغییرات در سمت تقاضا به‌ویژه حیاتی هستند. پارادایم‌های جدیدی مانند سیستم‌های چندعاملی، تولید محتوای بومی، ابزارهای برنامه‌نویسی هوش مصنوعی و غیره، استفاده از توکن‌ها را به فاز رشد نمایی سوق می‌دهند. نتیجه‌گیری اصلی گزارش نیز در حال روشن شدن است: بازگشت سرمایه ابزارهای هوش مصنوعی با بازدهی ۵ تا ۱۰ برابر تأیید شده است، که این امر قیمت‌گذاری توان هش را برای مدتی طولانی به‌طور مؤثر محدود می‌کند.

تنش حاصل هرچه بیشتر آشکار می‌شود: بازار قدرت هش در دنیای واقعی با کمبود گسترده و افزایش قدرت قیمت‌گذاری مواجه است، در حالی که بازار سرمایه هنوز در انتظار «فراوانی بیش از حد و کالاشدن در نهایت» مانده است. این گسست میان انتظار و واقعیت، منطق ارزش‌گذاری رقابت زیرساخت هوش مصنوعی را دگرگون می‌کند.

با تبدیل شدن قدرت هش‌کردن به یک روش جدید تولید، سازوکار قیمت‌گذاری، ساختار عرضه و بازده سرمایه آن در حال بازسازی عمیقی هستند.

متن اصلی به شرح زیر است:

تقاضا برای کلود ۴.۶ اپوس و کلود کد آنتروپیک افزایش چشمگیری داشته است. درآمد سالانهٔ تکرارشوندهٔ آن‌ها (ARR) از ۹ میلیارد دلار در پایان سال گذشته به بیش از ۲۵ میلیارد دلار در تنها یک سه‌ماهه جهش کرده و رشدی نزدیک به سه برابر را تجربه کرده است. در عین حال، مدل‌های متن‌باز به نمایندگی از GLM و Kimi K2.5 نیز به گسترش سریع برنامه‌های مرتبط با مدل‌های متن‌باز کمک کرده‌اند. تأمین مالی مستمر از سوی شرکت‌هایی مانند آنتروپیک، اوپن‌ای‌آی و چندین نیولب نیز به طور مشابه تقاضا برای منابع گرافیکی (GPU) را تشدید می‌کند.

این نقطه عطف، نشان‌دهنده جهش سریع تقاضا در مدت کوتاهی است، به‌طوری‌که هایپراسکالرها و ارائه‌دهندگان ابری نوظهور (نیوکلاودها) شاهد هجوم به خرید GPU هستند.

این تقاضای جدید قیمت‌ها را در سراسر زنجیره تأمین، از حافظه‌های DRAM و NAND تا کابل‌های فیبر نوری، میزبانی مراکز داده و حتی زیرساخت‌هایی مانند توربین‌های گازی، افزایش می‌دهد. تقریباً همه محصولات و خدمات مرتبط در حال افزایش هستند.

قیمت‌های اجاره GPU به جدیدترین حوزه‌ای در میان مجموعه‌ای از محصولات و خدمات مرتبط با محاسبات تبدیل شده است که با محدودیت‌های عرضه و جهش قیمت مواجه شده است. قیمت قرارداد اجاره یک‌ساله یک کارت گرافیک H100 از پایین‌ترین حد ۱.۷۰ دلار در هر کارت گرافیک در هر ساعت در اکتبر ۲۰۲۵ به ۲.۳۵ دلار در مارس ۲۰۲۶ افزایش یافته است که تقریباً ۴۰ درصد رشد را نشان می‌دهد.

ظرفیت اجاره GPU بر اساس تقاضا تقریباً در همه مدل‌ها به‌طور کامل فروخته شده است—کاربرانی که نمونه‌های بر اساس تقاضا را رزرو کرده‌اند، حتی پس از افزایش قیمت‌ها نیز تمایلی به بازگرداندن قدرت محاسباتی به بازار ندارند. در اوایل سال ۲۰۲۶، یافتن توان محاسباتی GPU مانند تلاش برای گرفتن آخرین صندلی یک پرواز است: قیمت‌ها بالا و موجودی اندک است. تمثیل مناسب‌تر شاید کمتر درباره گرفتن صندلی در یک پرواز باشد و بیشتر درباره «سعی در پیدا کردن منبع دارو».

چرا قیمت کارت‌های گرافیک کنترل‌ناپذیر سر به فلک می‌کشد؟

در SemiAnalysis، ما مدت‌هاست که روندها و مسائل کلیدی مختلف در اکوسیستم ابری نوکلود و هایپراسکیل، از جمله قیمت‌های اجاره GPU را رصد می‌کنیم. این قابلیت ناشی از تحقیقات و فعالیت‌های مستمر ما در پروژه‌هایی مانند ClusterMAX، InferenceX و هزینه کل مالکیت (TCO) رایانش ابری هوش مصنوعی است.

هم‌زمان، ما تلاش قابل‌توجهی را برای کمک به آزمایشگاه‌های مختلف هوش مصنوعی جهت ارتباط با ارائه‌دهندگان خدمات نیوکلاود، تأمین منابع اجاره GPU در بازار و حفظ ارتباط مستمر با تقریباً همه ذی‌نفعان اکوسیستم در خصوص تغییرات قیمت اجاره GPU صرف کرده‌ایم.

از سال ۲۰۲۳، ما برای مشتریان یک سیستم شاخص قیمت اجاره GPU راه‌اندازی و نگهداری کرده‌ایم که مدل‌های اصلی GPU مانند H100، H200، B200، B300، GB200، GB300، MI300، MI325 و MI355 را در دوره‌های اجاره مختلف، از اجاره‌های کوتاه‌مدت یک‌ماهه درخواستی تا قراردادهای بلندمدت ۵ ساله، پوشش می‌دهد. این شاخص بر اساس داده‌های پژوهشی از چندین ارائه‌دهنده خدمات نیوکلاود و خریداران رایانش ساخته شده و از طریق داده‌های واقعی تراکنش‌ها و نتایج مذاکراتی که ما تسهیل کرده‌ایم، اعتبارسنجی متقابل شده است.

امروز ما شاخص قیمت اجاره یک‌ساله GPU مدل H100 را برای عموم منتشر می‌کنیم، با هدف ارائه داده‌ها و بینش‌های بیشتر به صنعت. این شاخص ماهانه به‌روزرسانی خواهد شد و ما به انتشار آخرین تحلیل‌های روند و مشاهدات بازار از طریق ایکس و لینکدین ادامه خواهیم داد. در مورد داده‌های جامع قیمت‌گذاری که ساختارهای اجاره‌ای مختلف و سایر مدل‌های اصلی GPU را پوشش می‌دهد، این اطلاعات در حال حاضر تنها برای کاربران سازمانی که به مدل TCO ابری هوش مصنوعی ما مشترک هستند، در دسترس است.

این گزارش بر آخرین روندهای بازار اجاره GPU، مشاهدات میدانی از بازار و داده‌های کلیدی تمرکز خواهد کرد تا نحوه درک ساختار کلی بازار را تحلیل کرده و قضاوتی مقدماتی درباره روندهای آتی قیمت اجاره ارائه دهد.

بازار اجاره GPU وارد مرحله «قیمت‌گذاری پویا» می‌شود

فقط با نگاه به منحنی قیمت اجاره یک‌ساله H100 نمی‌توان به‌طور کامل سطح تنش بازار را نشان داد—تجربه واقعی تأمین توان محاسباتی در خط مقدم و بازخورد شرکت‌کنندگان بازار وضعیت وخیم‌تری را نشان می‌دهد.

تقاضای فعلی از چندین سناریوی استفاده بسیار ناهمگون ناشی می‌شود که تقریباً هیچ راه‌حل «یک‌مقیاس-برای-همه» وجود ندارد. برای مثال، در بخش استنتاج، مدل‌های بزرگ مخلوط متخصصان (MoE) برای اجرا روی جدیدترین سیستم‌های بزرگ‌مقیاس مانند GB300 NVL72 مناسب‌تر هستند؛ و در بخش آموزش، H100 همچنان از نظر صرفه‌جویی در هزینه برتری دارد، بنابراین حتی برای یک GPU نسبتاً «نسل قدیمی‌تر»، تقاضا همچنان بالا است.

مشتریان اکنون مشتاقانه تا ۱۴ دلار در هر ساعت برای هر GPU برای نمونه‌های پیش‌گرفتنی p6-b200 در AWS پرداخت می‌کنند؛ برخی از ارائه‌دهندگان برتر خدمات Neocloud فروش گره‌های تکی را متوقف کرده‌اند؛ قیمت‌های تمدید برخی کارت‌های H100 همانند زمانی است که دو تا سه سال پیش قراردادها امضا شدند؛ و برخی قراردادهای H100 مستقیماً تا سال ۲۰۲۸ با دوره اجاره‌ای تا ۴ سال تمدید شده‌اند. اکنون حتی یافتن یک خوشهٔ ۸ گره‌ای (۶۴ پردازندهٔ گرافیکی) H100 یا H200 هم آسان نیست—نیمی از ارائه‌دهندگان خدماتی که از آن‌ها پرسیدیم کاملاً فروش رفته‌اند و پاسخ اکثر ارائه‌دهندگان این است که به‌زودی هیچ پردازندهٔ گرافیکی با معماری هاپر منقضی و آزاد نخواهد شد.

حتی شنیده‌ایم که برخی از مستأجران قدرت محاسباتی شروع کرده‌اند به تقسیم‌بندی و اجاره‌دادن مجدد خوشه‌های محاسباتی‌ای که اجاره کرده‌اند، درست مانند تقسیم و اجاره‌دادن مجدد یک آپارتمان در جریان گرندپری موناکو. آیا در ادامه شاهد ظهور به‌اصطلاح «زیرمالک‌های ابری نوین» خواهیم بود؟ احتمالاً دیگر فقط یک شوخی نیست.

تأمین کالا از شرکت بلک‌ول نیز بسیار محدود است. ما مطلع شده‌ایم که به دلیل تقاضای بالا برای مدل‌های وزنی متن‌باز و تقاضای انفجاری و مداوم برای استنتاج، چرخهٔ استقرار و تحویل دسته‌ای جدید از خوشه‌های بلک‌ول اکنون به ماه‌های ژوئن تا ژوئیه تمدید شده است. علاوه بر این، بیشتر این خوشه‌های آتی از قبل رزرو شده‌اند. در واقع، با نگاهی به کل بازار، ظرفیت اضافی که تا اوت تا سپتامبر ۲۰۲۶ به بهره‌برداری نخواهد رسید، تقریباً به‌طور کامل رزرو شده است.

قیمت‌های اجاره GPU: بازگشت به صحنه

اما بازار چگونه به این نقطه رسید؟ تنها شش ماه پیش، اکثر ناظران بازار همچنان نسبت به «ارزش نهایی» کارت‌های گرافیک دیدگاهی شکاک داشتند و عموماً معتقد بودند که قیمت اجاره کارت‌های گرافیک ناگزیر با گذشت زمان همچنان کاهش خواهد یافت. در آن زمان، اگر یک ارائه‌دهنده ابری Neocloud یا هایپراسکیل در مدل مالی خود چرخه استهلاک شش‌ساله برای دارایی‌های محاسباتی GPU را در نظر می‌گرفت، حتی توسط تحلیلگران مالی مورد انتقاد قرار می‌گرفت. قبل از بحث درباره روندهای آینده، بیایید به‌سرعت مرور کنیم که اوضاع تا این نقطه چگونه تحول یافته است.

تا نیمه دوم سال ۲۰۲۵، انتظار رایج در سراسر اکوسیستم همواره این بود که با استقرار گسترده بلک‌ول و هزینه واحد محاسباتی به‌مراتب پایین‌تر آن، قیمت‌های اجاره هاپر (یعنی H100 و H200) به‌طور چشمگیری کاهش یابد. با این حال، واقعیت برعکس از آب درآمد. تا نیمه دوم سال ۲۰۲۵، تقاضا برای H100 نه تنها کاهش نیافت، بلکه در بسیاری از سناریوها بیش از پیش تقویت شد. پذیرش سریع مدل‌های وزن‌باز و شتاب‌گیری مداوم تقاضا برای استنتاج در آن زمان، نخستین نشانه‌های این موج تقریباً بی‌پایان از تقاضا برای قدرت محاسباتی بودند.

تا ژانویهٔ ۲۰۲۶، بازار قدرت محاسباتی شاهد نقطهٔ عطف بعدی بود: پس از چند فصل افزایش سریع، قیمت‌های حافظه‌های DRAM و ذخیره‌سازی NAND وارد فاز جهش تقریباً «پارابولیک» شدند. طبق مدل ذخیره‌سازی ما، در سه‌ماهه اول سال ۲۰۲۶، قیمت‌های قراردادی LPDDR5 و DDR5 به ترتیب افزایش‌های سالانه تقریباً چهار و پنج برابری را تجربه کردند.

برای مقابله با افزایش شدید هزینه‌های قطعات و ریسک‌های حاشیه سود ناشی از آن، تولیدکنندگان تجهیزات اصلی (OEM) شروع به افزایش قیمت سرورهای هوش مصنوعی کردند و این افزایش قیمت‌ها به‌طور قابل‌توجهی بیشتر از قیمت خود قطعات بود. این امر تصمیم‌گیری درباره هزینه‌های سرمایه‌ای خوشه را پیچیده‌تر کرد: هزینه‌های بالاتر خرید سرور بازده مورد انتظار پروژه‌ها را کاهش داد و برخی اپراتورها را مجبور کرد استقرار را کند کنند یا حتی مستقیماً پروژه‌های برنامه‌ریزی‌شده را رها سازند. در نتیجه، بخشی از تأمین اضافی که در ابتدا برنامه‌ریزی شده بود و می‌توانست به بازار عرضه شود، به تعویق افتاد یا کنار گذاشته شد و این امر تنگنای بازار اجاره را بیش از پیش تشدید کرد.

در این آشفتگی تأمین که ناشی از «قیمت‌گذاری کنترل‌نشده سرورهای هوش مصنوعی» بود، تقاضا برای اجاره GPU به‌طور قابل‌توجهی شتاب گرفت و قدرت محاسباتی باقیمانده در بازار تقریباً در ماه‌های ژانویه و فوریه به‌طور کامل جذب شد. تا ماه مارس، چه برای H100، چه H200 یا B200، تقریباً هیچ ظرفیت قابل‌درختن در هیچ دوره اجاره‌ای وجود نداشت. قیمت اجاره یک‌ساله تا پایان ژانویه از ۲ دلار به ازای هر GPU در هر ساعت فراتر رفته بود و در نیمه دوم فوریه نسبت به پایان ژانویه ۱۵٪–۲۰٪ دیگر افزایش یافت، با افزایش ماهانهٔ مورد انتظار ۱۵٪–۲۰٪ تا پایان مارس.

یکی از عوامل کلیدی تقاضای اوایل سال جاری، تولید رسانه‌ای بومی بود. برنامه‌هایی مانند Seedance و Nano Banana کاربران را به تولید و تکرار تصاویر و ویدیوها در مقیاس وسیع ترغیب می‌کنند و بدین ترتیب، پهنای باند توکن‌ها را به طور قابل توجهی افزایش می‌دهند. با این حال، منبع تقاضای مهم‌تر و آشکارتر، ظهور بارهای کاری چندعاملی است؛ سیستم‌هایی که فرآیندهای چندمرحله‌ای را اجرا می‌کنند، به‌طور مداوم در محیط‌های چندرسانه‌ای با هم‌زمانی بالا تکرار می‌شوند و مصرف توکن و نیازهای قدرت محاسباتی را به رشد «هذلولوی» می‌رسانند.

این روند به‌ویژه در داده‌های مرتبط با کلود کد مشهود است، همان‌طور که قبلاً در چندین مقاله اشاره کرده‌ایم. با استفاده از SemiAnalysis به‌عنوان مثال، تنها در هفت روز گذشته این شرکت ده‌ها میلیارد توکن را به‌صورت داخلی مصرف کرده است، با میانگین هزینه حدود ۵ دلار برای هر میلیون توکن. با این حال، زمان صرفه‌جویی‌شده، گسترش گردش کار و قابلیت‌های ارتقا یافته به‌مراتب بیشتر از خود هزینه است. امروز، SemiAnalysis یک مجموعه کامل از ابزارهای هوش مصنوعی را در چندین جریان کاری ادغام کرده است که دیگر به جستجوی ساده و خلاصه‌سازی محدود نیست، بلکه به داشبوردهای داده، استخراج خودکار، پردازش داده در مقیاس بزرگ و سناریوهای مدل‌سازی مالی مبتنی بر عامل نیز گسترش یافته است.

ما همچنین رشد انفجاری این تقاضا را از طریق معیارهایی مانند «تعهدات روزانه کلود» ردیابی می‌کنیم تا این روند را زیر نظر داشته باشیم. با روند فعلی، انتظار داریم که تا پایان سال ۲۰۲۶، کلود کد بیش از ۲۰٪ از کل کامیت‌های کد را به خود اختصاص دهد. می‌توان گفت که، بی‌خبر از شما، هوش مصنوعی پیشاپیش شروع به «بلعیدن» کل فرآیند توسعه نرم‌افزار کرده است. مشتریان نهادی علاقه‌مند به دسترسی به این مجموعه داده، لطفاً با تیم API ما تماس بگیرند. یک اسپویل کوچک: حجم این کامیت از همان ابتدا به‌طور قابل‌توجهی بالاتر است.

در حلقهٔ ما تقریباً همهٔ افراد از کاربران پرمصرف Claude Code هستند. اما ما همچنین درک می‌کنیم که این حلقه خود عمیقاً در حوزه هوش مصنوعی و نیمه‌هادی غوطه‌ور است، که اساساً چیزی جز «گروه کوچکی در خط مقدم» نیست.

برای بسیاری از شرکت‌های فهرست فورچون ۵۰۰ و عموم مردم، کلود کد و «جهان عامل‌ها» صرفاً یک موضوع حاشیه‌ای نسبتاً نو هستند که گهگاه در فید فیسبوک یا پادکست‌های NPR ظاهر می‌شوند. آنها به‌سختی متوجه شده‌اند که موجی از بهره‌وری و شوک ساختاری که توسط عاملان ایجاد می‌شود، در حال نزدیک شدن است.

با پیوستن تدریجی شرکت‌کنندگان بیشتری از اقتصاد واقعی به این «موج قدرت محاسباتی» و درک بازگشت سرمایه شگفت‌انگیز استفاده از ابزارهای هوش مصنوعی، مصرف توکن به رشد مرحله‌ای خود ادامه خواهد داد. بحث درباره بازگشت سرمایه (ROI) سرمایه‌گذاری در هوش مصنوعی در واقع به پایان رسیده است؛ ارزشی که با استفاده از ابزارهای هوش مصنوعی ایجاد می‌شود اغلب هزینه‌هایشان را تا ده برابر فراتر می‌رود. در این زمینه، جابجایی مداوم منحنی تقاضا برای توکن به سمت راست، نیروی قوی و (در این مرحله) نسبتاً غیرالاستیکی ایجاد می‌کند که قیمت‌های اجاره GPU را به طور مداوم به سمت بالا سوق می‌دهد.

به زبان ساده، اگر بازگشت سرمایه استفاده از ابزارهای هوش مصنوعی بتواند به ۵ تا ۱۰ برابر برسد، آنگاه قیمت‌های اجاره GPU هنوز فضای قابل‌توجهی برای افزایش دارند قبل از اینکه واقعاً تقاضا را مهار کنند. ما همچنین این احتمال را رد نمی‌کنیم که افزایش‌های بیشتر در قیمت اجاره همچنان به سمت بالادست سرایت کرده و هزینه‌های سرورها و قطعات اصلی را بالا ببرد.

شاخص قیمت اجاره یک‌ساله H100 از SemiAnalysis منتشر شد

امروز ما شاخص قیمت قرارداد اجاره یک‌ساله H100 شرکت SemiAnalysis را به‌صورت رایگان در اختیار عموم قرار می‌دهیم، با هدف افزایش آگاهی بازار و شفافیت روندهای قیمت اجاره GPU.

این شاخص بر اساس داده‌های نظرسنجی ماهانه از بیش از ۱۰۰ شرکت‌کننده در بازار، از جمله ارائه‌دهندگان خدمات نیوکلاود، خریداران و فروشندگان توان هش، ساخته شده است تا یک بازهٔ نماینده (صدک‌های ۲۵ تا ۷۵) از قیمت‌های اجاره GPU را تعیین کند. علاوه بر این، ما با استفاده از داده‌های واقعی تراکنش‌ها اعتبارسنجی متقابل انجام می‌دهیم و معاملات درون شبکه خود را تسهیل می‌کنیم تا سطوح قیمت را بیشتر کالیبره کنیم.

از سال ۲۰۲۳، ما قیمت‌های قرارداد برای GPUها از جمله H100، H200، B200، B300، GB200 و GB300 را در دوره‌های اجاره از ۳ ماه تا ۵ سال رصد کرده‌ایم؛ ما همچنین داده‌هایی را در مورد سری AMD (MI300، MI325، MI355) نیز گنجانده‌ایم.

در مقایسه با شاخص‌های موجود کارت گرافیک در بازار، شاخص قیمت قرارداد اجاره یک‌ساله H100 در SemiAnalysis دارای چندین تفاوت کلیدی است:

ابتدا، بسیاری از شاخص‌های اجاره GPU بر اساس نرخ‌های اسپات/درخواست یا قیمت‌های فهرست عمومی هستند، اما در واقع اکثریت معاملات اجاره GPU از طریق قراردادهای بلندمدت، اغلب با مدت شش ماه یا بیشتر، انجام می‌شود. این قیمت‌ها معمولاً از طریق مذاکرات دوجانبه تعیین می‌شوند و به‌صورت عمومی اعلام نمی‌شوند. اکثر ارائه‌دهندگان عمده خدمات نیوکلاود ترجیح می‌دهند قراردادهای اجاره‌ای حداقل یک‌ساله منعقد کنند، که دوره‌های دو تا سه ساله رایج‌تر است و در حالت ایده‌آل، یک قرارداد عمده‌فروشی پنج‌ساله در مقیاس بزرگ را تضمین می‌کنند. شاخص اجاره یک‌ساله H100 شرکت SemiAnalysis بر این «بازار قراردادها» تمرکز دارد — نقدشونده‌ترین بخش بازار. با هدف‌گیری صریح یک مدت اجاره مشخص، درک این شاخص توسط کاربران آسان‌تر می‌شود تا بخش بازار تحت پوشش آن را شناسایی کرده و آن را با مشاهدات خود مقایسه کنند.

ثانیاً، قیمت‌های افشا شده به‌طور عمومی، نمایانگر قیمت‌های واقعی معاملات نیستند. قیمت‌های ارائه‌شده توسط ارائه‌دهندگان ابری هایپرস্کیل و نیوکلاود بیشتر نشان‌دهنده روندها هستند تا سطوح واقعی معاملاتی. این قیمت‌ها اغلب از تغییرات بازار قراردادها عقب می‌مانند و معمولاً پس از وقوع تغییرات در تقاضای هش‌پاور تنظیم می‌شوند. به‌ویژه در بازار درخواستی، قیمت‌ها معمولاً در سطوح نسبتاً ثابتی تعیین می‌شوند، تغییرات واقعی عرضه و تقاضا از طریق میزان استفاده یا بهره‌وری منابع منعکس می‌شود و تنظیمات تنها به‌طور نامنظم و صرفاً در مواقع لزوم انجام می‌گیرد. جزئیات بیشتر درباره این مکانیزم بازار در بخش‌های بعدی این مقاله پوشش داده خواهد شد.

علاوه بر این، اگرچه شاخص‌های زیادی در بازار وجود دارند که می‌توانند داده‌های گسترده مربوط به نرخ، قیمت و معاملات را مدیریت کنند و در تحلیل روندها مزیت دارند، رویکرد ما بر تعامل مستقیم با شرکت‌کنندگان بازار تأکید دارد. پشت هر نقل‌قول و هر معامله، زمینهٔ خاص و منطق تصمیم‌گیری آن نهفته است. امیدواریم داده‌های کمی را ارائه دهیم و در عین حال این اطلاعات کیفی و مشاهدات دست اول را نیز تکمیل کنیم تا ساختار واقعی بازار اجاره GPU را به شکلی جامع‌تر به تصویر بکشیم.

برای کاربران اشتراک سازمانی، ما همچنین داده‌های کامل ساختار سررسید را که تقریباً تمام بازارهای اصلی اجاره GPU را پوشش می‌دهد، ارائه می‌دهیم.

همزمان با انتشار شاخص قیمت قرارداد یک‌ساله برای H100، ما داشبورد توکنومیکس SemiAnalysis را نیز راه‌اندازی کرده‌ایم تا کاربران دارای اشتراک مدل توکنومیکس در سطح نهادی بتوانند چشم‌انداز مدل‌های هوش مصنوعی پیشرفته را ردیابی و درک کنند. این داشبورد به کاربران کمک می‌کند تا مقایسه‌های سفارشی را در ابعاد مختلف مانند کد، استنتاج، ریاضیات و ارزیابی عامل هوش مصنوعی انجام دهند، قیمت‌گذاری API مدل‌ها و ارائه‌دهندگان خدمات مختلف را مقایسه کنند و داده‌های کلیدی منتشرشده توسط آزمایشگاه‌های بزرگ هوش مصنوعی از جمله میزان استفاده از توکن‌ها، درآمد، ارزش‌گذاری و پایگاه مشتریان را مشاهده نمایند.

ساختار کنونی بازار اجاره GPU

تا نیمه دوم سال ۲۰۲۵، فضای قیمت‌گذاری بازار اجاره GPU نسبتاً رقابتی‌تر بود. در آن زمان، اپراتورها موجودی فراوان‌تری از کارت‌های گرافیک در اختیار داشتند، در حالی که تقاضای نهایی تازه در حال شتاب گرفتن بود. بنابراین، رقابت میان ارائه‌دهندگان مختلف خدمات نیوکلاود شدید بود و آن‌ها عموماً با ارائه قیمت‌های جذاب‌تر برای جذب مشتریان با یکدیگر رقابت می‌کردند. هدف اصلی افزایش بهره‌وری و استخراج کامل ارزش دارایی‌های قدرت محاسباتی موجود پیش از آغاز چرخهٔ بعدی تکرار GPU بود.

با این حال، چشم‌انداز بازار از آن زمان ۱۸۰ درجه چرخش کرده است. امروز، نیوکلاود و ارائه‌دهندگان ابری هایپراسکیل کنترل کامل را در دست گرفته‌اند—هدف اصلی آن‌ها افزایش بهره‌وری تا حد امکان پیش از چرخه بعدی تکرار GPU و استخراج ارزش دارایی‌های محاسباتی موجودشان است. آنها می‌توانند پیش‌پرداخت‌های بالاتر، قیمت‌گذاری بهتر، مدت قرارداد طولانی‌تر را مطالبه کنند و حتی زمان شروع و پایان قراردادها را برای تطبیق با موجودی و ظرفیت خود انتخاب نمایند. در عین حال، زمان نیز به نفع سمت عرضه است: آنها می‌توانند با سرعت دلخواه خود اقدام کنند و به‌تدریج بهترین ترکیب مشتریان را در محیطی با قیمت‌های رو به افزایش انتخاب نمایند.

از نظر ساختاری، بازار اجاره GPU را می‌توان به طور کلی به سه بخش اصلی تقسیم کرد که هر بخش با انواع متفاوتی از تقاضاهای مشتریان مطابقت دارد:

اجاره‌ی کوتاه‌مدت: اجاره‌ی موردی، فوری و قراردادهایی با مدت کمتر از ۳ ماه

قراردادهای میان‌مدت: قراردادهایی با مدت‌زمان ۳ ماه تا بیش از ۳ سال

قرارداد خرید تضمینی: قراردادی ۴ تا ۵ ساله، که ۵ سال رایج‌ترین مدت آن است.

اجاره کوتاه‌مدت: درخواستی، نقدی و قراردادهای کمتر از ۳ ماه

اجاره کوتاه‌مدت در ابتدای کل ساختار مدت اجاره قرار دارد و اغلب با «ظرفیت مازاد» مطابقت دارد. با این حال، برخی ارائه‌دهندگان خدمات (مانند Runpod و Lambda) بر ارائه توان محاسباتی قابل‌توجه و انعطاف‌پذیر به‌صورت درخواستی یا اسپات تمرکز دارند.

مهم است بدانیم که سازوکار قیمت‌گذاری در بازار درخواستی به‌طور قابل‌توجهی با سایر بازارهای قراردادی متفاوت است. معمولاً ارائه‌دهندگان خدمات سطح قیمت نسبتاً ثابتی را برای منابع درخواستی تعیین می‌کنند و آن را تنها در موارد بسیار کمی تغییر می‌دهند. به عبارت دیگر، قیمت در بازار کوتاه‌مدت کاملاً تحت تأثیر عرضه و تقاضای آنی نیست، بلکه از طریق تغییرات در بهره‌وری منابع، تنش بازار را منعکس می‌کند.

ارائه‌دهندگان خدمات معمولاً قیمت‌ها را به‌صورت یک‌باره بر اساس میزان استفاده از منابع تنظیم می‌کنند: وقتی میزان استفاده پایین است، برای تحریک تقاضا قیمت‌ها را کاهش می‌دهند و وقتی استفاده به ظرفیت کامل نزدیک می‌شود، قیمت‌ها را افزایش می‌دهند زیرا تقاضا حتی در سطح قیمتی بالاتر نیز بالا باقی می‌ماند.

این موضوع همچنین توضیح می‌دهد که چرا در نمای سری زمانی، قیمت‌گذاری بر اساس تقاضا در نیوکلاود اغلب برای مدت طولانی بدون تغییر باقی می‌ماند و سپس ناگهان افزایش یا کاهش «گام‌تغییری» را تجربه می‌کند. برای بازار برحسب تقاضا، آنچه واقعاً تغییرات تقاضا را با فرکانس بالا منعکس می‌کند، قیمت نیست بلکه نرخ بهره‌برداری از منابع است.

منبع: لامبدا لبز، سمی‌آنالیسیس

قیمت --

--

قراردادهای میان‌مدت

از منظر اقتصادی، آنچه در واقع حیاتی‌تر است «بازار قرارداد» است، زیرا بخش اعظم ارزش معاملات اجاره GPU در این بخش رخ می‌دهد. در میان این موارد، قرارداد یک‌ساله به‌ویژه اهمیت دارد—این قرارداد هم تقاضای حاشیه‌ای مشتریان غیرآزمایشگاه هوش مصنوعی و هم تقاضای مازاد مشتریان بزرگ را منعکس می‌کند و به همین دلیل حساس‌ترین شاخص تنگ‌تر شدن بازار است.

شرکت‌های بومی هوش مصنوعی و آزمایشگاه‌های کوچک تا متوسط هوش مصنوعی عمدتاً در بازهٔ ۱ تا ۳ ساله فعال هستند. با این حال، یک روند قابل توجه اخیر این است که این مؤسسات نیز شروع به تلاش برای تثبیت منابع محاسباتی از طریق قراردادهای بلندمدت کرده‌اند—بسیاری از این قراردادها به بیش از ۴ سال تمدید شده‌اند و حتی حاضرند بیش از ۲۰٪ پرداخت پیش‌پرداخت انجام دهند، که در گذشته در قراردادهای بالای ۴ سال مرسوم نبود.

خریدهای بلندمدت

در بازار بلندمدت ۴ تا ۵ ساله، بازیگران غالب، آزمایشگاه‌های بزرگ هوش مصنوعی هستند که منابع محاسباتی در مقیاس وسیع را از همان ابتدا تأمین می‌کنند. این معاملات معمولاً معادل خوشه‌های ۵۰ مگاواتی، ۱۰۰ مگاواتی یا حتی بزرگ‌تر هستند که تقریباً معادل ۲۴٬۰۰۰ تا ۴۸٬۰۰۰ واحد GPU GB300 NVL72 می‌باشند. در مجموع، چنین قراردادهای بلندمدت خرید تضمینی سهم قابل‌توجهی از بازار اجاره GPU نیوکلاود را به خود اختصاص داده‌اند.

آزمایشگاه‌های هوش مصنوعی این قراردادها را ترجیح می‌دهند زیرا می‌توانند منابع محاسباتی در مقیاس بزرگ را یک‌جا برای پاسخگویی به تقاضای روزافزون کاربران نهایی تأمین کنند. در عین حال، این مؤسسات اغلب به‌طور عمیق در طراحی خوشه مشارکت می‌کنند، از جمله جنبه‌های کلیدی مانند ذخیره‌سازی، شبکه‌بندی، پیکربندی CPU و موارد دیگر. این تراکنش‌ها اغلب به‌صورت **bare metal** ارائه می‌شوند، زیرا آزمایشگاه‌های هوش مصنوعی دارای قابلیت‌های مهندسی کافی برای سفارشی‌سازی پشته فناوری در سطح پایین‌تر هستند و بدین ترتیب به بهینه‌ترین هزینه کل مالکیت (TCO) و عملکرد دست می‌یابند.

برای ارائه‌دهندگان خدمات نیوکلاود، این تراکنش‌ها نیز جذاب هستند. از یک سو، آن‌ها می‌توانند منابع فروش را بر چند سفارش بزرگ متمرکز کنند، بدون اینکه با مشتریان خرد متعدد سروکار داشته باشند، اما همچنان همان درآمد را کسب کنند. از سوی دیگر، قراردادهای بلندمدت همچنین شرایط تأمین مالی بدهی بهتری را فراهم می‌کنند—با تطبیق مدت تأمین مالی با مدت قرارداد، می‌توانند به‌طور مؤثر عدم تطابق مدت بازپرداخت و ریسک نوسانات قیمت را کاهش دهند و در اغلب موارد نرخ بازده داخلی (IRR) پروژه را با چند واحد درصد دو رقمی تثبیت کنند.

علاوه بر این، هایپراسکیلرها اغلب در این فرآیند به‌عنوان یک «پشتیبانی پشتیبان» عمل می‌کنند—آنها به‌عنوان خریداران مستقیم، قدرت محاسباتی را از نیوکلاود خریداری کرده و آن را به آزمایشگاه‌های هوش مصنوعی مجدداً می‌فروشند. این ساختار برای همه طرف‌ها برد-برد است: نیوکلاود می‌تواند بر اساس خریداران دارای رتبه AAA، شرایط تأمین مالی بهتری به‌دست آورد، در حالی که هایپراسکیلرها می‌توانند بدون گسترش ترازنامه‌های خود، از طریق ارائه ضمانت‌های اعتباری در بازده پروژه سهیم شوند.

جدول زیر برخی از بزرگ‌ترین قراردادهای خرید را که ما رصد می‌کنیم، نشان می‌دهد. ما تحلیل‌های عمیقی از این تراکنش‌ها انجام خواهیم داد تا قیمت ساعتی تلویحی GPU (دلار/ساعت/GPU) و همچنین معیارهای کلیدی سودآوری مانند IRR پروژه و حاشیه EBIT را استخراج کنیم.

در محیط بازار کنونی، اکثریت قریب به اتفاق خوشه‌های بزرگ هوش مصنوعی در حال گسترش، در واقع توسط آزمایشگاه‌های هوش مصنوعی «مصرف داخلی» می‌شوند. با این حال، این نهادها همچنان برای تأمین قدرت محاسباتی وارد بازار قراردادهای زیر چهار سال می‌شوند و در عین حال با تمدید خوشه‌های موجود H100 و H200، به‌طور غیرمستقیم مانع از بازگشت عرضه به بازار می‌شوند. با عرضه تدریجی خوشه‌های فوق‌العاده بزرگ GB200 و GB300، نحوه تحول رابطه عرضه و تقاضا در بازار قراردادهای یک تا سه ساله به متغیری کلیدی برای پیگیری در آینده نزدیک تبدیل خواهد شد.

پوک به کجا می‌رود

جالب‌ترین تحول کنونی، گسست آشکار میان واقعیت بنیادی و احساسات بازار است. با وجود نشانه‌های واضح از محدودیت‌های عرضه و افزایش قیمت‌ها (که همگی برای نیوکلاود مثبت هستند – گسترش حاشیه سود و افزایش طول عمر دارایی)، بازارهای عمومی نسبت به شرکت‌هایی مانند CoreWeave، Nebius و Iris Energy هرچه بیشتر بدبین شده‌اند و قیمت سهام آن‌ها همچنان در نزدیکی پایین‌ترین سطوح ۶ تا ۱۲ ماه گذشته در حال افت است.

بازار همچنان تحت سلطه روایت «فراوانی بیش از حد نهایی، کالاشدن توان هش» است و تغییرات مذکور نتوانسته‌اند نگرانی سرمایه‌گذاران را در مورد ارزش بلندمدت GPUها کاهش دهند. با این حال، در عمل تنگنای مداوم عرضه و قدرت قیمت‌گذاری افزایش‌یافته به این معناست که تقریباً تمام توان هش در وضعیت جذب تقاضا قرار دارد – حتی با وجود اختلافات عملکردی، همچنان شواهد روشنی از پیشی گرفتن تقاضا بر عرضه در محیط کمبود شدید کنونی وجود دارد.

سه مشاهده کلیدی برای آینده

برای سنجش اینکه آیا قیمت‌های اجاره GPU بالا باقی خواهند ماند، بر سه متغیر کلیدی تمرکز کنید:

یک. سرعت گسترش خوشه GB300 (۲۰۲۶)
نکتهٔ حیاتی سرعت نسبی بین توان هش جدید و تقاضای توکن است – آیا عرضه تنگنا را کاهش می‌دهد یا تقاضا همچنان از عرضه پیشی می‌گیرد. این موضوع مستقیماً بر ادامه حضور آزمایشگاه‌های هوش مصنوعی در بازار زیر ۴ سال و روند قیمت‌ها در این بازه تأثیر خواهد گذاشت.

۲. تشدید کمبود تراشه‌ها
این شامل ظرفیت فرآیند N3 شرکت TSMC، HBM، DRAM، NAND و سایر حلقه‌های حیاتی است که هرگونه نوسان در سطح اجرای تولید می‌تواند عرضه را بیش از پیش تنگ‌تر کند.

۳. نرخ رشد درآمد دوره‌ای سالانه (ARR) و مصرف توکن آزمایشگاه هوش مصنوعی
تجاری‌سازی هوش مصنوعی و مقیاس استفاده، شدت تقاضای نهایی را تعیین خواهد کرد که متغیر محرک اصلی تقاضای توان هش است.

حرکت یک‌جهت قیمت با بازده تقویت‌شده

در مجموع، نتیجه‌گیری نسبتاً روشنی این است که احتمال ادامه افزایش قیمت‌های اجاره GPU بیشتر از احتمال کاهش آن‌ها است.

این فرایند یک ویژگی خودتقویت‌کنندهٔ واضح دارد: هرچه نیوکلاود تنگ‌تر شدن عرضه و افزایش قیمت‌ها را مشاهده می‌کند، پیشاپیش سخت‌افزار بیشتری را رزرو می‌کند، عرضهٔ بازار را بیش‌تر فشرده کرده و قیمت‌ها را بالاتر می‌برد. این شبیه چرخه کمبود پردازنده گرافیکی در سال‌های ۲۰۲۳–۲۰۲۴ است – جایی که محدودیت‌های عرضه باعث گسترش قابل توجه حاشیه سود برای تولیدکنندگان تجهیزات اصلی (OEM) و افزایش قابل توجه قیمت سرور شد (اگرچه در این چرخه، با بلوغ بیشتر بازار، این فرآیند ممکن است به طور کامل تکرار نشود).

در عین حال، افزایش مجدد قیمت‌های اجاره GPU نیز در حال بهبود بازگشت سرمایه نیوکلاود (ROIC) است:

از یک سو، حاشیه سود دارایی‌های مستقرشده را افزایش داده است.

از سوی دیگر، عمر اقتصادی پردازنده‌های گرافیکی را افزایش داده و به سرمایه اجازه می‌دهد برای مدت طولانی‌تری جریان نقدی ایجاد کند.

بزرگ‌ترین ذی‌نفع فعلی کیست؟

مستفادان مستقیم فعلی کسانی هستند که قدرت هش را با ویژگی‌های زیر فراهم می‌کنند:

· تمرکز عمدتاً بر قراردادهای کوتاه‌مدت (که امکان قیمت‌گذاری مجدد سریع را فراهم می‌کند)

· مالک موجودی زیاد H100 باشید

· راه‌اندازی ظرفیت جدید در کوتاه‌مدت

ساختار اجاره‌مدت‌کوتاه نئوکلاود امکان خاتمه سریع قراردادهای قدیمی و مذاکره مجدد آن‌ها با قیمت‌های بالاتر را فراهم می‌کند و به گسترش سریع سود منجر می‌شود. در عین حال، ارائه‌دهندگان بزرگ ابری که توان هش نسل بعدی را (با قراردادهای چندساله) تضمین کرده‌اند، در چرخه آینده نیز سود خواهند برد.

پس سؤال این است: این بار واقعاً «متفاوت» خواهد بود؟

[لینک مقاله اصلی]

ممکن است شما نیز علاقه‌مند باشید

چگونه کلود کوورک را به طور کامل یاد بگیریم؟

سیستمی که به هوش مصنوعی اجازه می‌دهد به جای چت کردن با شما، برای شما کار کند

آلتمن در نامه‌ای محرمانه و ۷۰ صفحه‌ای به هیئت مدیره گفت: «من نمی‌توانم شخصیتم را تغییر دهم» و اولین اتهام «دروغگویی» را مطرح کرد.

من هر روز سنگینی این مسئولیت را حس می‌کنم

آیا فصل آلت کوین ها از سال 2026 آغاز می شود؟ آنچه معامله‌گران باید اکنون مراقب باشند

با افزایش سرعت گردش سرمایه در بازارهای کریپتو، سیگنال‌های فصل آلت کوین‌ها در سال ۲۰۲۶ واضح‌تر می‌شوند. در اینجا به مواردی که معامله‌گران باید مراقب باشند و چگونگی تکامل مشارکت مبتنی بر استراتژی در چرخه فعلی بازار اشاره می‌کنیم.

جریان‌های ورودی ETF بیت کوین در سال ۲۰۲۶: تأثیر بر قیمت بیت‌کوین و روندهای بازار ارزهای دیجیتال

جریان‌های ورودی ETF بیت کوین، روند قیمت بیت کوین و نقدینگی بازار ارزهای دیجیتال را در سال ۲۰۲۶ تغییر می‌دهند. ببینید چگونه سرمایه نهادی بر نوسانات، رفتار معاملاتی و استراتژی‌های تخصیص سبد سهام در بازارهای کریپتو تأثیر می‌گذارد.

استراتژی استیبل کوین ویزا: کارت‌ها، تسویه حساب و آینده

در آن زمان، تیم دیگر به ارزهای دیجیتال به عنوان یک «محصول کارتی» نگاه نمی‌کرد، بلکه استیبل کوین‌ها را به عنوان یک راه حل واقعی برای حل مشکلات دنیای واقعی در نظر می‌گرفت.

تقسیم بازار سهام

صنعت مالی مانند همیشه به تکامل و توسعه خود ادامه می‌دهد و هر ساختاری را که بتواند شکاف بین وقوع رویدادها و بیان نظرات در قیمت‌ها را کاهش دهد، اتخاذ خواهد کرد.

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب