Почему цены на GPU стремительно растут?

Question

Отличный дефицит GPU — Мощности для аренды — Запуск нашего индекса цен на аренду H100 на 1 год Авторы исходного текста: Daniel Nishball, Jordan Nanos, Cheang Kang Wen и др. Перевод: Peggy, BlockBeats

Авторы исходного текста:律动BlockBeats

Источник исходного текста:

Пересказ: 火星财经

Примечание редакции: По мере того как AI переходит от «инструмента» к «базовой инфраструктуре рабочих процессов», цены на аренду GPU попадают в фазу ускоренного роста, а предложение продолжает неуклонно ужиматься.

С H100: рост цены аренды на один год почти на 40%, затем вычислительные мощности были заранее зафиксированы до второй половины 2026 года, и наконец — AI-лаборатории продолжают удерживать предложение благодаря долгосрочным контрактам и механизмам продления. Логика работы рынка GPU уже заметно изменилась: теперь цену формируют не столько затраты на оборудование, сколько совместное влияние расхода токенов, возможностей моделей и эффективности производства.

Особенно критичны изменения со стороны спроса. Новые парадигмы вроде multi-agent систем, генерации нативного контента и AI-инструментов для программирования толкают использование токенов в режим экспоненциального роста. Ключевой вывод отчета также постепенно становится ясным: эффективность затрат на инструменты AI уже подтверждена — отдача в 5–10 раз, из‑за чего цены на вычислительные мощности в течение довольно длительного времени не смогут эффективно сдерживать спрос.

Такое напряжение становится все более очевидным: в реальности рынок вычислительных мощностей выглядит как тотальная нехватка с ростом доли влияния на ценообразование, тогда как на рынке капитала по‑прежнему доминируют ожидания «в итоге переизбыток и товаризация». Этот разрыв между ожиданиями и действительностью заново формирует логику оценки в сегменте AI-инфраструктуры.

Когда вычислительные мощности становятся новым фактором производства, их механизм ценообразования, структура предложения и капитальная отдача сейчас проходят глубокую перестройку.

Ниже приводится оригинальный текст:

Спрос на Anthropic Claude 4.6 Opus и Claude Code резко взлетел. Их годовая повторяющаяся выручка (ARR) всего за один квартал поднялась с 9 млрд долларов на конец прошлого года до более чем 25 млрд долларов — почти трехкратный рост. Параллельно открытые модели, представленные GLM, Kimi K2.5, также ускоряют быстрое расширение прикладных сценариев, связанных с открытыми моделями. Постоянные раунды финансирования со стороны компаний, включая Anthropic, OpenAI и несколько Neolabs, дополнительно усиливают спрос на GPU-ресурсы.

Этот перелом означает, что спрос за короткое время резко вырос: у сверхкрупных облачных провайдеров (hyperscalers) и у новых облачных сервисов (Neoclouds) уже началась волна покупки GPU «впрок».

Новая прибавка спроса выталкивает цены вверх по всей цепочке поставок: от DRAM и NAND-хранилищ до оптоволоконных кабелей, хостинга в дата-центрах и даже газовых турбин — практически все связанные продукты и услуги демонстрируют рост.

Цены аренды GPU стали одним из наиболее «свежих» направлений среди множества продуктов и сервисов, связанных с вычислительными мощностями, где предложение начинает испытывать напряжение и где цены резко подпрыгивают. Цена аренды GPU H100 на один год: с локального минимума в октябре 2025 года — 1,70 доллара за GPU в час — выросла до 2,35 доллара в марте 2026 года. Рост почти на 40%.

Арендные мощности GPU по требованию (on-demand) практически полностью распроданы по всем моделям. Пользователи, которые уже зафиксировали инстансы по on-demand, даже после роста цен не готовы возвращать вычислительные мощности обратно на рынок. В начале 2026 года сложность поиска GPU-вычислений почти как попытка купить билет на «последний рейс»: цены высокие, почти нет мест. Если воспользоваться более точной метафорой, то это больше похоже не на «покупку билетов», а на «поиск канала, где купить лекарства».

В SemiAnalysis мы уже долго и глубоко отслеживаем различные тренды и ключевые вопросы в экосистеме Neocloud и сверхкрупных облаков, включая цены аренды GPU. Эта способность опирается на наше постоянное исследование и практику в проектах ClusterMAX, InferenceX и общую стоимость владения AI-облаками (TCO).

Параллельно мы также вкладываем много усилий в то, чтобы помогать AI-лабораториям подключаться к провайдерам Neocloud, находить на рынке ресурсы для аренды GPU, и постоянно общаться почти со всеми участниками экосистемы о том, как меняются тенденции цен аренды GPU.

С 2023 года мы создали и поддерживаем систему индексов цен на аренду GPU для клиентов: она охватывает основные модели GPU (например, H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355) и разные сроки аренды — от on-demand, короткой аренды на 1 месяц до долгосрочных контрактов на срок до 5 лет. Индекс построен на основе данных опросов нескольких Neocloud-провайдеров и покупателей вычислительных мощностей, а также проходит перекрестную валидацию на основе данных реальных сделок, плюс данных о переговорах и закрытиях сделок, в которых мы участвовали.

Сегодня мы открываем для широкой публики индекс цен аренды GPU H100 на один год. Мы надеемся, что это даст отрасли больше данных и инсайтов. Индекс обновляется ежемесячно, и мы будем продолжать публиковать самые свежие разборы трендов и наблюдения за рынком через X и LinkedIn. Что касается полной ценовой информации, охватывающей разные структуры сроков аренды, а также другие основные модели GPU, то пока она доступна только институциональным пользователям, которые подписались на нашу модель AI Cloud TCO.

Этот отчет будет сфокусирован на последних трендах рынка аренды GPU, наблюдениях с передовой и ключевых данных; он объяснит, как мы понимаем структуру всего рынка, и даст предварительный прогноз о том, куда будут двигаться цены аренды в будущем.

Рынок аренды GPU переходит в стадию «динамического ценообразования»

Только по кривой цен аренды H100 на один год все еще недостаточно, чтобы в полной мере передать степень напряженности рынка — то, что отражается в наших реальных опытах получения вычислительных мощностей «в полевых условиях», и в обратной связи от участников рынка, оказывается еще более суровым.

Текущий спрос исходит из множества сильно неоднородных сценариев использования — практически не существует «универсального решения». Например, в части инференса крупные модели с Mixture of Experts (MoE) лучше подходят для работы на новейших масштабных системах вроде GB300 NVL72; а в части обучения H100 по‑прежнему обладает преимуществом по соотношению цена/производительность, поэтому даже относительно «прошлые» поколения GPU сохраняют высокий спрос.

Сегодня клиенты даже в буквальном смысле спорят за оплату по 14 долларов за GPU в час — чтобы захватить оппортунистические инстансы по цене AWS p6-b200. Некоторые ведущие Neocloud-провайдеры уже перестали продавать single-node; некоторые цены на продление контрактов по H100, как выяснилось, полностью совпадают с ценами, зафиксированными при подписании двух-трехлетней давности. А еще часть контрактов по H100 была напрямую продлена вплоть до 2028 года — срок аренды до 4 лет. Сейчас найти даже кластер на 8 узлов (64 GPU) с H100 или H200 не так просто: среди провайдеров, к которым мы обращались, половина уже полностью распродана, а большинство ответов звучит так: «Нет никаких Hopper GPU, которые в ближайшее время закончатся по контрактам и освободятся».

Мы даже слышали, что некоторые арендаторы вычислительных мощностей начали разбирать свои арендованные кластеры и снова сдавать их в подаренду — это почти как разбор квартир на короткую аренду во время Гран-при в Монако. Будет ли дальше появляться так называемый «Neocloud второй этаж», вероятно, уже не только шутка.

Поставка Blackwell также крайне напряженная. Мы узнали, что из-за сильного спроса на open-source модели с весами, а также из‑за продолжающегося взрывного роста спроса на инференс, сроки развертывания и доставки новых кластеров Blackwell сейчас растянулись до периода с июня по июль. Более того, большинство из тех кластеров, которые скоро выйдут в эксплуатацию, уже заранее забронированы. Фактически, по всему рынку: до тех пор, пока в августе–сентябре 2026 года не появятся новые мощности, практически все доступные к этому моменту ресурсы уже зарезервированы.

Арендные цены GPU: «возвращение волны»

Но почему рынок дошел до этой точки? Ровно за 6 месяцев до этого большинство наблюдателей все еще сомневались в «конечной стоимости» GPU и в целом считали, что цены аренды GPU неизбежно будут продолжать падать со временем. Тогда, если бы Neocloud или сверхкрупные облачные провайдеры закладывали в финансовые модели 6-летний срок амортизации для обработки GPU-активов по мощности, их даже могли бы критиковать финансовые аналитики. Прежде чем обсуждать будущие тренды, давайте сначала кратко вспомним, как именно все эволюционировало до этого момента.

До второй половины 2025 года основной прогноз всей экосистемы был таким: по мере масштабного развертывания Blackwell, а также из‑за того, что стоимость вычислений на единицу у него существенно ниже, арендные цены Hopper (то есть H100 и H200) заметно пойдут вниз. Но на практике все оказалось наоборот. Во второй половине 2025 года спрос на H100 не только не ослаб, а в большинстве сценариев даже усилился. Быстрое распространение открытых моделей весов и ускорение спроса на инференс стали самыми ранними сигналами этой почти бесконечной волны спроса на вычислительные мощности.

В январе 2026 года рынок вычислительных мощностей столкнулся со следующим переломом: после нескольких кварталов быстрого роста цен DRAM и NAND они начали переходить в фазу почти «параболического» всплеска. Согласно нашим моделям хранения, в первом квартале 2026 года контракты на LPDDR5 и DDR5 показали рост год к году, близкий примерно к 4 разам и 5 разам соответственно.

Чтобы снизить риск потери маржинальности из‑за резкого роста стоимости комплектующих, OEM-производители начали поднимать цены на AI-серверы, причем масштаб повышения был заметно выше, чем рост цен на базовые комплектующие. Это сделало решения о капитальных затратах (capex) на кластеры еще более сложными: более высокая стоимость закупки серверов сжимает ожидаемую отдачу проекта, заставляя часть операторов замедлять развертывание, а иногда и полностью отказываться от запусков. В итоге часть того нового предложения, которое могло выйти на рынок, была отложена или заморожена — и это еще больше усилило напряженность на рынке аренды.

В условиях закупочного хаоса, вызванного «выходом из-под контроля ценообразования AI-серверов», спрос на аренду GPU существенно ускорился: почти все остававшиеся на рынке вычислительные мощности были полностью поглощены в январе и феврале. К марту практически невозможно было найти доступные мощности в рамках любого срока аренды — будь то H100, H200 или B200. Арендная цена на один год уже в конце января пересекла отметку 2 доллара за GPU в час, а в середине-конце февраля по сравнению с концом января снова выросла на 15%–20%; ожидается, что к концу марта она снова вырастет на 15%–20% к предыдущему месяцу.

Один из важных драйверов спроса в начале этого года — нативная генерация контента (native media generation). Приложения вроде Seedance и Nano Banana подталкивают пользователей масштабно генерировать и итеративно дорабатывать изображения и видео, тем самым существенно повышая токен-трафик (token throughput). Но более ключевой и заметный источник спроса — рост multi-agent рабочих нагрузок: такие системы выполняют многoшаговые процессы, непрерывно итеративно улучшаются в среде высокой параллельности и тем самым приводят к «экспоненциальному» росту потребления токенов и спроса на вычислительные мощности.

Эта тенденция особенно наглядно проявляется в данных по Claude Code — мы уже упоминали об этом в нескольких материалах. Например, в SemiAnalysis за последние 7 дней внутри компании было потреблено несколько миллиардов токенов; средняя стоимость — около 5 долларов за каждый миллион токенов. Но эффект в виде экономии времени, расширения рабочих процессов и роста возможностей намного превышает саму стоимость. Сейчас SemiAnalysis встроила целый набор AI-инструментов в несколько рабочих процессов: это уже не только простые поиск и суммаризация, а сценарии вроде информационных дашбордов по данным, автоматизированного сбора, обработки больших объемов данных и финансового моделирования на основе агентов.

Мы также отслеживаем этот взрывной рост спроса с помощью таких метрик, как количество ежедневных коммитов Claude (Claude Commits Daily). По текущим трендам мы ожидаем, что к концу 2026 года Claude Code будет занимать более 20% всех кодовых коммитов. Можно сказать, что в то время, пока ты еще не успел это заметить, AI уже начал «пожирать» весь процесс разработки ПО. Для институциональных клиентов, которые хотят получить этот датасет, мы можем связать вас с нашей API-командой. Небольшая подсказка заранее: этот объем коммитов уже заметно выше уровня, который был при нашем первом релизе.

В нашем кругу почти каждый — активный пользователь Claude Code. Но мы также понимаем, что сам этот круг глубоко погружен в AI и полупроводники — в сущности, это лишь небольшая «передовая группа».

Для многих компаний из списка Fortune 500 и более широкой публики Claude Code и «мир агентов» — это просто слегка любопытная периферийная тема, время от времени возникающая в Facebook-ленте или в подкастах NPR. Они почти не осознают, что волна производительности и структурных ударов, движимая агентами, уже приближается.

По мере того как все больше участников реальной экономики начинают осознавать удивительную отдачу от инвестиций, связанную с использованием AI-инструментов, и присоединяются к этой «волне вычислительных мощностей», потребление токенов будет продолжать расти ступенчато. Спор об эффективности затрат на AI фактически уже завершился: ценность, создаваемая с помощью AI-инструментов, часто достигает уровня на порядок выше их стоимости. На этом фоне постоянный сдвиг кривой спроса на токены вправо формирует сильную силу, (на текущем этапе) относительно слабоэластичную — и это продолжает подталкивать цены на аренду GPU вверх.

Проще говоря: если инвестиционная отдача от AI-инструментов может достигать 5–10 раз, то у цен аренды GPU по‑прежнему есть существенный потенциал роста — только это сможет реально начать сдерживать спрос. Мы также не исключаем, что дальнейший рост арендных цен будет продолжать передаваться вверх по цепочке, повышая стоимость серверов и ключевых компонентов.

Публикация индекса цен аренды GPU H100 на один год от SemiAnalysis

Сегодня мы бесплатно открываем для широкой публики индекс цен на аренду контрактов SemiAnalysis по H100 на один год — чтобы повысить понимание рынком трендов цен аренды GPU и улучшить прозрачность.

Индекс построен на основе ежемесячных опросных данных более чем от 100 участников рынка (включая Neocloud-провайдеров, покупателей и продавцов вычислительных мощностей) — для определения репрезентативного интервала цен аренды GPU (25-й–75-й перцентили). Одновременно мы проводим перекрестную проверку на основе реальных данных сделок и, в собственной сети, сводим стороны сделок (покупателей и продавцов), напрямую участвуя в части сделок, чтобы дополнительно калибровать уровень цен.

С 2023 года мы продолжаем отслеживать контракты по GPU, включая H100, H200, B200, B300, GB200, GB300, в рамках сроков аренды от 3 месяцев до 5 лет; также мы включаем соответствующие данные по серии AMD (MI300, MI325, MI355).

По сравнению с уже существующими на рынке GPU-индексами, индекс SemiAnalysis по контрактным ценам H100 на один год имеет несколько ключевых отличий:

Во‑первых, многие индексы аренды GPU опираются на котировки спот/по требованию (spot/on-demand) или на публичные листинговые цены, но на практике подавляющее большинство сделок по аренде GPU реализуется через долгосрочные контракты — обычно со сроком 6 месяцев и более. Такие цены формируются в ходе двусторонних переговоров и не отражаются ни в каких публичных базах данных. Большинство крупных Neocloud-провайдеров предпочитают заключать аренду минимум на 1 год; 2–3 года — еще более предпочтительно; а если можно договориться о 5-летнем крупном пакете (bulk sales) — это еще лучше. Индекс SemiAnalysis по аренде GPU H100 на один год как раз сфокусирован на этом «контрактном рынке» — то есть на сегменте, где сосредоточены наибольшие объемы реальных сделок. За счет того, что индекс явно привязан к конкретному сроку аренды, пользователям проще понять, какой именно рыночный интервал он охватывает, и сравнить это со своими наблюдениями.

Во‑вторых, публично раскрываемые цены не означают реальные цены заключенных сделок. Цены, публикуемые сверхкрупными облачными провайдерами и Neocloud, чаще служат справкой по направлению тренда, а не уровнем реальных сделок. Эти цены обычно отстают от изменений контрактного рынка и часто корректируются уже после того, как спрос на вычислительные мощности фактически сместился. Особенно в on-demand сегменте цены нередко устанавливаются относительно фиксированными — тогда как реальные изменения спроса/предложения проявляются через загрузку (utilization) или через показатель занятости ресурсов (resource occupancy) и корректируются не так часто, только когда это становится необходимо. Механизм этой рынковой модели будет раскрыт далее в статье.

В‑третьих, хотя на рынке существует довольно много индексов, которые умеют обрабатывать крупные массивы котировок, цен и данных сделок и потому обладают преимуществами в анализе трендов, наш подход сильнее подчеркивает прямое взаимодействие с участниками рынка. За каждой котировкой и за каждой сделкой стоит конкретный контекст и логика решений. Мы хотим, помимо представления количественных данных, дополнить их качественными инсайтами и наблюдениями «с передовой», чтобы более полно восстановить реальную структуру рынка аренды GPU.

Для институциональных подписчиков мы также предоставляем полные данные по структуре сроков, охватывающие практически все ключевые сегменты рынка аренды GPU.

Параллельно с публикацией индекса цен на контракты H100 на один год мы также запустили для подписчиков институционального уровня на модели Tokenomics продукт SemiAnalysis Tokenomics Dashboard — для отслеживания и понимания картины в самых передовых AI-моделях. Этот дашборд позволяет пользователям выполнять кастомные сравнения в нескольких измерениях, включая коды, инференс, математику и оценку агентов; сравнивать API-ценообразование разных моделей и провайдеров; а также смотреть ключевые раскрываемые данные основных AI-лабораторий, включая объемы использования токенов, выручку, оценку (valuation) и масштабы клиентов.

Текущая структура рынка аренды GPU

До второй половины 2025 года среда ценообразования на рынке аренды GPU была относительно более конкурентной. Тогда у операторов на руках было больше GPU-инвентаря, а конечный спрос только начинал ускоряться. Поэтому между Neocloud-провайдерами шла острая конкуренция: в целом каждый стремился привлечь клиентов более привлекательными ценами. Их ключевая цель — повышать utilization и, насколько возможно, «выжимать» максимальную ценность из текущих вычислительных активов до наступления следующего цикла итерации GPU.

Но после этого рыночная картина развернулась на 180 градусов. Сейчас Neocloud и сверхкрупные облачные провайдеры полностью контролируют ситуацию: они могут требовать более высокий предоплатный взнос, предлагать более выгодное ценообразование, удерживать более длительные сроки контрактов, а также по своему усмотрению выбирать даты начала и окончания контрактов — чтобы лучше сопоставить собственные запасы и планы по мощностям. При этом время также на стороне предложения: они могут продвигать развертывание в своем темпе и, находясь в среде постоянно растущих цен, постепенно отбирать наиболее качественную комбинацию клиентов.

С точки зрения структуры рынок аренды GPU в целом можно разделить на три крупные части — каждой соответствует свой тип потребностей клиентов:

Краткосрочная аренда: on-demand, spot и контракты сроком до 3 месяцев

Среднесрочные контракты: контракты сроком от 3 месяцев до 3 лет и более

Долгосрочный offtake: контракты на 4–5 лет, при этом наиболее распространен срок 5 лет

Краткосрочная аренда: on-demand, spot и контракты до 3 месяцев

Краткосрочная аренда располагается в самом начале структуры всех сроков аренды и во многих случаях соответствует «оставшимся мощностям» (remaining capacity). Однако часть провайдеров (например, Runpod, Lambda) специализируются на предоставлении заметного объема вычислительных мощностей с высокой гибкостью именно в формате on-demand или spot.

Важно отметить, что механизм ценообразования в on-demand сегменте существенно отличается от других контрактных рынков. Обычно провайдер устанавливает для on-demand ресурсов относительно фиксированный уровень цен и меняет его лишь в редких случаях. Другими словами: цены краткосрочного рынка не полностью управляются текущим соотношением спроса и предложения в реальном времени, а в большей степени отражают степень напряженности рынка через изменения utilization.

Провайдеры обычно корректируют цены единоразово в зависимости от utilization: когда загрузка низкая, они снижают цены, чтобы стимулировать спрос; а когда utilization приближается к полной загрузке, они повышают цены, потому что даже при более высоком уровне цен спрос все равно удерживается на высоком уровне.

Это также объясняет, почему по временным рядам опубликованные Neocloud on-demand цены часто долго остаются неизменными, а затем внезапно демонстрируют «скачкообразное» повышение или понижение. Для on-demand сегмента то, что действительно с высокой частотой отражает изменения спроса, — это не цена, а уровень загрузки ресурсов.

Среднесрочные контракты (Mid-Term Contracts)

С экономической точки зрения, куда более важным является именно «контрактный рынок», потому что подавляющая часть ценности сделок по аренде GPU возникает в этом сегменте. Особенно важны годовые контракты: они отражают предельный спрос (marginal demand) со стороны клиентов, не относящихся к AI-лабораториям, а также показывают эффект overflow-сопутствующего спроса со стороны крупных клиентов; поэтому это самый чувствительный индикатор того, насколько рынок сжимается.

AI-нативные компании (AI Natives) и небольшие/средние AI-лаборатории в основном активны в диапазоне 1–3 лет. Но недавняя заметная тенденция состоит в том, что эти институции также начали пробовать фиксировать вычислительные мощности через более долгие контракты: многие уже продвинулись до 4 лет и более; при этом некоторые готовы платить предоплату свыше 20%, что раньше было нехарактерно для контрактов со сроком более 4 лет.

Долгосрочный offtake (Long-Term Offtakes)

На более длинном рынке 4–5 лет доминирующую роль играют крупные AI-лаборатории: они фиксируют крупные объемы вычислительных мощностей еще на ранней стадии. Такие сделки обычно соответствуют кластерам масштаба 50MW, 100MW и даже больше — что приблизительно соответствует 24k–48k GPU GB300 NVL72. В целом эти долгосрочные offtake-соглашения уже занимают заметную долю рынка аренды GPU Neocloud.

AI-лаборатории предпочитают такие контракты, потому что они позволяют один раз зафиксировать большие объемы вычислительных мощностей, чтобы справляться с быстрым ростом конечного спроса. Одновременно эти институции обычно глубоко участвуют в проектировании кластера, включая хранилище, сеть, конфигурации CPU и другие ключевые элементы. Такие сделки часто поставляются в форме **bare metal (голого железа)** — потому что AI-лаборатории обладают достаточной инженерной компетенцией, чтобы на более низком уровне кастомизировать технологический стек и тем самым получить лучшие показатели TCO (совокупная стоимость владения) и производительности.

Для Neocloud-провайдеров такая модель сделок также привлекательна. С одной стороны, они могут концентрировать ресурсы продаж на нескольких крупных заказах и не тратить силы на большое количество мелких клиентов при сопоставимом уровне выручки. С другой стороны, долгосрочные контракты упрощают долговое финансирование (debt financing) на более выгодных условиях: за счет согласования сроков финансирования и срока контракта можно эффективно снизить риск несоответствия сроков (term mismatch) и риск колебаний цен, а в большинстве случаев — зафиксировать внутреннюю норму доходности проекта (IRR) на уровне порядка «двух десятков процентов» (десятки пунктов в процентах).

Кроме того, сверхкрупные облачные провайдеры (Hyperscalers) часто выступают в роли «страхующего покупателя» (backstop): выступая как прямой покупатель у Neocloud, они затем перепродают вычислительные мощности AI-лабораториям. Такая структура выгодна всем сторонам: Neocloud может получать более выгодные условия финансирования, опираясь на контрагента с AAA-рейтингом; а Hyperscalers могут избежать расширения собственного баланса (assets & liabilities) и при этом получить часть дохода проекта за счет предоставления кредитного обеспечения (credit backing).

Ниже приведена таблица, в которой перечислены некоторые из крупных соглашений по offtake, за которыми мы ведем наблюдение. Мы проводим их углубленный анализ, чтобы вывести скрытые почасовые цены GPU ($/hr/GPU), а также ключевые показатели прибыльности — например, IRR проекта, EBIT-margin и другие.

В текущей рыночной среде подавляющее большинство расширяющихся крупных AI-кластеров фактически «переваривается» внутри самих AI-лабораторий. Тем не менее, эти институции продолжают добавлять вычислительные мощности в сегмент контрактов со сроком до 4 лет, одновременно продлением существующих кластеров H100 и H200 они косвенно препятствуют тому, чтобы предложение снова возвращалось в этот рынок. По мере того как сверхкрупные кластеры GB200 и GB300 будут постепенно выходить в эксплуатацию, вопрос о том, как изменится баланс спроса и предложения на рынке контрактов 1–3 лет, станет переменной, за которой особенно стоит наблюдать дальше.

«Куда покатится шайба» (Where The Puck is Going)

Самое бросающееся в глаза — очевидное расхождение между базовой рыночной реальностью и рыночными настроениями. Хотя сигналы о сжатии предложения и росте цен уже очень ясны (что должно быть позитивно для Neocloud: расширение маржинальности и продление срока полезного использования активов), публичные рынки становятся все более пессимистичны в отношении компаний вроде CoreWeave, Nebius и Iris Energy — их акции сейчас по‑прежнему находятся на низких уровнях относительно диапазона последних 6–12 месяцев.

Рынок по‑прежнему во многом управляется нарративом «в конечном итоге произойдет переизбыток предложения и товаризация вычислительных мощностей», но эти изменения не снимают фундаментальную обеспокоенность инвесторов относительно долгосрочной ценности GPU. Однако по данным «с линии фронта» постоянная нехватка предложения и усиление влияния на ценообразование означают, что практически все вычислительные мощности в данный момент находятся в состоянии «поглощения» со стороны спроса — даже при наличии различий по производительности, в текущей экстремально дефицитной среде спрос все равно превышает предложение.

Три ключевых точки наблюдения в будущем

Чтобы понять, будет ли цена аренды GPU продолжать удерживаться на высоком уровне, можно сфокусироваться на трех переменных:

Темп расширения кластеров GB300 (2026)
Ключевым является относительная скорость между появлением новых вычислительных мощностей и спросом на токены — будет ли предложение снижать напряженность или спрос продолжит опережать предложение. Это напрямую повлияет на то, продолжат ли AI-лаборатории участвовать в рынке контрактов до 4 лет, и на динамику цен в этом сегменте.
Ухудшение дефицита чипов
Включая производственные мощности N3 на TSMC, HBM, DRAM, NAND и другие ключевые узлы: любые колебания на уровне производственного исполнения могут еще сильнее сжать предложение.
Темпы роста выручки AI-лабораторий (ARR) и потребления токенов
Расширение коммерциализации AI и рост масштаба использования определят силу конечного спроса — и это ключевая переменная, драйвящая спрос на вычислительные мощности.

Односторонний рост цен, и в ответ растет доходность

В совокупности относительно ясный вывод таков: вероятность того, что цены аренды GPU продолжат расти, выше, чем вероятность отката.

У этого процесса есть ярко выраженный механизм самоподкрепления: когда Neocloud видит, что предложение сжимается и цены растут, он заранее фиксирует больше оборудования, тем самым еще сильнее сокращая рыночное предложение и поддерживая рост цен. Это похоже на GPU-дефицитный цикл 2023–2024 — тогда нехватка предложения позволила OEM получить заметное расширение прибыли и поднять цены на серверы (хотя уровень зрелости рынка в этот раз выше, и поэтому процесс может не повториться полностью).

Одновременно повторный рост цен аренды GPU улучшает капитальную отдачу Neocloud (ROIC):

С одной стороны, повышается маржинальность уже развернутых активов

С другой стороны, продлевается экономический жизненный цикл GPU, позволяя капиталу генерировать денежный поток дольше

Кто сейчас крупнейший бенефициар?

Самые прямые бенефициары — провайдеры вычислительных мощностей, обладающие следующими характеристиками:

· Доля краткосрочных контрактов является основной (возможна быстрая переоценка цены)

· Большой объем складских запасов H100

· В ближайшее время введение новых мощностей

Neocloud с моделью краткосрочной аренды может быстрее освобождать старые контракты и перезаключать их по более высоким ценам, быстро реализуя расширение прибыли. При этом сверхкрупные облачные провайдеры и Neocloud, заранее зафиксировавшие мощности следующего поколения (много лет через долгосрочные контракты), тоже выиграют в следующем цикле.

Тогда возникает вопрос: на этот раз это правда будет «по‑другому»?

Почему цены на GPU стремительно растут?

Популярные темы

GateSquareAprilPostingChallenge

WeekendCryptoHoldingGuide

IsraelStrikesIranBTCPlunges

CryptoMarketSeesVolatility

OilPricesRise

Горячее на Gate Fun

Oil

oil.T

卐

大侠

T

T0M

lio

lio

TRUMD

TRUMD

Закрепить