Сообщение Gate News, 25 апреля — Дефицит GPU вновь обостряется: крупные облачные провайдеры, включая Microsoft и Amazon, концентрируют вычислительные мощности для внутренних команд и ключевых клиентов вроде OpenAI и Anthropic, из-за чего небольшие AI-стартапы сталкиваются с ростом цен, увеличенными сроками ожидания и более жесткими условиями контрактов. Операционный менеджмент Microsoft Azure сообщил сотрудникам, что время ожидания GPU для облачных клиентов, как ожидается, сохранится до конца 2026 года.
Стартап по генерации изображений Krea, который привлек $83 миллиона от инвесторов, включая Andreessen Horowitz и Bain Capital Ventures, ранее арендовал сотни чипов Blackwell по $2.80 в час по шестимесячному контракту. После продления несколько облачных провайдеров перестали отвечать на запросы; в итоге Krea получила чипы по $3.70 в час — это рост на 32%, а контракт был продлен до одного года. Генеральный директор Виктор Перес отметил, что некоторые вендоры просто не отвечали, тогда как другие настаивали на многолетних обязательствах перед переговорами. Генеральный директор провайдера облачных GPU Lightning AI Уилл Фалькон сообщил, что компания держит в онлайне 40,000 GPU, но примерно 40 клиентов в очереди требуют в сумме 400,000 GPU, при этом арендные цены растут более чем на 25% в течение шести месяцев.
Microsoft внедрила многоуровневое управление доступом к GPU: примерно 1,000 крупнейших клиентов (Tier 1) получают приоритетное распределение, в то время как более мелкие клиенты, которым нужны чипы Blackwell, должны законтрактовать как минимум 1,000 единиц минимум на один год, а контракты начинаются с десятков миллионов долларов. Клиенты с оплатой по факту использования рискуют потерять доступ к GPU, если устройства простаивают в течение нескольких часов. Стартапам, участвующим в бесплатной программе Microsoft for Startups, также сообщили, что при недостаточном использовании GPU доступ может быть отозван.
Фирма венчурного капитала General Catalyst проводит опрос своих портфельных компаний по вопросам узких мест в вычислениях и изучает варианты общих пулов GPU или стратегии коллективных переговоров. Некоторые стартапы рассматривают прямые покупки GPU, чтобы обойти очереди: AI-стартап для нефтяной отрасли Collide планирует потратить около $500,000 на GPU Nvidia, арендовав мощности дата-центра, чтобы работать независимо и избежать неопределенности.
Связанные статьи
CoinShares фиксирует AUM на сумму 7,4 миллиарда долларов в первом годовом отчёте после листинга на Nasdaq
Morgan Stanley выделяет пять причин бычьего настроя по отношению к криптовалютам
Цена XRP сжимается в треугольнике на фоне восстановления притоков по ETF
Ark Invest покупает более 500 тыс. акций Robinhood на фоне просадки крипторынка
Фондовый рынок США взлетел на $6 триллионов в апреле: индекс S&P 500 вырос на 10,4% до рекордных 7 173,91
Riot Platforms переводит 500 BTC на сумму 38,2 млн долларов в NYDIG