Недавно я увидел эту новость: в конце прошлого года NVIDIA приобрела бизнес по чипам для вывода inference у Groq, и логика этой сделки довольно интересна.



Huang Renxun впервые подробно объяснил на конференции GTC в этом году, почему он решил купить Groq. В общем, он заметил, что рынок inference начинает раскалываться. Раньше все оптимизировали чипы для inference с единственной целью: увеличить пропускную способность. Но сейчас ситуация изменилась: разные пользователи готовы платить разную цену за разную скорость отклика.

Здесь очень важна логика — если я могу обеспечить разработчиков более быстрым откликом токена, повысить их рабочую эффективность, они будут готовы за это платить. Этот рынок с высокой ценностью и низкой задержкой — это действительно недавно появившаяся возможность. Huang назвал это расширением парето-границы inference-рынка: раньше это была стратегия с высокой пропускной способностью, а теперь добавляется новая ниша — решения с низкой задержкой и высокой ценой за единицу.

Groq как раз является экспертом в этой области. Их архитектура LPU славится своей предсказуемой низкой задержкой, что полностью дополняет направление высокопропускной способности GPU от NVIDIA. В марте был выпущен Groq 3 LPU, выполненный по 4-нм техпроцессу Samsung, и его inference-способность на моделях с триллионами параметров превышает Blackwell NVL72 на 35 раз — разница в производительности действительно впечатляет.

С точки зрения продуктовой линейки, эта покупка заполняет пробел NVIDIA на рынке inference. Представьте: одна и та же модель, разные стратегии ценообразования в зависимости от времени отклика — чуть меньшая пропускная способность, но более высокая цена за единицу компенсирует это. Присоединение Groq позволяет NVIDIA иметь более полное покрытие inference-рынка. Эта сделка с стратегической точки зрения выглядит очень ясно.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить