我最近注意到,英伟达在推理市场采取了一个非常重要的战略举措。在去年12月,它以20亿美元收购了Groq的推理芯片部门,Groq的创始人乔纳森·罗斯及其团队加入了英伟达,而Groq则继续作为独立公司从事其他业务。



真正值得关注的是,黄仁勋刚刚解释了这一决定背后的真实原因。驱动因素不仅仅是为了获取技术,而是对整个推理市场进行重新分层。过去,所有努力都只集中在一个方面:提升生产力。但现在局面发生了彻底的改变。

如今,不同的用户已经准备好根据完全不同的响应速度支付不同的价格。如果我是软件工程师,而我希望更快的(tokens)响应速度让我能更高效地工作,那么我愿意为此支付溢价。这个市场在多年前并不存在,但现在它正强势出现。

在3月的GTC大会上,英伟达发布了收购后的第一款芯片:Groq 3 LPU,采用三星的4纳米工艺制造。性能确实令人惊叹——在“万亿参数模型”上,推理每兆瓦的产出最高可达Blackwell NVL72的35倍。

英伟达正在做的事情,是在市场版图中新增一个全新的板块:低延迟与高价格。Groq的LPU架构以其低且可预期的延迟而闻名,这与英伟达现有的高生产力路线形成了完美互补。尽管生产力可能更低,但每单位的价格足以轻松弥补这一点。收购Groq确实填补了推理产品中缺失的那块空白。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论