Recentemente, vi essa notícia: no final do ano passado, a NVIDIA adquiriu a divisão de inferência de chips da Groq, e a lógica por trás dessa transação é bastante interessante.



Huang Renxun explicou detalhadamente pela primeira vez na conferência GTC deste ano por que decidiu adquirir a Groq. Em resumo, ele percebeu que o mercado de inferência está se diversificando. Antes, todos focavam em otimizar chips de inferência com um único objetivo: maximizar a taxa de transferência. Mas agora a situação mudou; diferentes usuários estão dispostos a pagar preços variados por diferentes velocidades de resposta.

A lógica aqui é crucial — se eu puder oferecer aos desenvolvedores uma resposta de token mais rápida, aumentando sua eficiência de trabalho, eles estarão dispostos a pagar por isso. Esse mercado de alto valor e baixa latência é uma oportunidade que surgiu recentemente. Huang chamou isso de expansão da fronteira de Pareto no mercado de inferência: antes, era uma solução de alta taxa de transferência; agora, há uma nova vertente, que é uma solução de baixa latência e alto preço unitário.

E a Groq é justamente uma especialista nesse campo. Sua arquitetura LPU é conhecida por sua baixa latência determinística, o que é completamente complementar à direção de alta taxa de transferência das GPUs da NVIDIA. A Groq lançou em março a LPU 3, feita com tecnologia de 4nm da Samsung, que tem uma capacidade de inferência em modelos de trilhões de parâmetros 35 vezes maior que a Blackwell NVL72, o que é realmente impressionante.

Do ponto de vista da linha de produtos, essa aquisição preenche uma lacuna no mercado de inferência da NVIDIA. Pense bem: com o mesmo modelo, diferentes estratégias de precificação podem ser aplicadas dependendo do tempo de resposta — embora a taxa de transferência seja um pouco menor, o preço unitário pode compensar. A adição da Groq permite que a NVIDIA tenha uma cobertura mais completa no mercado de inferência. Essa transação, do ponto de vista estratégico, faz bastante sentido.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar