Google Lança Chips de IA Separados para Treinamento e Inferência, Aumentando o Desempenho em 2,8x

Mensagem do Gate News, 23 de abril — A Google anunciou em 22 de abril que lançará chips separados de TPU de oitava geração para treinamento e inferência ainda este ano, substituindo seu projeto anterior combinado. A iniciativa mira cargas de trabalho de agentes de IA e oferece aos clientes da Google Cloud uma alternativa ao hardware da Nvidia.

O chip de treinamento entrega 2,8 vezes o desempenho da TPU Ironwood de sétima geração da Google pelo mesmo preço, enquanto o chip de inferência é 80% mais rápido e traz 384 MB de SRAM, o triplo da quantidade na Ironwood. A separação das capacidades de treinamento e inferência reflete uma mudança na forma como as empresas otimizam para diferentes demandas computacionais.

A iniciativa é apoiada por uma parceria de longo prazo com Broadcom e Anthropic. A Anthropic planeja usar aproximadamente 3,5 gigawatts de computação com TPU via Broadcom a partir de 2027, com a Broadcom cuidando da fabricação dos chips e dos componentes de rede até 2031. A Anthropic, a startup de IA por trás do Claude, viu sua receita anualizada recentemente ultrapassar $30 bilhões. Enquanto isso, Apple, Microsoft, Meta e Amazon também estão expandindo esforços de chips personalizados de IA para reduzir a dependência da Nvidia, que segue como líder de mercado.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

66,3% dos funcionários dos EUA com alta renda usam ferramentas de IA no trabalho, mostra pesquisa do Federal Reserve

De acordo com uma pesquisa do Federal Reserve, 66,3% dos funcionários dos EUA que ganham mais de US$ 200.000 por ano usaram ferramentas de IA no trabalho nos últimos 12 meses, em 1º de maio. Entre faixas de renda mais baixas, as taxas de uso diminuem significativamente: 51,6% para aqueles que ganham US$ 100.000–US$ 200.000, 40,2% para aqueles que ganham US$ 50.000–US$ 100.000,

GateNews13m atrás

xAI lança a API do Grok 4.3 com janela de contexto de 1M tokens a US$ 1,25 por 1 milhão de tokens de entrada

De acordo com a BlockBeats, a xAI lançou a API do Grok 4.3 em 1º de maio. O novo modelo oferece uma janela de contexto de 1 milhão de tokens e conta com entrada/saída de texto, recursos multimodais e funcionalidades de chamada de ferramentas. A API do Grok 4.3 custa US$ 1,25 por 1 milhão de entrada

GateNews25m atrás

Gigantes de tecnologia dos EUA devem gastar $700B em infraestrutura de IA em 2026, superando muito os US$ 105B da China

De acordo com o South China Morning Post, gigantes da tecnologia dos EUA devem gastar mais de US$ 700 bilhões em infraestrutura de IA este ano, superando em muito seus pares chineses. Google, Microsoft, Meta e Amazon respondem pela maior parte desse total, enquanto a Morgan Stanley estimou que os provedores de nuvem chineses gastariam cerca de US$ 105 bill

GateNews31m atrás

A Huawei espera que a receita de chips de IA em 2026 atinja US$ 12 bilhões, acima de 60% em relação a 2025

De acordo com a Reuters, a Huawei espera que a receita de suas chips de IA de 2026 chegue a aproximadamente US$ 12 bilhões, representando pelo menos um aumento de 60% em relação aos US$ 7,5 bilhões de 2025. A maior parte dos pedidos deste ano é para o processador Ascend 950PR, que entrou em produção em massa em março. A empresa planeja lançar um

GateNews1h atrás

NVIDIA investe na startup sueca de legaltech de IA, Legora; Jude Law é o embaixador global da marca

A Nvidia faz um investimento de expansão na rodada Series D da Legora no valor de US$ 50 milhões, elevando o total captado da Legora para US$ 600 milhões e a avaliação para US$ 5,6 bilhões. Atlassian, Adams Street Partners e Insight Partners participam. A Legora se concentra em legaltech de IA, oferecendo ferramentas como revisão automatizada, análise de contratos e pesquisa jurídica. O ARR ultrapassa US$ 100 milhões, e o número de funcionários cresce de 40 para 400. Jude Law se torna o porta-voz global da marca, com o slogan publicitário “Law just got more attractive”.

ChainNewsAbmedia1h atrás

A Anthropic lança o beta de segurança do Claude para usuários empresariais em 1º de maio

De acordo com a BlockBeats, em 1º de maio, a Anthropic anunciou que o Claude Security, uma ferramenta de segurança de código, abriu testes em beta público para usuários do Claude Enterprise. A ferramenta analisa repositórios de código em busca de vulnerabilidades de segurança, realiza uma verificação secundária para reduzir falsos positivos e realiza automaticamente g

GateNews1h atrás
Comentário
0/400
Sem comentários