Mensagem do Gate News, 22 de abril — A Google Cloud anunciou o lançamento de chips (Tensor Processing Unit) (Unidade de Processamento de Tensor) personalizados de sua oitava geração, baseados em TPU, em 22 de abril. A nova linha inclui a TPU 8t, projetada especificamente para tarefas de treinamento de IA, e a TPU 8i, otimizada para cargas de trabalho de inferência de IA. Ambos os chips estarão disponíveis mais tarde este ano. A Google também divulgou novas ferramentas para construir agentes de IA e anunciou um fundo de $750 um milhão para impulsionar a adoção de IA por empresas.
A TPU 8t oferece 2,8 vezes o desempenho do TPU Ironwood da geração anterior da Google, pelo mesmo preço. A TPU 8i melhora o desempenho em 80% em relação à predecessora e incorpora uma arquitetura de memória estática de acesso aleatório (SRAM) para entregar “alto throughput em larga escala e baixa latência, possibilitando que milhões de agentes sejam executados simultaneamente”, de acordo com o CEO Sundar Pichai. Em comparação com a Ironwood, tanto a TPU 8t quanto a TPU 8i atingem mais do que o dobro da eficiência desempenho-por-watt, com a TPU 8t melhorando em 124% e a TPU 8i em 117%. A Google otimizou a eficiência energética em toda a pilha de tecnologia e integrou sistemas de gerenciamento de energia dinâmicos que ajustam o consumo com base na demanda em tempo real.
Os modelos de primeira parte da Google agora processam mais de 160 bilhões de tokens por minuto por meio de chamadas diretas à API do cliente, acima dos 100 bilhões no trimestre passado. A IA agora gera 75% de todo o novo código na Google, em comparação com 50% no outono do ano passado. O Gemini Enterprise, oferta corporativa da Google, cresceu 40% de um trimestre para o outro em usuários ativos mensais pagantes. A empresa espera investir um pouco mais da metade do orçamento de computação de machine learning em serviços de nuvem até 2026 para melhor atender clientes e parceiros de nuvem. A Google também está expandindo sua colaboração com a Broadcom para desenvolver e fornecer chips de TPU personalizados para gerações futuras, enquanto grandes empresas de tecnologia buscam alternativas a GPUs caras e com oferta limitada da NVIDIA e da AMD.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
66,3% dos funcionários dos EUA com alta renda usam ferramentas de IA no trabalho, mostra pesquisa do Federal Reserve
De acordo com uma pesquisa do Federal Reserve, 66,3% dos funcionários dos EUA que ganham mais de US$ 200.000 por ano usaram ferramentas de IA no trabalho nos últimos 12 meses, em 1º de maio. Entre faixas de renda mais baixas, as taxas de uso diminuem significativamente: 51,6% para aqueles que ganham US$ 100.000–US$ 200.000, 40,2% para aqueles que ganham US$ 50.000–US$ 100.000,
GateNews20m atrás
xAI lança a API do Grok 4.3 com janela de contexto de 1M tokens a US$ 1,25 por 1 milhão de tokens de entrada
De acordo com a BlockBeats, a xAI lançou a API do Grok 4.3 em 1º de maio. O novo modelo oferece uma janela de contexto de 1 milhão de tokens e conta com entrada/saída de texto, recursos multimodais e funcionalidades de chamada de ferramentas. A API do Grok 4.3 custa US$ 1,25 por 1 milhão de entrada
GateNews32m atrás
Gigantes de tecnologia dos EUA devem gastar $700B em infraestrutura de IA em 2026, superando muito os US$ 105B da China
De acordo com o South China Morning Post, gigantes da tecnologia dos EUA devem gastar mais de US$ 700 bilhões em infraestrutura de IA este ano, superando em muito seus pares chineses. Google, Microsoft, Meta e Amazon respondem pela maior parte desse total, enquanto a Morgan Stanley estimou que os provedores de nuvem chineses gastariam cerca de US$ 105 bill
GateNews37m atrás
A Huawei espera que a receita de chips de IA em 2026 atinja US$ 12 bilhões, acima de 60% em relação a 2025
De acordo com a Reuters, a Huawei espera que a receita de suas chips de IA de 2026 chegue a aproximadamente US$ 12 bilhões, representando pelo menos um aumento de 60% em relação aos US$ 7,5 bilhões de 2025. A maior parte dos pedidos deste ano é para o processador Ascend 950PR, que entrou em produção em massa em março. A empresa planeja lançar um
GateNews1h atrás
NVIDIA investe na startup sueca de legaltech de IA, Legora; Jude Law é o embaixador global da marca
A Nvidia faz um investimento de expansão na rodada Series D da Legora no valor de US$ 50 milhões, elevando o total captado da Legora para US$ 600 milhões e a avaliação para US$ 5,6 bilhões. Atlassian, Adams Street Partners e Insight Partners participam. A Legora se concentra em legaltech de IA, oferecendo ferramentas como revisão automatizada, análise de contratos e pesquisa jurídica. O ARR ultrapassa US$ 100 milhões, e o número de funcionários cresce de 40 para 400. Jude Law se torna o porta-voz global da marca, com o slogan publicitário “Law just got more attractive”.
ChainNewsAbmedia1h atrás