torygreen

vip
Idade 2.8 Ano
Nível máximo 0
Ainda sem conteúdo
Algo mudou discretamente na computação de IA este ano, e isso altera o propósito real da construção da infraestrutura.
Em 2023, 2/3 da computação de IA foi para o treino, o trabalho efetivo de construir um modelo. A fatia mais pequena foi para a inferência, o trabalho de o executar depois de construído. Mas essa proporção começou discretamente a inverter-se.
A inferência representa agora 2/3 e continua a subir, segundo a Deloitte, e os chips construídos para a executar ultrapassaram $50B este ano.
A principal razão pela qual esta inversão é importante (e não apenas em termos percentuais): o t
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Há dois anos, um modelo aberto neste gráfico estaria perto do fundo. Os laboratórios fechados estavam gerações à frente, e esse fosso era a razão principal pela qual as pessoas alugavam modelos em vez de possuir um.
Agora, o GLM-5.2 está no 51.º lugar do índice @ArtificialAnlys.
Pesos abertos, laboratório chinês, quinto no geral. E tira a Fable da lista por não estar disponível, e o modelo de pesos abertos está muito mais perto do topo do que o ranking deixa transparecer.
O argumento para os fechados sempre foi a liderança. Pagar a API, aceitar os termos, construir em algo que não controlas, p
GLM2,88%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Eis a divisão do poder computacional de IA que poucos estão a interpretar corretamente.
O treino de fronteira está a concentrar-se mais a cada trimestre, milhares de GPUs que têm de estar num único local interligados. Mas o treino representa apenas 30% da procura em 2026. Os outros 70% são inferência, e executá-la num hyperscaler significa pagar por infraestrutura construída para a tarefa mais difícil para fazer a mais fácil.
Em redes distribuídas, essa mesma inferência pode ser 45-75% mais barata e, para quem dimensiona um orçamento de infraestrutura de IA, essa diferença é toda a história.
O
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Tenho pensado nas recentes notícias do GLM 5.2 e no ângulo dos pesos abertos que toda a gente está a seguir, mas estão a perder um ângulo completamente diferente aqui.
Toda a gente está focada no facto de um laboratório chinês ter atingido desempenho de ponta e ter aberto o código, mas a parte que vale a pena considerar é como.
A ZAI e o resto dos laboratórios chineses foram cortados da Nvidia no início de 2025, por isso, presumivelmente, não têm tido H100s nem H200s diretamente desde então.
Eles ultrapassaram $128B num modelo treinado provavelmente em silício chinês que fica a poucos p
GLM2,88%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
95% da capacidade de GPU empresarial está atualmente ociosa.
Esse número vem da Cast AI, que mediu 23.000 clusters de produção reais, não uma pesquisa genérica.
A utilização média era de 5% e isso está acontecendo no exato momento em que a Nvidia aumentou os preços do H200 em 15%, o primeiro aumento em 20 anos. O hardware que todos dizem ser escasso está na maior parte sem fazer nada.
Se você está tentando entender por que o cálculo parece impossível de obter, é por isso. Ninguém devolve uma alocação pela qual esperaram meses. Então a frota fica a 5%, cobrada por hora, e a escassez se al
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Algumas grandes movimentações na política de IA da UE estão supostamente chegando, mas aqui está a realidade da infraestrutura com a qual eles estão trabalhando.
> Investimento em infraestrutura de IA soberana da UE em 2026: 12,6 bilhões de dólares.
> Capex de hyperscalers nos EUA no mesmo ano: 725 bilhões de dólares.
A Europa gastou seis anos construindo 19 Fábricas de IA e 14 supercomputadores e só a Amazon gastará mais que todo esse esforço em duas semanas este ano.
A maioria das equipes de IA europeias não usam infraestrutura europeia. Elas alugam de Virgínia e Iowa e pagam um prêmio de co
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Não esperava que este número surgisse este ano.
O GitHub está a caminho de atingir 14 mil milhões de commits em 2026 até agora.
Isso é um aumento de 1 mil milhão em 2025.
Um aumento de 14 vezes num único ano e a maior parte dele não é escrita por humanos.
A carga tornou-se tão severa que a Microsoft, que possui e gere a segunda maior nuvem do mundo, teve que encaminhar o tráfego através da AWS para manter a plataforma online.
Nove incidentes de serviço só em maio.
A disponibilidade caiu para 88,4%.
Para todas as equipas de engenharia, fornecedores de infraestrutura e provedores d
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A receita da Nvidia é a prova de que a “computação agentic” não é uma teoria. Já está na demonstração de resultados.
$26B há quatro anos. 215,9 mil milhões de dólares no ano passado. Esse aumento de 8x aconteceu enquanto a maior parte da IA ainda estava sentada numa caixa de chat à espera de você fazer uma pergunta.
A parte importante não é apenas o crescimento. É que a Nvidia transformou a sua arquitetura na entrada não negociável para o roteiro de quase todos os outros. Laboratórios, nuvens, empresas. Logos diferentes na API, o mesmo silício por baixo. Quase cada dólar gasto em infraestr
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Não esperava que o número de cinco anos da Goldman fosse tão grande.
Cinco hyperscalers estão projetados para gastar 5,3 trilhões de dólares em infraestrutura de IA entre 2025 e 2030. Em 2022, gastaram $162B combinados.
Este ano, estão no caminho para atingir 725 bilhões de dólares. Até 2027, os analistas projetam 1 trilhão de dólares em um único ano.
Para quem constrói produtos ou infraestrutura de IA fora dessas cinco balanças, essa trajetória é o número mais importante nas suas premissas de planejamento.
A diferença entre o que eles podem implantar e o que todos os outros podem ace
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Todos previram que a IA assumiria primeiro o trabalho administrativo repetitivo. Os dados dizem algo diferente.
A tomada de decisão agora representa 28% da atividade de IA no local de trabalho.
O caso de uso número um não é automação. É julgamento.
As pessoas estão usando IA para analisar opções, pesar compensações e apoiar conclusões pelas quais são responsáveis, e essa mudança importa além da questão do mercado de trabalho.
Cargas de trabalho baseadas em julgamento funcionam continuamente, exigem mais contexto por sessão e não agrupam de forma eficiente.
Os requisitos de infraestru
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Millionairetasks:
Ótima oportunidade para todos estarem
Infraestrutura global de nuvem no primeiro trimestre de 2026. 129 bilhões de dólares em um único trimestre. Crescendo 35% ao ano.
O mercado está se expandindo rapidamente, mas a concentração não está mudando. AWS, Azure e Google Cloud mantiveram aproximadamente a mesma participação há dois anos que possuem hoje, mas a diferença absoluta entre eles e todos os outros é maior em termos de dólares do que nunca foi.
Essa é a parte que o gráfico de porcentagem não mostra. A fatia dos Outros não está crescendo para se tornar uma alternativa real. Ela permanece proporcionalmente igual enquanto os três
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A PJM gere a rede elétrica em 13 estados dos EUA e 65 milhões de pessoas. É o maior mercado de eletricidade por atacado competitivo do mundo.
O preço de liquidação do mercado de capacidade, a taxa que indica se o fornecimento futuro de energia pode atender à demanda, passou de $28,92 por MW em 2024 para $329,17 em 2026. Dois ciclos de leilão.
A demanda dos centros de dados foi identificada como o principal impulsionador. O leilão de 2027/2028 acabou sendo liquidado a $333,44, com a PJM atribuindo diretamente 5.100 MW do aumento de carga aos centros de dados.
Isso não é um choque de ofert
Ver original
post-image
  • Recompensa
  • 2
  • Republicar
  • Partilhar
DiveNate:
2026 GOGOGO 👊
Ver mais
Dois números deste gráfico.
Preço da API de IA: caiu 96% desde 2022.
Capex de hyperscaler: aumentou 12 vezes no mesmo período.
A maioria das pessoas vê o primeiro número e chama-lhe democratização, mas ninguém está a construir uma estratégia em torno do segundo.
Não é uma coincidência. É uma jogada de captura estrutural.
Cada startup de IA que celebra modelos baratos está a correr em computação que não possui, numa infraestrutura que não consegue replicar, controlada por três empresas.
IA soberana começa com infraestrutura soberana. Todo o resto é apenas uma dependência com preço m
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Yuhuan:
gsgsgshsokzkzkzkxhxj
A coisa que a sexta-feira revelou não é que os governos podem desligar modelos de IA.
É que toda a base de utilizadores global dos modelos mais capazes do mundo está por trás de uma única decisão operacional de uma única empresa respondendo a uma única diretiva. Sem redundância ou aviso.
Três das maiores empresas de IA controlam atualmente 88% do acesso à IA de fronteira e uma superfície de conformidade para tudo isso.
O que a sexta-feira tornou visível é que, quando o acesso ao cálculo e ao modelo está dentro de um punhado de empresas, toda a pilha herda o seu único ponto de falha. Isso
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Em 2024, o mapa de computação de IA tinha duas superpotências. EUA com 53,7 GW, China com 31,9 GW.
Em 2026, a China está com 2,5 GW.
Isso é uma demolição controlada da capacidade de infraestrutura de IA de uma nação através de política de exportação. Sem bombas, sem sanções, apenas regras de chips.
O que isso prova é que a computação agora é uma arma geopolítica. Qualquer país que não possui sua infraestrutura não quer descobrir como é estar na linha de recebedor dessa arma.
A questão não é se a computação descentralizada vence. É se ela chega antes da próxima decisão de política reest
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A maior oferta pública inicial de tecnologia dos anos 2000 foi a Visa, com 28 bilhões de dólares. A maior dos anos 2010 foi a Alibaba, com 168 bilhões de dólares. Aproximadamente 6x por década.
Agora, estenda a linha. OpenAI e Anthropic já estão em $1T antes mesmo de serem listadas.
Se somar os maiores estreias tecnológicas dos últimos 25 anos. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, todos eles. Você chega a aproximadamente 800 bilhões de dólares.
OpenAI + Anthropic sozinhas valem quase 2 trilhões de dólares. Ainda privadas. 2,5x maiores do que um quarto de s
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Durante a maior parte da história, o capital crescia através de máquinas.
Agora, cresce através da cognição.
Uma startup pode despertar com o equivalente a um milhão de analistas, investigadores, programadores e estrategistas a trabalhar em paralelo com um custo marginal quase zero.
A revolução da IA é diferente de qualquer revolução técnica anterior.
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
não se pode fazer uma emissão aberta e tratar a parte aberta como opcional uma vez que o dinheiro aparece
o julgamento começou com uma questão: pode-se criar uma organização sem fins lucrativos, chamar a OpenAI de sua missão, atrair 10 anos de engenheiros motivados pela missão e capital de doações com essa promessa, e depois converter para uma estrutura com limite de lucro e chamá-la de uma evolução?
elon deixou a OpenAI em 2018. os danos que $130b está pedindo vão para a organização sem fins lucrativos. seja qual for a sua opinião sobre ele como litigante, a questão que o caso força a entrar
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a nvidia é agora maior do que toda a economia do Japão e a sua conta de IA é a razão
cada dólar que você gasta em IA agora passa por chips de uma única empresa, em três nuvens que os revendem com uma margem
> startups de IA queimam cerca de 80% do seu capital levantado apenas para alugar computação
> já vi equipes em estágio inicial pagando 700 mil dólares por mês a um único fornecedor de chips
> centros de dados operam com 12-18% de capacidade enquanto a sua conta aumenta a cada trimestre
toda a indústria acabou de concordar em ficar numa fila e entregar dinheiro ao mesmo posto de pedágio
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a multidão de que acredita que a IA está sobreconstruída nunca tentou comprar um h100 neste trimestre
passar uma semana tentando comprar h100s agora significa: compromisso de 12 meses na aws (utilização 24/7 bloqueada antes de você ver um único gpu), lista de espera no gcp sem ETA, lambda e coreweave ambos esgotados, todos os provedores menores dando a mesma resposta em palavras diferentes
a construção de hyperscalers é medida em anos, as escassezes de CPU estão parando as GPUs que existem, e a demanda continua crescendo enquanto os hyperscalers solicitam permissões
equipes de IA em está
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
  • Fixado