Mensagem do Gate News, 24 de Abril — O engenheiro da OpenAI Clive Chan apresentou objecções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-lhe “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram no tema de discussão mais popular na conferência académica ISCA, ofereceu recomendações específicas alinhadas com normas de interconexão da indústria. Já a V4, em contraste, é muito mais vaga.
Chan contestou sistematicamente três recomendações-chave. No consumo de energia, o relatório sugere que a optimização de software permite que os chips executem simultaneamente em capacidade total computação, armazenamento e comunicação, e recomenda que os fabricantes de chips reservem folga adicional de energia. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por restrições das limitações físicas do processo, pelo que reservar mais margem de energia apenas reduz a frequência de funcionamento, acabando por diminuir o desempenho computacional. No que respeita à transferência de dados de GPU para GPU, o relatório defende um modelo pull—em que as GPUs buscam activamente dados—em vez de um modelo push, citando a elevada sobrecarga de notificações em operações push. Chan contesta isso, sustentando que o pull é na verdade mais lento e que capacidades melhoradas dos adaptadores de rede seriam preferíveis. No entanto, os dois podem estar a discutir camadas diferentes do problema: o relatório trata a sobrecarga do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.
Quanto às funções de activação, o relatório recomenda substituir SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho óptimo usando SwiGLU. Chan suspeita que o DeepSeek pode ter “enfraquecido deliberadamente esta secção.”
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A OpenAI anuncia o lançamento do modelo de cibersegurança GPT-5.5-Cyber nos próximos dias
Segundo a Cointelegraph, Sam Altman anunciou que a OpenAI vai lançar o GPT-5.5-Cyber, um modelo de cibersegurança, nos próximos dias. O modelo será disponibilizado a defensores críticos de cibersegurança, com a OpenAI a planear estabelecer mecanismos de acesso fiáveis em colaboração com entidades governamentais para
GateNews27m atrás
O CEO da Google DeepMind prevê que a AGI chega até 2030, dando às empresas quatro anos para se prepararem
De acordo com a série de vídeos da Sequoia Capital com Demis Hassabis, o CEO da Google DeepMind prevê que a inteligência artificial geral (AGI) vai chegar até 2030. Hassabis, vencedor do Prémio Nobel de Química em 2024, vê este calendário como uma realidade empresarial estrita que obriga os líderes a repensar o produto de
GateNews31m atrás
OpenAI para operar como uma empresa de lucro perpetuamente baixo, assina um contrato de energia de 20 anos
Segundo a Odaily, o CEO da OpenAI, Sam Altman, afirmou no Stripe Sessions que a OpenAI pretende tornar-se uma empresa de infraestruturas massiva e de crescimento rápido, com lucros perpetuamente baixos, oferecendo produtos semelhantes a um “contador inteligente” que os utilizadores podem comprar para automatizar as operações de negócio ou incorporar em
GateNews32m atrás
A Forefront Tech conclui a definição de preços do IPO $100M , para cotar na Nasdaq
De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a fixação do preço de um IPO de 100 milhões de dólares a 30 de abril, com estreia prevista na Nasdaq sob o símbolo FTHAU. Os proventos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras
GateNews1h atrás
Ex-executiva da Meta angaria fundos para a startup de IA Flourish numa valorização de 2,5 mil milhões
Segundo a Bloomberg, Thomas Reardon, ex-executivo da Meta que liderou o trabalho na Neural Band da Meta, está a angariar fundos para a Flourish, uma nova startup de IA focada em sistemas de IA de baixo consumo. A Lux Capital e a Google Ventures acordaram ser investidores de referência, com investidores já a comprometer 500 milhões de dólares a uma avaliação de 2,5
GateNews1h atrás
Os GPU Nvidia Blackwell custam o dobro, mas o custo da inferência por token desce 35x face ao Hopper
De acordo com a mais recente análise do blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas oferecem custos de inferência por token 35 vezes mais baixos. Usando o DeepSeek-R1 como modelo de teste, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas uma única GPU
GateNews1h atrás