Engenheiro da OpenAI Clive Chan ContestA as Recomendações de Hardware da V4, Apontando Erros e Ambiguidade Face à V3

Mensagem do Gate News, 24 de Abril — O engenheiro da OpenAI Clive Chan apresentou objecções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-lhe “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram no tema de discussão mais popular na conferência académica ISCA, ofereceu recomendações específicas alinhadas com normas de interconexão da indústria. Já a V4, em contraste, é muito mais vaga.

Chan contestou sistematicamente três recomendações-chave. No consumo de energia, o relatório sugere que a optimização de software permite que os chips executem simultaneamente em capacidade total computação, armazenamento e comunicação, e recomenda que os fabricantes de chips reservem folga adicional de energia. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por restrições das limitações físicas do processo, pelo que reservar mais margem de energia apenas reduz a frequência de funcionamento, acabando por diminuir o desempenho computacional. No que respeita à transferência de dados de GPU para GPU, o relatório defende um modelo pull—em que as GPUs buscam activamente dados—em vez de um modelo push, citando a elevada sobrecarga de notificações em operações push. Chan contesta isso, sustentando que o pull é na verdade mais lento e que capacidades melhoradas dos adaptadores de rede seriam preferíveis. No entanto, os dois podem estar a discutir camadas diferentes do problema: o relatório trata a sobrecarga do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.

Quanto às funções de activação, o relatório recomenda substituir SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho óptimo usando SwiGLU. Chan suspeita que o DeepSeek pode ter “enfraquecido deliberadamente esta secção.”

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A OpenAI anuncia o lançamento do modelo de cibersegurança GPT-5.5-Cyber nos próximos dias

Segundo a Cointelegraph, Sam Altman anunciou que a OpenAI vai lançar o GPT-5.5-Cyber, um modelo de cibersegurança, nos próximos dias. O modelo será disponibilizado a defensores críticos de cibersegurança, com a OpenAI a planear estabelecer mecanismos de acesso fiáveis em colaboração com entidades governamentais para

GateNews27m atrás

O CEO da Google DeepMind prevê que a AGI chega até 2030, dando às empresas quatro anos para se prepararem

De acordo com a série de vídeos da Sequoia Capital com Demis Hassabis, o CEO da Google DeepMind prevê que a inteligência artificial geral (AGI) vai chegar até 2030. Hassabis, vencedor do Prémio Nobel de Química em 2024, vê este calendário como uma realidade empresarial estrita que obriga os líderes a repensar o produto de

GateNews31m atrás

OpenAI para operar como uma empresa de lucro perpetuamente baixo, assina um contrato de energia de 20 anos

Segundo a Odaily, o CEO da OpenAI, Sam Altman, afirmou no Stripe Sessions que a OpenAI pretende tornar-se uma empresa de infraestruturas massiva e de crescimento rápido, com lucros perpetuamente baixos, oferecendo produtos semelhantes a um “contador inteligente” que os utilizadores podem comprar para automatizar as operações de negócio ou incorporar em

GateNews32m atrás

A Forefront Tech conclui a definição de preços do IPO $100M , para cotar na Nasdaq

De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a fixação do preço de um IPO de 100 milhões de dólares a 30 de abril, com estreia prevista na Nasdaq sob o símbolo FTHAU. Os proventos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras

GateNews1h atrás

Ex-executiva da Meta angaria fundos para a startup de IA Flourish numa valorização de 2,5 mil milhões

Segundo a Bloomberg, Thomas Reardon, ex-executivo da Meta que liderou o trabalho na Neural Band da Meta, está a angariar fundos para a Flourish, uma nova startup de IA focada em sistemas de IA de baixo consumo. A Lux Capital e a Google Ventures acordaram ser investidores de referência, com investidores já a comprometer 500 milhões de dólares a uma avaliação de 2,5

GateNews1h atrás

Os GPU Nvidia Blackwell custam o dobro, mas o custo da inferência por token desce 35x face ao Hopper

De acordo com a mais recente análise do blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas oferecem custos de inferência por token 35 vezes mais baixos. Usando o DeepSeek-R1 como modelo de teste, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas uma única GPU

GateNews1h atrás
Comentar
0/400
Nenhum comentário