Engenheiro da OpenAI Clive Chan questiona recomendações de hardware da V4, citando erros e falta de clareza em relação à V3

Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram o tópico de discussão mais popular na conferência acadêmica ISCA, ofereceu recomendações específicas alinhadas com padrões de interconexão da indústria. A V4, por outro lado, é muito mais vaga.

Chan contestou sistematicamente três recomendações-chave. Em consumo de energia, o relatório sugere que a otimização de software permite que os chips executem computação, armazenamento e comunicação com capacidade total simultaneamente, e recomenda que os fabricantes de chips reservem margem de energia adicional. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por limitações do processo físico, então reservar mais margem de energia apenas reduz a frequência de operação, diminuindo, por fim, o desempenho computacional. No que diz respeito à transferência de dados de GPU para GPU, o relatório defende um modelo pull—no qual as GPUs buscam ativamente os dados—em vez de um modelo push, citando alto overhead de notificação nas operações push. Chan contesta isso, afirmando que o pull na verdade é mais lento e que capacidades aprimoradas do adaptador de rede seriam preferíveis. No entanto, os dois podem estar discutindo camadas diferentes do problema: o relatório aborda o overhead do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.

Quanto às funções de ativação, o relatório recomenda substituir o SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho ideal usando SwiGLU. Chan suspeita que o DeepSeek possa ter “enfraquecido deliberadamente esta seção.”

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Com apoio da OpenAI, a 1X inaugura fábrica de 58.000 pés quadrados na Califórnia e mira 10.000 robôs no primeiro ano

De acordo com a Bloomberg, a 1X Technologies, uma startup de robótica apoiada pela OpenAI e fundada na Noruega, inaugurou uma fábrica de 58.000 pés quadrados em Hayward, Califórnia, com o objetivo de liderar na produção em massa de robôs humanoides voltados ao consumidor. A instalação deve produzir 10.000 robôs em sua

GateNews46m atrás

Casa Branca prepara minuta de política de IA para orientar agências dos EUA a usar múltiplos provedores de IA em 30 de abril

De acordo com fontes citadas pela PANews em 30 de abril, funcionários da Casa Branca estão redigindo um amplo memorando de política de inteligência artificial que orienta agências do governo dos EUA a adotarem múltiplos provedores de serviços de IA e a evitarem depender de um único fornecedor. O memorando também exige que todas as empresas de IA contratadas

GateNews1h atrás

A Administração Estatal de Ciberespaço da China lança campanha de 4 meses para conter a “bagunça” nas aplicações de IA em 30 de abril

De acordo com a CCTV News, a Administração Estatal de Ciberespaço da China lançou em 30 de abril uma campanha nacional de quatro meses para enfrentar o caos nas aplicações de IA. A iniciativa, implementada em duas fases, mira problemas como registros de modelos ausentes, capacidade insuficiente de segurança e de análise das plataformas,

GateNews1h atrás

Forefront Tech conclui o $100M IPO com preço, listagem na Nasdaq sob o código FTHAU

De acordo com a ChainCatcher, a empresa de aquisição de propósito específico Forefront Tech concluiu a precificação de uma IPO de US$ 100 milhões em 30 de abril e será listada na Nasdaq sob o ticker FTHAU. A empresa planeja usar os recursos para buscar oportunidades de fusões e aquisições em blockchain, fintech, inteligência artificial e

GateNews3h atrás

O código da Anthropic Claude cobrou demais um usuário em US$ 200,98 devido a um bug de cobrança, inicialmente negando o reembolso antes de compensar integralmente

De acordo com o monitoramento da Beating, um bug de faturamento no serviço Claude Code da Anthropic fez com que um assinante Max tivesse sido cobrado em excesso em US$ 200,98 por taxas de uso adicionais, apesar de usar apenas 13% do limite mensal. O bug foi acionado quando o histórico de commits de um repositório git de um usuário continha a letra maiúscula

GateNews3h atrás

DeepSeek Introduz o método de Primitivos Visuais para aprimorar o raciocínio multimodal em 30 de abril

De acordo com o relatório técnico da DeepSeek, em 30 de abril, a empresa apresentou o Visual Primitives, um método que incorpora unidades visuais básicas como pontos e caixas delimitadoras em cadeias de raciocínio para resolver o problema da Lacuna de Referência em tarefas multimodais. O método reduz o consumo de tokens de imagem

GateNews3h atrás
Comentário
0/400
Sem comentários