Antigo Engenheiro da ByteDance Seed: A iteração de IA da ByteDance demora seis meses, em comparação com os três meses do Google

Mensagem de Gate News, 24 de abril — Zhang Chi, um antigo engenheiro da equipa Seed da ByteDance e atualmente professor assistente na Universidade de Pequim, revelou no podcast “Into Asia” que a ByteDance necessita de aproximadamente seis meses para concluir um ciclo completo de treino de pré-formação de modelos de linguagem de grande dimensão (pretraining mais pós-treino), enquanto o Google, segundo se afirma, precisa apenas de três meses. Zhang atribuiu a diferença de velocidade como uma razão central pela qual as empresas chinesas têm dificuldade em acompanhar o desenvolvimento de IA.

Zhang descreveu uma “cultura de benchmark” dentro da Seed, em que os líderes de equipa são avaliados com base nas pontuações de referência que supervisionam, e todos os membros se concentram em aumentar os números. No entanto, referiu que isto não se traduz, na prática, numa melhor experiência do utilizador. Embora os modelos das principais empresas chinesas pareçam competitivos com os modelos de fronteira dos EUA em termos de papel, ficam aquém na utilização real. O objetivo da Seed é alcançar um desempenho de topo a nível global, mas Zhang afirmou que não acredita que a equipa tenha atingido esse patamar, nem que tenha alcançado a meta de liderança doméstica.

No final de 2024, a Seed considerava-se equivalente ao GPT-4o, mas após o lançamento da DeepSeek, a equipa reconheceu que a diferença continuava. Quando Zhang se juntou, todo o grupo estava a mudar com urgência para a aprendizagem por reforço para colmatar a lacuna.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A NTT Anuncia a Iniciativa AI x OWN e Planos para Triplicar a Capacidade de Energia do Japão para 1 GW até 2033

Em 27 de abril, o presidente da NTT, Akira Shimada, anunciou a iniciativa AI x OWN, o esforço da empresa para redesenhar a infraestrutura da internet para um uso de IA em tempo real. A NTT planeia triplicar a sua capacidade doméstica de energia de cerca de 300 MW hoje para cerca de 1 gigawatt até ao ano fiscal de 2033, à medida que a gigante das telecomunicações

GateNews16m atrás

A plataforma de IA Certifyde conclui uma ronda de investimento semente de 2 milhões de dólares a 1 de maio, apoiada pelo CEO da Ripple, Brad Garlinghouse

De acordo com a TechfundingNews, a plataforma de aplicações de IA Certifyde concluiu uma ronda de seed no valor de 2 milhões de dólares a 1 de maio. Os investidores incluem a K5 Global, a Flamingo Capital e investidores-anjo, incluindo o cofundador da Honey George Ruan, o CEO da Ripple Brad Garlinghouse e o cofundador da Nutra Roland

GateNews58m atrás

Chefe de tecnologia do Pentágono: a Anthropic continua na lista negra, tratamento de excepções para a Mythos

O responsável pela tecnologia do Pentágono (Pentagon technology chief) dos EUA, em 1 de maio, disse ao Congresso que «a Anthropic continua na lista negra, mas o Mythos Preview é outra questão», reconhecendo formalmente que o Departamento de Defesa distingue o principal produto da Anthropic e o seu novo modelo, Mythos, no modo como os trata. Esta declaração coincide com a revelação da Axios, a 19 de abril, de que a NSA (Agência de Segurança Nacional) já tinha usado o Mythos para criar uma resposta correspondente, e formaliza a orientação de política que estabelece «um canal de exceção para o Mythos» — o que também significa que o Pentágono, anteriormente, defendeu em tribunal que o uso de ferramentas da Anthropic ameaçaria a segurança nacional, criando uma contradição interna ao nível do argumento jurídico face às práticas atuais. Anthropic vs Pentagon

ChainNewsAbmedia1h atrás

A 137 Ventures fecha $700M em novos fundos, AUM atinge 15 mil milhões de dólares

De acordo com o ChainCatcher, a 137 Ventures, um dos primeiros investidores na SpaceX, concluiu recentemente a recolha de fundos para dois novos fundos, num total superior a 700 milhões de dólares, elevando os seus activos sob gestão para mais de 15 mil milhões de dólares. O novo capital vai apoiar investimentos em agentes de IA, robótica e propulsão espacial

GateNews1h atrás

O Reddit regista um aumento de 16% com fortes perspetivas para o 2.º trimestre; a Apple enfrenta falta de Macs à medida que a procura por IA supera a oferta

As acções da Reddit subiram 16% antes da abertura do mercado na sexta-feira, depois de a empresa ter divulgado uma previsão de receitas para o próximo trimestre superior ao esperado. Os visitantes diários ativos cresceram 17% para 126,8 milhões, enquanto a receita média por utilizador a nível mundial disparou 44%, impulsionada por IA alimentada por

GateNews1h atrás

O Departamento de Defesa dos EUA Chega a Acordo com 7 Empresas de IA, incluindo OpenAI, Google e Microsoft

De acordo com o Departamento de Defesa dos EUA, a agência assinou acordos hoje (1 de maio) com sete das principais empresas de inteligência artificial: SpaceX, OpenAI, Google, Nvidia, Reflection, Microsoft e Amazon Web Services (AWS). Os acordos têm como objetivo acelerar a transformação militar e estabelecer t

GateNews2h atrás
Comentar
0/400
Nenhum comentário