GLM 5.2 Reduz Custo de Reprodução de Artigos Acadêmicos para 1/8 do Claude Opus 4.8 Max
De acordo com a Beating, em testes de reprodução acadêmica, o GLM 5.2 alcançou um custo de apenas US$ 6,21 em comparação com US$ 46,35 do Claude Opus 4.8 Max ao replicar um artigo sobre aprendizado por reforço com autodestilação. O modelo de código aberto precisou de 14 tentativas fracassadas antes do sucesso, consumindo 2,65 milhões de tokens, enquanto o Opus concluiu a tarefa após 9 falhas usando 4,53 milhões de tokens, segundo os testes automatizados de agentes da equipe do alphaXiv.
GateNews·18m atrás
