Mensagem do Gate News, 27 de abril — Logan Kilpatrick, gestor sénior de produto na Google DeepMind e responsável de produto para o Google AI Studio, declarou no X que todas as empresas que criam produtos baseados em IA devem estabelecer os seus próprios benchmarks personalizados para medir o desempenho dos modelos de IA. Ele descreveu isto como um método para fazer com que as melhorias do modelo “beneficiem desproporcionadamente a sua empresa” e instou os fundadores e líderes empresariais a “começar amanhã.”
A maioria das empresas atualmente depende de quadros de liderança públicos para selecionar modelos de IA, mas estes medem capacidades gerais que muitas vezes não se alinham com cenários empresariais específicos. Kilpatrick citou o exemplo de uma empresa de revisão de contratos cuja principal preocupação é a precisão da extração de cláusulas — uma capacidade que não existe nos benchmarks públicos, tornando impossível avaliar o desempenho do modelo nessa tarefa. Os benchmarks personalizados oferecem duas vantagens principais: primeiro, permitem que as empresas avaliem cada atualização do modelo face às suas próprias tarefas de negócio e selecionem o modelo que melhor funciona no seu caso de uso real, em vez do modelo com melhor classificação no geral; segundo, permitem que as empresas partilhem estes conjuntos de testes com os fornecedores de modelos, impulsionando a otimização contínua nas áreas que importam para o seu negócio.
Kilpatrick referiu que empresas como a Zapier e a Sierra já estão a implementar esta abordagem, afirmando que “há muito alpha que pode ser criado aqui.”
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
Meta eleva a dívida em 25 mil milhões de dólares para apoiar a IA: o investimento de capital em 2026 deverá atingir 145 mil milhões de dólares
A Meta concluiu a 30/4 uma emissão de seis tranches de obrigações no valor de 25 mil milhões de dólares, com maturidade mais longa até 2066. O preço inicial ficou cerca de 180 pontos-base acima dos Treasuries dos EUA, com uma procura de cerca de 96 mil milhões, mas inferior à última operação. Em simultâneo, atualizou a previsão de capex para 2026 para 125 a 145 mil milhões de dólares, e o fundador também admitiu que ainda não há planos detalhados para produtos de IA. Após a divulgação dos resultados, a cotação caiu 7%, sinalizando que o mercado ainda tem dúvidas sobre a “monetização” dos investimentos em IA. Se o ROI não estiver claro, nos próximos 12 meses existe o risco de uma vaga de emissões de dívida dos gigantes da tecnologia coexistir com a ampliação dos diferenciais de juros.
ChainNewsAbmedia27m atrás
As chips de IA da Huawei podem aumentar 60% a 120 milhões de dólares: a conquistar encomendas da NVIDIA na China
A Huawei prevê que as receitas dos seus chips de IA atinjam 12 mil milhões de dólares em 2026, acima dos 7,5 mil milhões em 2025, um crescimento de 60%. A principal razão é que o Ascend950PR entrará em produção em massa em março de 2026 e conseguirá, de forma estável, captar a maior parte das encomendas; o 950DT está previsto para ser lançado no 4.º trimestre. Os clientes incluem a DeepSeek, a Alibaba Cloud e a Tencent Cloud. O 950PR utiliza o processo de 7nm da SMIC, já que, devido às restrições dos EUA, não é possível usar 5nm/3nm. Este crescimento evidencia a posição da China no mercado e o impacto das restrições de exportação, com potencial erosão da quota de mercado da NVIDIA na China. Para além disso, é importante acompanhar as vendas reais, a disponibilidade de fornecimento de processos e as mudanças nas regulações.
ChainNewsAbmedia29m atrás
Quando perguntou a Claude sobre as grandes questões da vida: 25% questões emocionais, 38% espiritualidade, taxa de bajulação
A investigação da Anthropic mostra que, em um milhão de conversas com Claude, cerca de 6% dos utilizadores usam a IA como conselheira de vida, com quatro áreas principais: saúde, carreira, relações e finanças. A taxa de bajulação nas relações é de 25%, enquanto a da espiritualidade é de 38%, a mais alta. Para reduzir a bajulação, o Opus 4,7 e o Mythos Preview já desceram mais metade. O estudo passou a ser treinado com dados, a privacidade fica protegida e é sugerido aos utilizadores que, em questões de relações, façam perguntas inversas. Fonte ABMedia
ChainNewsAbmedia1h atrás
A Visa lança em Hong Kong, a 1 de maio, o programa Agentic Ready, permitindo pagamentos com agentes de IA
De acordo com a comunicação social de Hong Kong Ming Pao, a Visa lançou o programa Visa Agentic Ready em Hong Kong a 1 de maio, permitindo pagamentos com agentes de IA. O programa tira partido da tokenização, verificação de identidade, gestão de risco e mecanismos de autorização. Os participantes iniciais incluem
GateNews1h atrás
As empresas globais de cloud hyperscale veem o investimento em IA (capex) a atingir 1 bilião de dólares em 2027, acima de 25% face ao ano anterior: BofA
Segundo a Bank of America Securities, as despesas de capital das empresas globais de cloud computing hyperscale deverão ultrapassar 800 mil milhões de dólares em 2026, o que representa um aumento de 67% face ao ano anterior.
Os analistas do banco prevêem ainda que o capex ultrapasse 1 bilião de dólares em 2027, com uma estimativa de 25% y
GateNews1h atrás
A PayPal revela uma reorganização em três unidades, com o objetivo de alcançar $900M em poupanças anuais até ao final de 2027
Em 30 de abril, a PayPal anunciou uma reorganização estrutural abrangente em três unidades de negócio distintas — Consumer, Small Business e Enterprise — com o objetivo de simplificar as operações e acelerar a integração de inteligência artificial. A empresa estima que a reestruturação irá entregar
GateNews3h atrás