Mensagem do Gate News, 23 de abril — A equipa de investigação da Perplexity publicou um artigo técnico que detalha a sua metodologia de pós-treinamento para agentes de pesquisa na web. A abordagem utiliza dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e recorre a um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer obediência a instruções e consistência linguística, seguido de aprendizagem por reforço online (RL) para otimizar a precisão da pesquisa e a eficiência no uso de ferramentas.
A fase de RL utiliza o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de queries iniciais internas que exigem 2–4 hops de raciocínio com verificação por múltiplos solucionadores, e dados conversacionais gerais baseados em rubricas que convertem requisitos de implementação em condições atómicas objetivamente verificáveis para evitar a degradação do comportamento do SFT.
O desenho de recompensas emprega agregação com gating — as pontuações de preferência só contribuem quando a correcção de base é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica são satisfeitos), impedindo que sinais de preferência elevados mascarem erros factuais. As penalizações de eficiência utilizam ancoragem dentro do grupo, aplicando penalizações suaves às chamadas de ferramentas e ao comprimento da geração que excede a base de respostas correctas no mesmo grupo.
A avaliação mostra que o Qwen3.5-397B-SFT-RL atinge o melhor desempenho de referência em benchmarks de pesquisa. No FRAMES, alcança 57,3% de precisão com uma única chamada de ferramenta, superando o GPT-5.4 em 5,7 pontos percentuais e o Claude Sonnet 4.6 em 4,7 pontos percentuais. Sob um orçamento moderado (quatro chamadas de ferramentas), atinge 73,9% de precisão a $0,02 por consulta, em comparação com 67,8% de precisão do GPT-5.4 a $0,085 por consulta e 62,4% de precisão do Sonnet 4.6 a $0,153 por consulta. Os valores de custo baseiam-se na tarifação pública por API de cada fornecedor e excluem optimizações de caching.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Ant International liga 150 milhões de comerciantes via pagamentos inteligentes com IA
Ant International afirmou que a sua rede de pagamentos liga mais de 150 milhões de comerciantes a mais de 2 mil milhões de contas de consumidores em todo o mundo, suportando mais de 300 métodos de pagamento em 220 mercados.
A empresa processa mais de 20 milhões de transacções por dia, em média, e está a expandir-se pela Ásia,
CryptoFrontier2h atrás
OKX Lança Protocolo de Pagamentos por Agentes para Comércio de Bots de IA
A bolsa de criptomoedas OKX apresentou na quarta-feira o seu Agent Payments Protocol (APP), um padrão aberto concebido para permitir que agentes de IA executem ciclos completos de negócio, incluindo pagamentos, negociações e resolução de disputas. O protocolo segue ofertas semelhantes de concorrentes, incluindo x402, incubado por
CryptoFrontier3h atrás
Kite lança a rede principal e disponibiliza uma camada de controlo de pagamentos para licenças de agentes de IA
De acordo com o anúncio oficial da Kite, a infraestrutura de pagamentos Kite, para a economia de AI Agents, lançou oficialmente a sua mainnet a 30 de abril; durante o arranque da mainnet, o Kite Treasury paga as taxas de rede, pelo que os utilizadores não precisam de se aperceber de gas. A Kite também está a disponibilizar ao público o Kite Agent Passport, como camada de autorização e controlo de pagamentos para Agents.
MarketWhisper3h atrás
Sessões da Stripe em 2026: colaboração com a Google para criar compras com IA e apoio da carteira Link para pagamentos autónomos por agentes
A Stripe vai anunciar 288 novas funcionalidades na Sessions 2026, posicionando-se de forma abrangente na infraestrutura base de comércio nativo de IA: em parceria com a Google para integrar compras com IA, pagamentos autónomos via agentes de IA, e a carteira Link para proteger as informações de pagamento com cartões virtuais de utilização única, exigindo a aprovação do utilizador em cada transação; o Stripe Treasury passa por uma atualização completa, com suporte para várias moedas, transferências globais, transferências gratuitas no mesmo dia, recompensas em stablecoins e 2% de cashback em dinheiro, com o objetivo de se tornar a camada de pagamentos central na era da economia de IA.
ChainNewsAbmedia3h atrás
A Parallel Web Systems levanta uma $100M Série B $2B , com uma avaliação , liderada pela Sequoia
De acordo com a TechCrunch, a Parallel Web Systems, uma startup de IA fundada pelo antigo CEO do Twitter Parag Agrawal, angariou 100 milhões de dólares numa ronda de Série B liderada pela Sequoia, avaliando a empresa em 2 mil milhões de dólares. A ronda eleva o financiamento total da empresa para 230 milhões de dólares, cinco meses depois da sua Série A de 100 milhões de dólares. Parallel
GateNews3h atrás
SWARMS (SWARMS) sobe 30,43% nas últimas 24 horas
Gate News 消息,30 de abril, segundo a informação de mercado da Gate, até ao momento da publicação, o SWARMS (SWARMS) está cotado a 0,02469 dólares, tendo subido 30,43% nas últimas 24 horas. O preço atingiu um máximo de 0,02670 dólares e um mínimo de 0,01802 dólares. O volume de transações nas últimas 24 horas foi de 296,36 milhões de dólares. A atual capitalização de mercado ronda os 24,6886 milhões de dólares.
SWARMS é uma framework de colaboração multiagente ao nível empresarial.
Notícias recentes importantes do SWARMS:
1️⃣ **Flutuação em alta da capitalização dos tokens no ecossistema Solana**
O token tem vindo a oscilar de forma ampla recentemente entre 18 milhões de dólares e 26 milhões de dólares, com subidas e quedas acentuadas por diversas vezes, o que indica que a volatilidade do sentimento do mercado é elevada. Os investidores devem acompanhar de perto os riscos associados à volatilidade do preço.
Esta notícia não constitui recomendação de investimento
GateNews4h atrás