Resultados da pesquisa de "RL"
2026-06-11 05:32

A Mastercard lança o serviço de pagamentos com IA AP4M com 30 parceiros iniciais, incluindo a Coinbase e a Ripple

A Mastercard lançou a Agent Pay for Machines (AP4M), uma iniciativa de pagamentos com inteligência artificial, a 10 de junho. A iniciativa permite que agentes de IA executem pagamentos de forma segura na rede global de pagamentos da Mastercard. Trinta parceiros iniciais, incluindo Coinbase, OKX, Polygon, Ripple, Solana Foundation, Stripe e Tempo, estão a participar. A AP4M suporta vários métodos de pagamento, incluindo cartões de crédito, contas bancárias e stablecoins como USDC, PYUSD, USDP, RL
Mais
SOL-3,63%
2026-06-02 17:52

A Ripple lança o RLUSD na Turquia através de parcerias com a BiLira, Bitexen e Bitlo a 2 de junho

De acordo com o anúncio oficial da Ripple a 2 de junho, a empresa de pagamentos em blockchain lançou o seu stablecoin RLUSD na Turquia através de parcerias com BiLira, Bitexen e Bitlo, tornando o ativo indexado ao dólar disponível para investidores institucionais turcos. A medida assinala um marco importante na expansão internacional do RLUSD; o stablecoin atingiu uma capitalização bolsista superior a 1,7 mil milhões de dólares em menos de um ano desde o lançamento.
Mais
2026-05-14 00:21

A Nvidia faz parceria com a Ineffable Intelligence em sistemas de RL à medida que a startup de IA angaria 1,1 mil milhões de dólares

De acordo com a CNBC, a Nvidia fará parceria com a startup de IA com sede em Londres Ineffable Intelligence no dia 13 de maio para construir sistemas de aprendizagem por reforço em grande escala. A Ineffable, fundada pelo antigo cientista da Google DeepMind David Silver, angariou 1,1 mil milhões de dólares numa ronda de seed em abril liderada pela Sequoia e pela Lightspeed, com apoio da Nvidia e da Google. As empresas vão usar os chips Grace Blackwell da Nvidia e a plataforma Vera Rubin para con
Mais
2026-04-23 04:54

A Perplexity revela o método de pós-treinamento do agente de pesquisa na web; o modelo baseado em Qwen3.5 supera o GPT-5.4 em precisão e custo

A Perplexity utiliza SFT seguida de RL com modelos Qwen3.5, tirando partido de um conjunto de dados de QA multi-hop e de verificações por rubrica para melhorar a precisão e a eficiência da pesquisa, atingindo um desempenho FRAMES de referência. Resumo: O fluxo de pós-treinamento da Perplexity para agentes de pesquisa na web combina fine-tuning supervisionado (SFT) para impor obediência a instruções e consistência linguística com aprendizagem por reforço online (RL) via o algoritmo GRPO. A fase de RL utiliza um conjunto proprietário de QA verificável multi-hop e dados conversacionais baseados em rubricas para impedir a deriva do SFT, com gating de recompensas e penalizações de eficiência dentro do grupo. A avaliação mostra que o Qwen3.5-397B-SFT-RL atinge o melhor desempenho FRAMES, com 57,3% de precisão com uma única chamada de ferramenta e 73,9% com quatro chamadas a $0,02 por consulta, superando o GPT-5.4 e o Claude Sonnet 4.6 nestas métricas. A tarifação é baseada em API e exclui caching.
Mais
2026-03-21 00:19
1

Cursor confirma oficialmente que Kimi K2.5 é a base, Moonshot AI: parceria comercial autorizada

A conta oficial da Dark Side of the Moon felicitou o Cursor pelo lançamento do Composer 2 e revelou uma colaboração de licenciamento com o Kimi K2.5. O cofundador da Cursor confirmou o uso da base Kimi, enfatizando detalhes técnicos e composição do modelo. Os dois fundadores reconheceram que não mencionaram oportunamente a origem da base como um erro, e prometeram fazer melhorias no próximo lançamento. Elon Musk também participou da discussão, aumentando a atenção ao tópico.
Mais
2026-03-20 09:47

Cursor Composer 2 é acusado de utilizar o modelo Kimi K2.5, Moonshot AI acusa falta de conformidade com licença

Os programadores descobriram que o modelo Composer 2 publicado pela Cursor tem o ID de modelo Kimi K2.5 e questionaram se não respeita a licença e não paga taxas. O responsável pela Moon Dark Side afirmou que, após testes, confirmou que é consistente com o seu tokenizer Kimi, acusando a Cursor de não mencionar Kimi K2.5. A Cursor ainda não respondeu até ao momento.
Mais
2026-02-12 14:21

Gradient lançou o quadro de aprendizagem por reforço distribuída Echo-2, e planeja lançar a plataforma RLaaS Logits

O framework de aprendizagem por reforço distribuída Echo-2, lançado pela Gradient, reduz significativamente os custos de treino de grandes modelos ao desacoplar Learner e Actor, passando de 4500 dólares para 425 dólares. Utiliza tecnologia de separação de armazenamento e cálculo para realizar treino assíncrono, aumentando a eficiência do treino e mantendo a precisão do modelo. Além disso, a Gradient lançou a plataforma RLaaS Logits, que já está aberta para reservas por estudantes e investigadores.
Mais
2026-01-02 09:15

Mecanismo Capital sócio: A escala de dados de IA de entidade em 2026 será ampliada em 100 vezes

O sócio da Mechanism Capital, Andrew Kang, prevê que em 2025 o setor de robótica superará os desafios de arquitetura de modelos e treinamento, permitindo às empresas de IA realizar coleta de dados em larga escala e alcançar uma taxa de sucesso superior a 99%. Os avanços em tecnologia de memória e modelos de localização virtual irão melhorar significativamente a compreensão espacial e a capacidade de processamento de dados, indicando que até 2026 os dados de IA física irão aumentar 100 vezes.
Mais
2025-11-27 05:38

Prime Intellect lançou o modelo INTELLECT-3

Descentralização AI protocolo Prime Intellect lançou um modelo de especialista híbrido INTELLECT-3 com 106B parâmetros, baseado no modelo GLM 4.5 Air Base, e treinado com SFT e RL. Prime Intellect completou um financiamento de 15 milhões de dólares em março deste ano.
Mais