"Fazer amizade, querer relatório, sair com o mesmo modelo": a startup de IA SID acusa a base de dados vetorial Chroma de plagiarizar seus resultados de pesquisa.

BlockBeatNews

De acordo com o acompanhamento da 1M AI News, o CEO da empresa de investigação em pesquisa de IA SID.ai, Max Rumpf, publicou no X um longo texto, no qual acusa de forma aberta que o modelo recentemente lançado Context-1, da base de dados vetorial open source Chroma, recorreu em grande quantidade ao trabalho de investigação SID-1 divulgado pela SID em dezembro passado, sem atribuir qualquer referência ou agradecimento.

Rumpf apresentou como prova as trocas de e-mails com o CEO da Chroma, Jeff Huber. Em outubro de 2025, Huber perguntou proativamente a Rumpf sobre que modelo estava a treinar. Rumpf respondeu que estava a fazer um “modelo de pesquisa por agentes, semelhante ao SWE-grep da Cognition, mas para pesquisa geral, já mais forte do que o Sonnet 4.5 e o Gemini 2.5 Pro”. Depois de a nota técnica do SID-1 ter sido publicada em dezembro de 2025, Rumpf voltou a partilhar um link com Huber; Huber respondeu “Parabéns”. As duas empresas são ex-alunos da YC, com escritórios lado a lado.

Tanto o SID-1 como o Context-1 são modelos de pesquisa por agentes treinados com aprendizagem por reforço; ambos se posicionam como agentes de pesquisa subsidiários de modelos de inferência de ponta; ambos usam dados sintéticos para treino; ambos afirmam atingir o patamar de Pareto em custo e latência. As semelhanças específicas enumeradas por Rumpf incluem: a Figura 1 utiliza a mesma alternância de duas perspetivas de velocidade/custo, a inferência paralela em 4 vias combinada com o RRF (reciprocal rank fusion) agregando os resultados, bem como a estrutura global de quadros, conjuntos de dados e metodologia.

A nota técnica do Context-1, na secção de trabalhos relacionados, cita estudos da mesma área como WebExplorer, SWE-grep e Search-R1, mas o texto integral não menciona o SID-1, e as avaliações de referência também não incluem o SID-1 na comparação. Rumpf afirma que a Chroma “sabia que existia outro modelo”, mas ainda assim alegou que “é ótimo de Pareto”, e aponta que, embora o Context-1 seja open source no que respeita aos pesos, ainda não foi publicado o framework de inferência necessário para o executar, o que impediu a SID de o testar em benchmarks.

Rumpf afirma que este tipo de prática “destrói completamente o ímpeto (para nós e para outras pessoas) de partilhar em profundidade nas notas técnicas” e chama-lhe “uma má prática de investigação lamentável na academia a espalhar-se para empresas em fase de arranque”. A Chroma, até ao momento da publicação deste texto, não divulgou qualquer resposta.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários