Selon la surveillance de 1M AI News, le PDG de la société de recherche en IA SID.ai, Max Rumpf, a publié un long article sur X, accusant publiquement la base de données vectorielle open source Chroma d’avoir largement emprunté au modèle Context-1 récemment publié, qui s’inspire des résultats de recherche SID-1 publiés en décembre dernier, sans fournir aucune citation ou remerciement.
Rumpf a partagé des échanges d’emails avec le PDG de Chroma, Jeff Huber, comme preuve. En octobre 2025, Huber a demandé à Rumpf quel modèle il était en train d’entraîner, et Rumpf a répondu qu’il travaillait sur un « modèle de recherche d’agent, similaire au SWE-grep de Cognition mais pour la recherche générale, qui est déjà plus puissant que Sonnet 4.5 et Gemini 2.5 Pro ». Après la publication du rapport technique SID-1 en décembre 2025, Rumpf a de nouveau partagé le lien avec Huber, qui a répondu par un « félicitations ». Les deux sociétés sont des anciens élèves de YC, avec des bureaux voisins.
SID-1 et Context-1 sont tous deux des modèles de recherche d’agent entraînés par apprentissage par renforcement, positionnés comme des sous-agents de recherche pour des modèles d’inférence à la pointe, utilisant tous deux des données synthétiques pour l’entraînement, et affirmant atteindre le front de Pareto en termes de coûts et de latence. Les similitudes spécifiques énumérées par Rumpf incluent : la Figure 1 utilisant le même changement de vue double sur la vitesse/coût, une inférence parallèle à 4 voies combinée avec RRF (fusion de classement inverse) pour agréger les résultats, ainsi que la structure globale des graphiques, des ensembles de données et des méthodologies.
Le rapport technique de Context-1 cite dans son chapitre sur les travaux connexes des recherches dans le même domaine telles que WebExplorer, SWE-grep, Search-R1, mais ne mentionne pas SID-1 dans son intégralité, et les évaluations de référence n’incluent pas SID-1 dans les comparaisons. Rumpf affirme que Chroma « savait qu’un autre modèle existait » tout en affirmant « l’optimalité de Pareto », et souligne que bien que Context-1 ait ouvert ses poids, le cadre d’inférence nécessaire pour son fonctionnement n’a pas encore été publié, empêchant SID de le tester en référence.
Rumpf déclare que cette pratique « détruit complètement notre (et celle des autres) motivation à partager en profondeur dans les rapports techniques », et la qualifie de « mauvaise pratique de recherche regrettable qui s’étend dans le monde des startups ». Aucune réponse publique n’a été fournie par Chroma à la date de publication.