Pantera et Franklin Templeton rejoignent Sentient Arena pour tester conjointement les performances des agents IA d'entreprise.

PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena. Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Curve Finance accuse une plateforme d'échange décentralisée d'avoir utilisé son code sans permission, en violation de la licence open source

Curve Finance accuse une plateforme d'échange décentralisée d'utiliser son code sans autorisation, en violation de la licence open source. Si la plateforme souhaite utiliser légalement ses fonctionnalités, elle peut contacter via une licence ou une collaboration.

GateNewsIl y a 28m

21Shares lance le premier ETF Spot Polkadot américain sur le Nasdaq

21Shares a inscrit le ETF TDOT sur Nasdaq avec une structure physiquement adossée détenant de véritables jetons DOT. L'ETF a été lancé avec environ $11 millions de capital initial et facture des frais de gestion de 0,30 %, selon Eric Balchunas. Polkadot prévoit une mise à jour en mars limitant l'offre de DOT à 2,1 milliards de jetons.

CryptoFrontNewsIl y a 42m

'Not Bridges' : le constructeur de Cardano met en avant sa vision pour les retraits directs - U.Today

Input Output Group a annoncé le lancement de USDCx sur Cardano, un actif natif de Cardano soutenu par USDC dans le xReserve de Circle. Cette intégration améliore la liquidité DeFi et permet une interaction fluide entre Ethereum et Cardano, malgré certaines critiques de la communauté.

UTodayIl y a 43m

Circle utilise USDC pour réaliser 8 règlements internes entre entités d'une valeur de 68 millions de dollars au cours du premier mois

Le PDG de Circle, Jeremy Allaire, a révélé que Circle a effectué des règlements de transferts internes entre entités via la plateforme Circle Mint en USDC, avec plus de 68 millions de dollars transférés au cours du premier mois, une efficacité nettement supérieure à celle des virements bancaires traditionnels. La plateforme lancera en mars une mise à jour de la gestion des fonds, optimisant les transferts de comptes et intégrant une API de système comptable.

GateNewsIl y a 48m

OpenSea lance la fonctionnalité Skill, permettant aux agents IA de rechercher des données NFT

Gate News消息,7 mars, OpenSea a lancé la fonctionnalité Skill pour les agents IA. Les utilisateurs peuvent interroger des informations sur les NFT, les listings, les transactions, etc., via le terminal, ou l'installer en tant que Skill pour accéder aux données on-chain d'OpenSea. Cette fonctionnalité vise à offrir aux agents IA un accès aux données plus puissant.

GateNewsIl y a 57m

Claude Code version desktop lance la fonction de tâches planifiées locales

Gate News, le 7 mars, un membre clé de Claude Code, Thariq, a tweeté que la version desktop de Claude Code a lancé la fonction de tâches planifiées locales. Les utilisateurs peuvent créer des tâches programmées et définir une exécution régulière, tant que l'ordinateur reste éveillé, ces tâches continueront à s'exécuter.

GateNewsIl y a 57m
Commentaire
0/400
Aucun commentaire