Message de Gate News, 24 avril — DeepSeek V4-Pro et DeepSeek V4-Flash ont été officiellement publiés et open-sourcés le 24 avril, avec une longueur de traitement du contexte considérablement étendue de 128K à 1M, soit une augmentation de capacité d’environ 10 fois. Huawei Computing a annoncé que ses produits de supernœud Ascend prennent entièrement en charge les modèles de la série DeepSeek V4 grâce à une étroite collaboration entre les technologies de puce et de modèle.
Ascend 950 atteint un déploiement d’inférence des modèles DeepSeek V4 à haut débit et faible latence grâce à des techniques de noyaux fusionnés et de parallélisme multi-stream permettant de réduire la surcharge liée aux calculs d’Attention et aux accès mémoire. Pour DeepSeek V4-Pro avec une entrée de 8K, Ascend 950 atteint environ 20ms TPOT avec un débit Decode de 4,700 TPS sur une seule carte ; pour DeepSeek V4-Flash avec une entrée <8K>, il atteint environ 10ms TPOT avec un débit de 1,600 TPS. La série de supernœuds Ascend A3 atteint également une compatibilité totale, avec des implémentations de référence d’entraînement fournies pour un fine-tuning rapide. Sur un supernœud Ascend A3 à 64 cartes avec un grand mode EP, DeepSeek V4-Flash atteint plus de 2,000 TPS en Decode monocarte sur des scénarios entrée/sortie 8K/1K en utilisant le moteur d’inférence vLLM. Les lignes de produits complètes Huawei Ascend A2, A3 et 950 prennent en charge à la fois DeepSeek V4-Flash et V4-Pro.
Huawei Cloud a annoncé une compatibilité en avance avec DeepSeek V4, offrant aux développeurs des services d’API token en un clic via sa plateforme MaaS. Huawei Cloud a optimisé les capacités au niveau système, au niveau opérateur et au niveau cluster pour garantir une adaptation rapide des modèles et un déploiement performant. Des entreprises, dont Kingsoft WPS et 360, ont déjà intégré le nouveau modèle de DeepSeek via Huawei Cloud.
Cambricon a également annoncé une compatibilité Day 0 avec DeepSeek V4-Flash et V4-Pro basée sur le framework d’inférence vLLM, avec un code d’adaptation open-sourcé à la communauté GitHub. Cambricon avait déjà atteint une adaptation en avance lorsque DeepSeek V3.2 a été publié l’an dernier, ayant mené une optimisation approfondie des performances en collaboration logiciel-hardware sur les modèles de la série DeepSeek.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Claw Intelligence s’associe à Block Sec Arena pour renforcer la sécurité de BNB Chain
D’après l’annonce officielle de Block Sec Arena du 30 avril, Claw Intelligence, une plateforme Web3 propulsée par l’IA construite sur BNB Chain, a annoncé un partenariat stratégique avec Block Sec Arena afin d’intégrer une infrastructure de cybersécurité avancée à son écosystème. La collaboration vise à renforcer p
GateNewsIl y a 1h
NTT annonce l’initiative AI x OWN et prévoit de tripler la capacité énergétique du Japon à 1 GW d’ici 2033
Le 27 avril, le président de NTT, Akira Shimada, a annoncé l’initiative AI x OWN, l’effort de l’entreprise visant à repenser l’infrastructure d’Internet pour une utilisation de l’IA en temps réel. NTT prévoit de tripler sa capacité électrique domestique, passant d’environ 300 MW aujourd’hui à environ 1 gigawatt d’ici l’exercice 2033, à mesure que le géant des télécommunications
GateNewsIl y a 3h
La plateforme d’IA Certifyde clôture un tour de table d’amorçage de 2 millions de dollars le 1er mai, soutenue par le PDG de Ripple, Brad Garlinghouse
D’après TechfundingNews, la plateforme d’applications d’IA Certifyde a finalisé un tour de financement de 2 millions de dollars en amorçage le 1er mai. Parmi les investisseurs figurent K5 Global, Flamingo Capital, ainsi que des investisseurs providentiels, dont Honey cofondateur George Ruan, le PDG de Ripple Brad Garlinghouse et le cofondateur de Nutra Roland
GateNewsIl y a 4h
Directeur technologique du Pentagone : Anthropic reste sur la liste noire, traitement des exceptions pour Mythos
Le chef de la technologie du Pentagone (Pentagon technology chief) a déclaré le 1er mai devant le Congrès : « Anthropic reste sur la liste noire, mais Mythos Preview est un autre sujet ». Il reconnaît officiellement que le ministère de la Défense traite différemment la marque principale d’Anthropic et son nouveau modèle, Mythos. Cette prise de position fait écho à la révélation d’Axios du 19 avril selon laquelle la NSA (Agence de sécurité nationale) a effectivement utilisé Mythos, tout en confirmant officiellement l’orientation politique vers un « canal d’exception Mythos » — ce qui signifie aussi que, dans le passé, le Pentagone a soutenu devant les tribunaux que l’utilisation des outils d’Anthropic menacerait la sécurité nationale, en contradiction interne sur le plan juridique avec les pratiques actuelles.
Anthropic vs Pentagon
ChainNewsAbmediaIl y a 4h
137 Ventures clôture $700M dans de nouveaux fonds, l'actif sous gestion atteint 15 milliards de dollars
Selon ChainCatcher, 137 Ventures, un investisseur précoce de SpaceX, a récemment finalisé une levée de fonds pour deux nouveaux fonds totalisant plus de 700 millions de dollars, portant ses actifs sous gestion à plus de 15 milliards de dollars. Le nouveau capital servira à financer des investissements dans les agents d’IA, la robotique et la propulsion spatiale
GateNewsIl y a 4h
Reddit en hausse de 16 % après des perspectives solides pour le deuxième trimestre ; Apple fait face à une pénurie de Mac alors que la demande liée à l’IA dépasse l’offre
L’action de Reddit a grimpé de 16 % avant l’ouverture des marchés vendredi après que la société a publié des perspectives de revenus pour le trimestre à venir supérieures aux attentes. Le nombre de visiteurs actifs quotidiens a augmenté de 17 % à 126,8 millions, tandis que le revenu moyen par utilisateur dans le monde a bondi de 44 %, porté par des fonctionnalités alimentées par l’IA…
GateNewsIl y a 5h