DeepSeek lance les modèles V4-Pro et V4-Flash à un coût inférieur de 98 % à celui du GPT-5.5 Pro d’OpenAI

Message de Gate News, 25 avril — DeepSeek a publié des versions préliminaires de V4-Pro et V4-Flash le 24 avril, deux modèles open-weight avec des fenêtres de contexte d’un million de tokens. V4-Pro dispose de 1,6 billion de paramètres au total, mais n’active que 49 milliards par passe d’inférence en utilisant une architecture de type Mixture-of-Experts. V4-Flash a 284 milliards de paramètres au total, dont 13 milliards activés.

La tarification est nettement plus basse que celle des concurrents : V4-Pro coûte 1,74 $ par million de tokens d’entrée et 3,48 $ par million de tokens de sortie — environ 98 % de moins que le GPT-5.5 Pro d’OpenAI ($30 input, $180 output) et environ un vingtième du coût de Claude Opus 4.7. V4-Flash est facturé 0,14 $ en entrée et 0,28 $ en sortie par million de tokens. Les deux modèles sont open source sous licence MIT et peuvent être exécutés localement gratuitement.

DeepSeek a réalisé des gains d’efficacité grâce à deux nouveaux mécanismes d’attention : Compressed Sparse Attention et Heavily Compressed Attention, qui réduisent les coûts de calcul à 27 % de ceux du prédécesseur V4-Pro (V3.2) et à 10 % pour V4-Flash. La société a partiellement entraîné V4 sur des puces Huawei Ascend, en contournant les restrictions d’exportation américaines sur les processeurs Nvidia avancés. DeepSeek a déclaré qu’une fois que 950 nouveaux supernœuds seront mis en ligne plus tard en 2026, la tarification baissera davantage.

Sur des benchmarks de performance, V4-Pro-Max arrive en première position sur Codeforces compétitif (3,206, se classant autour de la 23e place parmi les candidats humains) et obtenant 90,2 % sur les problèmes de mathématiques d’Apex Shortlist contre 85,9 % pour Claude Opus 4.6. Cependant, il est en retrait sur les benchmarks de multitâche : MMLU-Pro (87,5 % contre 91,0 % de Gemini-3.1-Pro) et Humanity’s Last Exam (37,7 % contre 44,4 %). Sur les tâches à long contexte, V4-Pro mène les modèles open source mais perd face à Claude Opus 4.6 sur les tests de récupération MRCR.

V4-Pro introduit le « interleaved thinking », permettant aux workflows d’agents de conserver le contexte de raisonnement sur plusieurs appels d’outils sans vider entre les étapes. Les deux modèles prennent en charge des intégrations de codage avec Claude Code et OpenCode. D’après une enquête auprès des développeurs de DeepSeek portant sur 85 utilisateurs, 52 % ont déclaré que V4-Pro était prêt comme agent de codage par défaut, et 39 % penchaient pour son adoption. Les anciens endpoints deepseek-chat et deepseek-reasoner seront mis à la retraite le 24 juillet 2026.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Claw Intelligence s’associe à Block Sec Arena pour renforcer la sécurité de BNB Chain

D’après l’annonce officielle de Block Sec Arena du 30 avril, Claw Intelligence, une plateforme Web3 propulsée par l’IA construite sur BNB Chain, a annoncé un partenariat stratégique avec Block Sec Arena afin d’intégrer une infrastructure de cybersécurité avancée à son écosystème. La collaboration vise à renforcer p

GateNewsIl y a 1h

NTT annonce l’initiative AI x OWN et prévoit de tripler la capacité énergétique du Japon à 1 GW d’ici 2033

Le 27 avril, le président de NTT, Akira Shimada, a annoncé l’initiative AI x OWN, l’effort de l’entreprise visant à repenser l’infrastructure d’Internet pour une utilisation de l’IA en temps réel. NTT prévoit de tripler sa capacité électrique domestique, passant d’environ 300 MW aujourd’hui à environ 1 gigawatt d’ici l’exercice 2033, à mesure que le géant des télécommunications

GateNewsIl y a 2h

La plateforme d’IA Certifyde clôture un tour de table d’amorçage de 2 millions de dollars le 1er mai, soutenue par le PDG de Ripple, Brad Garlinghouse

D’après TechfundingNews, la plateforme d’applications d’IA Certifyde a finalisé un tour de financement de 2 millions de dollars en amorçage le 1er mai. Parmi les investisseurs figurent K5 Global, Flamingo Capital, ainsi que des investisseurs providentiels, dont Honey cofondateur George Ruan, le PDG de Ripple Brad Garlinghouse et le cofondateur de Nutra Roland

GateNewsIl y a 3h

Directeur technologique du Pentagone : Anthropic reste sur la liste noire, traitement des exceptions pour Mythos

Le chef de la technologie du Pentagone (Pentagon technology chief) a déclaré le 1er mai devant le Congrès : « Anthropic reste sur la liste noire, mais Mythos Preview est un autre sujet ». Il reconnaît officiellement que le ministère de la Défense traite différemment la marque principale d’Anthropic et son nouveau modèle, Mythos. Cette prise de position fait écho à la révélation d’Axios du 19 avril selon laquelle la NSA (Agence de sécurité nationale) a effectivement utilisé Mythos, tout en confirmant officiellement l’orientation politique vers un « canal d’exception Mythos » — ce qui signifie aussi que, dans le passé, le Pentagone a soutenu devant les tribunaux que l’utilisation des outils d’Anthropic menacerait la sécurité nationale, en contradiction interne sur le plan juridique avec les pratiques actuelles. Anthropic vs Pentagon

ChainNewsAbmediaIl y a 4h

137 Ventures clôture $700M dans de nouveaux fonds, l'actif sous gestion atteint 15 milliards de dollars

Selon ChainCatcher, 137 Ventures, un investisseur précoce de SpaceX, a récemment finalisé une levée de fonds pour deux nouveaux fonds totalisant plus de 700 millions de dollars, portant ses actifs sous gestion à plus de 15 milliards de dollars. Le nouveau capital servira à financer des investissements dans les agents d’IA, la robotique et la propulsion spatiale

GateNewsIl y a 4h

Reddit en hausse de 16 % après des perspectives solides pour le deuxième trimestre ; Apple fait face à une pénurie de Mac alors que la demande liée à l’IA dépasse l’offre

L’action de Reddit a grimpé de 16 % avant l’ouverture des marchés vendredi après que la société a publié des perspectives de revenus pour le trimestre à venir supérieures aux attentes. Le nombre de visiteurs actifs quotidiens a augmenté de 17 % à 126,8 millions, tandis que le revenu moyen par utilisateur dans le monde a bondi de 44 %, porté par des fonctionnalités alimentées par l’IA…

GateNewsIl y a 4h
Commentaire
0/400
Aucun commentaire