DeepSeek V4 finally released!


J'ai fait une comparaison
C'est actuellement le modèle open source le plus puissant.
Il atteint le premier rang mondial dans les domaines du code, des mathématiques, des textes longs et des agents, certains indicateurs dépassant GPT-4o, Claude Opus 4.6.

I. Version et positionnement

- V4-Pro : flagship, en face de GPT-4o/Opus 4.6, le plus puissant en open source.
- V4-Flash : léger et rapide, avec un bon rapport qualité-prix.
- Architecture : MoE de 1,6T paramètres, environ 370B activés à chaque fois ; contexte de 1 million de tokens.
- Puissance de calcul : Huawei Ascend 950PR en stack complet, déployé sans Nvidia.

II. Comparaison des performances principales (évaluation officielle)

1️⃣ Programmation (point fort)

- HumanEval : 90% (>Opus 4.5 88%, >GPT-4 82%).
- SWE-Bench : >80%, capacité réelle en génie logiciel en tête.
- Conclusion : le programmeur IA le plus puissant au monde.

2️⃣ Mathématiques / Raisonnement

- MATH/STEM : dépasse tous les modèles open source, comparable à GPT-4o/Opus 4.6.
- Capacité d'agent : Agentic Coding meilleur en open source, supérieur à Claude Sonnet 4.5, proche d'Opus 4.6 (mode non réflexion).

3️⃣ Textes longs

- Contexte : 1M de tokens (≈700 000 caractères chinois), parmi les trois premiers au monde (juste derrière Gemini 3.1).
- Test réel : analyse de romans ou de bibliothèques entières sans plantage, le meilleur modèle national pour les textes longs.

4️⃣ Connaissances mondiales

- Leader parmi tous les modèles open source, légèrement inférieur à Gemini 3.1 Pro.

III. Classement global (24/04/2026)

- Première rangée fermée :
1. Gemini 3.1 Pro (meilleur en raisonnement / textes longs)
2. Claude Opus 4.6 (polyvalent et équilibré)
3. GPT-4o (écosystème le plus fort)
4. DeepSeek V4-Pro (meilleur en code / textes longs, premier national)

- Première rangée open source :
- DeepSeek V4-Pro (absolu premier, en tête de Llama 3 / Qwen 3)

IV. Avantages clés

- ✅ Code le plus fort : dépasse GPT-4o/Claude, capacité pour tâches d'ingénierie.
- ✅ Contexte de 1M : traitement de textes longs au sommet mondial.
- ✅ Puissance de calcul nationale : stack Ascend, coût seulement 1/70 de GPT-4.
- ✅ Open source et commercialisable : V4-Pro/Flash open source, licence MIT.

V. Faiblesses

- Capacité globale légèrement inférieure à Gemini 3.1/Opus 4.6 (notamment en raisonnement approfondi).
- Capacité multimodale (image et texte) inférieure à GPT-4o/Gemini.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé