J'ai fait une comparaison
C'est actuellement le modèle open source le plus puissant.
Il atteint le premier rang mondial dans les domaines du code, des mathématiques, des textes longs et des agents, certains indicateurs dépassant GPT-4o, Claude Opus 4.6.

I. Version et positionnement

- V4-Pro : flagship, en face de GPT-4o/Opus 4.6, le plus puissant en open source.
- V4-Flash : léger et rapide, avec un bon rapport qualité-prix.
- Architecture : MoE de 1,6T paramètres, environ 370B activés à chaque fois ; contexte de 1 million de tokens.
- Puissance de calcul : Huawei Ascend 950PR en stack complet, déployé sans Nvidia.

II. Comparaison des performances principales (évaluation officielle)

1️⃣ Programmation (point fort)

- HumanEval : 90% (>Opus 4.5 88%, >GPT-4 82%).
- SWE-Bench : >80%, capacité réelle en génie logiciel en tête.
- Conclusion : le programmeur IA le plus puissant au monde.

2️⃣ Mathématiques / Raisonnement

- MATH/STEM : dépasse tous les modèles open source, comparable à GPT-4o/Opus 4.6.
- Capacité d'agent : Agentic Coding meilleur en open source, supérieur à Claude Sonnet 4.5, proche d'Opus 4.6 (mode non réflexion).

3️⃣ Textes longs

- Contexte : 1M de tokens (≈700 000 caractères chinois), parmi les trois premiers au monde (juste derrière Gemini 3.1).
- Test réel : analyse de romans ou de bibliothèques entières sans plantage, le meilleur modèle national pour les textes longs.

4️⃣ Connaissances mondiales

- Leader parmi tous les modèles open source, légèrement inférieur à Gemini 3.1 Pro.

III. Classement global (24/04/2026)

- Première rangée fermée :
1. Gemini 3.1 Pro (meilleur en raisonnement / textes longs)
2. Claude Opus 4.6 (polyvalent et équilibré)
3. GPT-4o (écosystème le plus fort)
4. DeepSeek V4-Pro (meilleur en code / textes longs, premier national)

- Première rangée open source :
- DeepSeek V4-Pro (absolu premier, en tête de Llama 3 / Qwen 3)

IV. Avantages clés

- ✅ Code le plus fort : dépasse GPT-4o/Claude, capacité pour tâches d'ingénierie.
- ✅ Contexte de 1M : traitement de textes longs au sommet mondial.
- ✅ Puissance de calcul nationale : stack Ascend, coût seulement 1/70 de GPT-4.
- ✅ Open source et commercialisable : V4-Pro/Flash open source, licence MIT.

V. Faiblesses

- Capacité globale légèrement inférieure à Gemini 3.1/Opus 4.6 (notamment en raisonnement approfondi).
- Capacité multimodale (image et texte) inférieure à GPT-4o/Gemini.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateCompletesDividendDistribution
537,98K Popularité
#
CirclePlunges17%
4,16M Popularité
#
IsraelStrikesIranBTCPlunges
67,53K Popularité
#
PredictWorldCupShare20000U
166,24K Popularité
#
GateCardPointsSystemLaunched
120,77K Popularité

Épinglé

DeepSeek V4 finally released!

Sujets populaires

GateCompletesDividendDistribution

CirclePlunges17%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

GateCardPointsSystemLaunched

Épinglé