Prédire les matchs à élimination directe de la Coupe du monde : les niveaux d'IA sont-ils si différents ?

robot
Création du résumé en cours

Original | Odaily Planet Daily(@OdailyChina)

Auteur | Asher(@Asher 0210)_

Avant chaque match de la Coupe du monde, je fais prédire par l'IA, et presque chaque modèle raconte des choses convaincantes et riches en détails.

Certains parlent de la valeur des équipes, d'autres analysent les données des phases de groupes, certains décortiquent les blessures et les tactiques, et d'autres encore donnent directement des scénarios de score, prolongations et tirs au but. À première vue, ChatGPT, Grok, Qwen, DeepSeek, Gemini et Claude semblent tous bien connaître le foot.

Mais en tant qu'utilisateur de marchés de prédiction, ce qui m'intéresse vraiment, ce n'est pas quel modèle raconte le plus complètement, mais lequel est le plus fiable.

Alors que la Coupe du monde entre dans la phase à élimination directe, Odaily Planet Daily, dès le premier match, a posé avant chaque rencontre les mêmes questions, autant que possible, à différents modèles d'IA, puis après le match, a vérifié les résultats réels pour voir quels modèles se contentaient de bien analyser et lesquels avaient vraiment anticipé le déroulement du match.

Jusqu'à présent, dans les matches à élimination directe déjà joués, le Canada a battu l'Afrique du Sud 1-0 sur le fil, le Brésil a battu le Japon 2-1 de justesse, l'Allemagne a été éliminée après avoir été entraînée aux tirs au but par le Paraguay, et les Pays-Bas sont également tombés aux tirs au but face au Maroc. Pour la Belgique contre le Sénégal, le match s'est terminé sur un 2-2 avant un renversement en prolongation, portant l'incertitude de la phase à élimination directe à son comble.

DeepSeek et Gemini, rois de la prédiction grâce au match du Maroc

Le plus mémorable pour l'instant reste les prédictions de DeepSeek et Gemini pour Pays-Bas vs Maroc. Avant ce match, il était facile de se tromper de camp : les Pays-Bas avaient une équipe plus forte sur le papier, un effectif plus complet, et beaucoup de modèles savaient que le Maroc serait difficile à jouer, mais ils penchaient finalement pour une victoire néerlandaise.

Ce qui rend DeepSeek et Gemini impressionnants, c'est qu'ils ne se sont pas arrêtés à "ce match sera très serré", mais ont écrit le scénario complet. Gemini a directement donné un match nul 1-1 en temps réglementaire avant le match, avec une victoire du Maroc aux tirs au but. Résultat : le match s'est effectivement terminé 1-1, et le Maroc a éliminé les Pays-Bas 3-2 aux tirs au but. Non seulement ils ont prédit la tendance, mais ils ont aussi anticipé que le match irait aux tirs au but et qui en sortirait vainqueur.

Prédiction de Gemini pour Pays-Bas contre Maroc

DeepSeek était très proche aussi. Il a jugé que le temps réglementaire serait probablement 1-1 ou 0-0, que le match pourrait aller jusqu'en prolongation voire aux tirs au but, et penchait pour une surprise du Maroc grâce à sa défense et ses contres.

Prédiction de DeepSeek pour Pays-Bas contre Maroc

Après ce match, la présence de DeepSeek et Gemini a été directement renforcée. Surtout Gemini, qui ne faisait pas une simple prédiction avant le match, mais semblait avoir déjà vu le scénario du match.

Grok et Qwen enchaînent les scores précis, une stabilité plus forte que prévu

Outre DeepSeek et Gemini qui ont brillé sur le match du Maroc, Grok et Qwen ne sont pas en reste. Leur point fort principal : dans certains matches où la tendance était plus claire, ils n'ont pas seulement prédit l'équipe qualifiée, mais ont aussi donné un score précis très proche du résultat final.

L'Afrique du Sud contre le Canada en est un exemple. Avant le match, la plupart des modèles d'IA favorisaient le Canada, mais le débat portait sur la facilité de la victoire canadienne. Grok a prédit un 1-0 pour le Canada, et Qwen a aussi donné une victoire par un petit écart. Finalement, le Canada s'est imposé sur un seul but, sans la large victoire imaginée.

Prédiction de Qwen pour Afrique du Sud contre Canada

Le Brésil contre le Japon était similaire. La plupart des modèles d'IA pensaient que le Brésil était plus fort, mais la clé était de savoir si le Japon pourrait tenir le match. Grok et Qwen ont tous deux prédit un score de 2-1, et le match s'est effectivement terminé sur un 2-1 pour le Brésil. Ce qu'ils ont bien vu, ce n'était pas simplement "le Brésil va gagner", mais que le Japon poserait suffisamment de problèmes au Brésil.

Pour la Côte d'Ivoire contre la Norvège, ils ont également été assez précis. La Norvège a Haaland, il était facile de comprendre la qualification, mais la puissance physique et les attaques sur les ailes de la Côte d'Ivoire empêcheraient le match d'être à sens unique. Grok et Qwen ont tous deux prédit une victoire norvégienne 2-1, et le score final est tombé exactement dans ce "scénario".

Prédiction de Grok pour Côte d'Ivoire contre Norvège

L'avantage de Grok et Qwen est de mieux analyser les matchs favoris. Ils n'ont pas écrit le grand scénario de l'élimination des Pays-Bas par le Maroc, mais dans les matchs du Canada, Brésil, Norvège, France, etc., la direction du vainqueur et le score étaient assez justes. En d'autres termes, ils ne sont pas les meilleurs pour déceler les surprises, mais ils sont très doués pour déterminer si l'équipe favorite dominera facilement ou gagnera difficilement.

ChatGPT n'a pas beaucoup de scores incroyables, mais son analyse du déroulement du match est assez précise

ChatGPT n'a pas prédit comme Gemini l'élimination des Pays-Bas par le Maroc aux tirs au but, ni enchaîné plusieurs scores précis comme Grok et Qwen. Mais son avantage : dans de nombreux matchs où le favori semblait dominer avant le match, ChatGPT rappelait plus clairement que ce match ne serait peut-être pas si simple.

Le Brésil contre le Japon en est un exemple. ChatGPT a prédit la qualification du Brésil, mais sans écrire un match facile pour le Brésil : il a mentionné que le pressing, la course et la discipline du Japon mettraient le Brésil mal à l'aise, et qu'ils pourraient même marquer en premier ou égaliser. Pour la Côte d'Ivoire contre la Norvège, c'était similaire : ChatGPT a prédit la qualification norvégienne, mais a précisé que ce ne serait pas un match facile, que la puissance physique, les attaques sur les ailes et la capacité de transition de la Côte d'Ivoire poseraient des problèmes.

De plus, pour le match à élimination directe entre l'Angleterre et la République démocratique du Congo, ChatGPT n'a pas simplement écrit une large victoire anglaise, mais a estimé que le match pourrait être plus terne, que la RDC ralentirait le rythme avec une défense basse. Finalement, l'Angleterre s'est qualifiée, mais non sans difficulté.

Prédiction de ChatGPT pour Angleterre contre République démocratique du Congo

Le point fort de ChatGPT n'est pas de prédire les scores avec une grande précision à chaque fois, mais de souvent identifier à l'avance où se situent les difficultés du match. Il est très utile pour comprendre le match, mais convient moins si on ne cherche qu'un score final. Il peut décrire le déroulement assez précisément, mais quand il s'agit d'écrire une grosse surprise, il manque encore un peu de décision.

L'élimination de l'Allemagne, un fiasco collectif pour les modèles d'IA

Si les matchs précédents permettaient de voir les points forts des différents modèles, celui de l'Allemagne contre le Paraguay a été un fiasco collectif.

Avant le match, tous les modèles d'IA étaient du côté de l'Allemagne. ChatGPT, Grok, Qwen, Gemini, Claude, tous soutenaient l'Allemagne, avec des scores majoritairement autour de 2-0, 3-0 ou 3-1. La raison était toujours la même : l'Allemagne avait une équipe plus forte sur le papier, un effectif plus profond et une attaque plus puissante.

Mais le résultat a été tout autre. Les modèles d'IA ont sous-estimé la capacité du Paraguay à entraîner le match dans la boue. L'Allemagne n'a pas réussi à régler l'affaire dans le temps réglementaire, ni à briser l'impasse en prolongation, et a finalement été éliminée aux tirs au but par le Paraguay.

Qui est le plus précis jusqu'à présent ?

D'après les matches à élimination directe déjà terminés, les caractéristiques des différents modèles commencent à se dessiner.

DeepSeek et Gemini sont les plus brillants. Ils ne se contentent pas de prédire la qualification de favoris comme le Brésil ou la France, mais donnent aussi des réponses de grande valeur dans les matchs plus difficiles à juger, comme les surprises. Pour Pays-Bas contre Maroc, leur avantage clé a été d'oser écrire à l'avance le scénario de la surprise marocaine et des tirs au but. Surtout Gemini, qui a directement prédit la qualification du Maroc aux tirs au but, une performance remarquable.

Grok et Qwen sont plutôt des "spécialistes des scores". Ils ont prédit pas mal de scores précis, notamment dans les matchs du Canada, Brésil, Norvège, France. Mais le problème, face à des équipes traditionnellement fortes comme l'Allemagne ou les Pays-Bas, ils ont finalement penché du côté des favoris.

ChatGPT et Claude sont plutôt des "spécialistes de l'analyse". Leurs justifications sont complètes, les tendances sont rarement erronées, et ils peuvent signaler des risques de prolongations. Mais le problème, c'est qu'ils voient souvent que le match sera difficile, mais n'osent pas aller jusqu'à la surprise. Pays-Bas contre Maroc en est un exemple : ils avaient déjà vu le risque de prolongations et de tirs au but, mais ont finalement préféré les Pays-Bas.

Donc, plutôt que de se demander quel modèle connaît le mieux le foot, il vaut mieux voir lequel convient à quel scénario.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé