Predicción de la fase eliminatoria de la Copa del Mundo, ¿los diferentes niveles de IA difieren tanto?

Título original: "Predicciones de la fase eliminatoria del Mundial, ¿tanta diferencia entre distintas IA?" Autor original: Asher, Odaily Planet Daily

Antes de cada partido del Mundial, le pido a la IA que haga predicciones. Casi todos los modelos hablan con mucho detalle y convicción.

Unos hablan del valor de los equipos, otros desglosan los datos de la fase de grupos, otros analizan lesiones y tácticas, y algunos incluso dan el marcador exacto, la prórroga y el guion de los penaltis. A primera vista, ChatGPT, Grok, Qianwen, DeepSeek, Gemini y Claude parecen entender mucho de fútbol.

Pero como usuario de mercados de predicción, lo que realmente me importa no es qué modelo habla de manera más completa, sino cuál es más fiable para consultar.

A medida que el Mundial entra en la fase eliminatoria, Odaily Planet Daily, desde el primer partido, ha preguntado a diferentes modelos de IA con preguntas lo más similares posible antes de cada partido, y después del partido ha contrastado los resultados reales para ver qué modelos solo parecen analizar bien y cuáles realmente captaron la dirección del partido de antemano.

Hasta ahora, en la fase eliminatoria del Mundial ya disputada, Canadá venció 1-0 a Sudáfrica, Brasil ganó 2-1 a Japón, Alemania fue eliminada por Paraguay tras una tanda de penaltis, y Países Bajos también cayó ante Marruecos en los penaltis. En el partido entre Bélgica y Senegal, el marcador terminó 2-2 y se remontó en la prórroga, llevando la incertidumbre de la fase eliminatoria al máximo.

DeepSeek y Gemini, se coronan con la predicción del partido de Marruecos

El momento más memorable hasta ahora ha sido la predicción de DeepSeek y Gemini sobre el partido Países Bajos vs. Marruecos. Antes de este partido, era fácil apostar por el equipo equivocado: Países Bajos tenía una plantilla más fuerte sobre el papel y una alineación más completa. Muchos modelos sabían que Marruecos no sería fácil, pero al final se inclinaban por que Países Bajos pasaría.

El mérito de DeepSeek y Gemini es que no se quedaron en "este partido será muy reñido", sino que también escribieron el guion posterior. Gemini pronosticó directamente un 1-1 en el tiempo reglamentario y que Marruecos ganaría en los penaltis. El partido realmente terminó 1-1 y Marruecos eliminó a Países Bajos por 3-2 en los penaltis. No solo acertaron la dirección, sino que también acertaron básicamente cómo se llegaría a los penaltis y quién se llevaría la victoria final.

Predicción de Gemini para el partido Países Bajos vs. Marruecos

DeepSeek también estuvo muy cerca. Estimó que este partido probablemente terminaría 1-1 o 0-0 en el tiempo reglamentario, que podría alargarse a la prórroga e incluso a los penaltis, y se inclinó por que Marruecos avanzaría dando la sorpresa gracias a su defensa y contraataques.

Predicción de Deepseek para el partido Países Bajos vs. Marruecos

Después de este partido, la presencia de DeepSeek y Gemini se disparó. Especialmente Gemini, que esta vez no parecía estar haciendo una predicción previa, sino que más bien había visto el guion del partido con antelación.

Grok y Qianwen aciertan marcadores concretos de forma consecutiva, su estabilidad es mayor de lo imaginado

Además de que DeepSeek y Gemini brillaron en el partido de Marruecos, Grok y Qianwen tampoco pasaron desapercibidos. Su punto más destacado es que, en algunos partidos con una dirección de resultado relativamente clara, no solo acertaron qué equipo avanzaría, sino que también pronosticaron el marcador concreto con bastante precisión.

El partido Sudáfrica vs. Canadá es un ejemplo. Antes del partido, la mayoría de los modelos de IA favorecían a Canadá, pero la discrepancia estaba en si Canadá ganaría cómodamente. Grok pronosticó un 1-0 para Canadá, y Qianwen también dio una victoria por un gol de diferencia. Finalmente, Canadá solo necesitó un gol para pasar, sin lograr la gran goleada imaginada.

Predicción de Qianwen para el partido Sudáfrica vs. Canadá

El partido Brasil vs. Japón fue similar. La mayoría de los modelos de IA pensaban que Brasil era más fuerte, pero la clave era si Japón podría mantener el partido ajustado. Grok y Qianwen pronosticaron un 2-1, y el partido realmente terminó 2-1 a favor de Brasil. No solo acertaron que "Brasil ganaría", sino que Japón causaría suficientes problemas a Brasil.

En el partido Costa de Marfil vs. Noruega, ambos también acertaron bien. Noruega tiene a Haaland, la dirección de avance era fácil de entender, pero la fuerza física y el ataque por las bandas de Costa de Marfil no harían que el partido fuera unilateral. Grok y Qianwen pronosticaron una victoria de Noruega por 2-1, y el marcador final coincidió exactamente con ese "guion".

Predicción de Grok para el partido Costa de Marfil vs. Noruega

La ventaja de Grok y Qianwen es que analizan los partidos favoritos con más detalle. No escribieron de antemano el gran guion de Marruecos eliminando a Países Bajos, pero en partidos como los de Canadá, Brasil, Noruega y Francia, dieron predicciones bastante ajustadas sobre la dirección del resultado y el marcador. En otras palabras, no son necesariamente los mejores detectando sorpresas, pero son muy buenos juzgando si un equipo favorito arrollará o ganará por la mínima.

ChatGPT no tiene marcadores sorprendentes, pero su análisis del desarrollo del partido es bastante preciso

ChatGPT no ha predicho de antemano que Marruecos eliminara a Países Bajos en los penaltis como Gemini, ni ha acertado varios marcadores concretos de forma consecutiva como Grok y Qianwen. Pero su ventaja es que, en muchos partidos que parecen favorables para el equipo fuerte, ChatGPT advierte más claramente que puede no ser tan fácil.

El partido Brasil vs. Japón es un ejemplo. ChatGPT predijo que Brasil avanzaría, pero no describió el partido como un paseo para Brasil, sino que mencionó que la presión, el movimiento y la disciplina de Japón harían que Brasil se sintiera incómodo, e incluso que Japón podría adelantarse o empatar. El partido Costa de Marfil vs. Noruega fue similar: ChatGPT predijo que Noruega avanzaría, pero dijo de antemano que no sería un partido fácil, y que la fuerza física, el ataque por bandas y la capacidad de transición de Costa de Marfil causarían problemas.

Predicción de ChatGPT para el partido Inglaterra vs. República Democrática del Congo

El punto fuerte de ChatGPT no es acertar siempre el marcador con precisión, sino que a menudo puede señalar de antemano dónde están las dificultades del partido. Es muy adecuado para entender el partido, pero no tanto para buscar una predicción final de marcador. Puede describir el proceso con bastante precisión, pero cuando se trata de escribir una gran sorpresa, le falta un poco de determinación.

La eliminación de Alemania se convierte en un fracaso colectivo de los modelos de IA

Si los partidos anteriores mostraban los puntos fuertes de diferentes modelos, el partido Alemania vs. Paraguay fue un fracaso colectivo.

Antes del partido, todos los modelos de IA apostaban por Alemania. ChatGPT, Grok, Qianwen, Gemini y Claude se pusieron todos del lado de Alemania, con predicciones de marcador que se centraban en 2-0, 3-0 o 3-1. La razón era consistente: todos pensaban que Alemania era más fuerte sobre el papel, con mejor profundidad de plantilla y mayor potencia ofensiva.

Pero el resultado fue que este partido salió mal. Los modelos de IA subestimaron la capacidad de Paraguay para enredar el partido. Alemania no pudo resolver el partido en el tiempo reglamentario, ni romper el empate en la prórroga, y finalmente fue eliminada por Paraguay tras una tanda de penaltis.

¿Quién es el más preciso hasta ahora?

A partir de la fase eliminatoria ya disputada, las características de los diferentes modelos están empezando a hacerse evidentes.

DeepSeek y Gemini son los más destacados. No solo pueden predecir que equipos favoritos como Brasil y Francia avanzarán, sino que en partidos más difíciles de pronosticar y con posibles sorpresas, también dieron respuestas muy valiosas. En el partido Países Bajos vs. Marruecos, su ventaja clave fue atreverse a escribir de antemano el guion de la sorpresa de Marruecos y la tanda de penaltis. Especialmente Gemini, que predijo directamente que Marruecos avanzaría en los penaltis. Ese partido fue realmente brillante.

Grok y Qianwen son más como "jugadores de marcador". Acertaron varios marcadores concretos, especialmente en partidos como los de Canadá, Brasil, Noruega y Francia. Pero el problema es que, cuando se enfrentaron a equipos tradicionalmente fuertes como Alemania y Países Bajos, al final se inclinaron por los favoritos.

ChatGPT y Claude son más como "jugadores analíticos". Escriben argumentos completos, la dirección general no suele ser descabellada, y también pueden advertir sobre riesgos de prórroga. Pero el problema es que a menudo pueden ver que el partido será difícil, pero no se atreven a llevar la conclusión hacia el lado de la sorpresa. En el partido Países Bajos vs. Marruecos fue así: ya habían visto los riesgos de prórroga y penaltis, pero al final siguieron confiando en Países Bajos.

Por lo tanto, en lugar de preguntar apresuradamente qué modelo entiende más de fútbol, es mejor ver para qué escenarios es adecuado cada uno.

Enlace original

Haga clic para conocer los puestos disponibles en BlockBeats

Bienvenido a unirte a la comunidad oficial de BlockBeats:

Suscripción a Telegram: https://t.me/theblockbeats

Grupo de chat de Telegram: https://t.me/BlockBeats_App

Cuenta oficial de Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado