Прогнозувати матчі плей-оф чемпіонату світу, різні рівні ШІ так сильно відрізняються?

Оригінальна назва: «Прогнозування матчів плей-оф чемпіонату світу — наскільки різні рівні AI?» Оригінальний автор: Asher, Odaily Planet Daily

Перед кожним матчем чемпіонату світу я прошу AI зробити прогноз, і майже кожна модель говорить дуже переконливо, з безліччю деталей.

Одні говорять про вартість команд, інші розбирають дані групового етапу, треті аналізують травми та тактику, а деякі прямо дають рахунок, додатковий час, серію пенальті. На перший погляд, ChatGPT, Grok, Qianwen, DeepSeek, Gemini, Claude — всі ніби добре розуміються на футболі.

Але як користувач ринку прогнозів, мене насправді цікавить не те, яка модель дає повнішу відповідь, а яка з них більш варта уваги.

Оскільки чемпіонат світу переходить до стадії плей-оф, Odaily Planet Daily починаючи з першого матчу перед грою задавала різним AI-моделям максимально однакові питання, а після матчу порівнювала результати — які моделі просто аналізували приблизно правильно, а які насправді заздалегідь вловили хід гри.

Наразі в завершених матчах плей-оф чемпіонату світу Канада з рахунком 1:0 перемогла Південну Африку, Бразилія з рахунком 2:1 здолала Японію, Німеччина була вибита Парагваєм у серії пенальті, Нідерланди також програли Марокко в серії пенальті. А матч Бельгія — Сенегал став грою 2:2 з камбеком у додатковий час, що підняло невизначеність плей-оф на максимум.

DeepSeek та Gemini: прогноз на матч Марокко став легендарним

Найбільш пам'ятним наразі є прогноз DeepSeek та Gemini на матч Нідерланди — Марокко. До цього матчу було дуже легко помилитися: Нідерланди мали сильніший склад на папері, більш збалансовану команду, багато моделей знали, що Марокно буде грати важко, але врешті-решт все ж вважали, що Нідерланди зможуть пройти.

Сильна сторона DeepSeek та Gemini полягає в тому, що вони не зупинилися на твердженні «гра буде напруженою», а розписали подальший сценарій. Gemini прямо перед матчем передбачив основний час з рахунком 1:1, а перемогу в серії пенальті — за Марокко. У результаті матч дійсно закінчився 1:1, і Марокко виграло в серії пенальті 3:2, вибивши Нідерланди. Не просто вгадати напрямок, а й те, як гра дійде до пенальті і хто врешті переможе — все збіглося.

Прогноз Gemini на матч Нідерланди — Марокко

DeepSeek також був близьким. Він оцінив, що з великою ймовірністю основний час закінчиться 1:1 або 0:0, гра може дійти до додаткового часу або навіть пенальті, і схилявся до того, що Марокко завдяки захисту та контратакам зможе пройти сенсаційно.

Прогноз DeepSeek на матч Нідерланди — Марокко

Після цього матчу присутність DeepSeek та Gemini різко зросла. Особливо Gemini — цього разу вона не виглядала як звичайний прогноз, а скоріше ніби заздалегідь побачила сценарій матчу.

Grok та Qianwen послідовно вгадували конкретні рахунки, стабільність виявилася сильнішою, ніж очікувалося

Крім того, що DeepSeek та Gemini відзначилися в матчі Марокко, Grok та Qianwen теж не були непомітними. Їх найяскравіша риса — у матчах з відносно зрозумілим напрямком перемоги вони не тільки правильно визначили команду-переможця, а й досить точно передбачили конкретний рахунок.

Матч Південна Африка — Канада є прикладом. Більшість AI-моделей перед грою вважали фаворитом Канаду, але розбіжності були щодо того, чи легко виграє Канада. Grok дав прогноз 1:0 на користь Канади, Qianwen також передбачив перемогу з різницею в один м'яч. Врешті-решт Канада виграла лише з одним забитим голом, не перетворивши гру на розгром.

Прогноз Qianwen на матч Південна Африка — Канада

Матч Бразилія — Японія був схожим. Більшість AI-моделей вважали Бразилію сильнішою, але чи зможе Японія триматися — ось що було ключовим. Grok та Qianwen передбачили рахунок 2:1, і матч дійсно закінчився перемогою Бразилії 2:1. Вони правильно оцінили не просто «Бразилія виграє», а те, що Японія створить Бразилії достатньо проблем.

Матч Кот-д'Івуар — Норвегія також був вгаданий точно. У Норвегії є Холанд, напрямок перемоги зрозумілий, але фізична боротьба та флангові атаки Кот-д'Івуару не дозволили б грі стати односторонньою. Grok та Qianwen передбачили перемогу Норвегії 2:1, і рахунок точно вклався в цей сценарій.

Прогноз Grok на матч Кот-д'Івуар — Норвегія

Перевага Grok та Qianwen — у більш детальному аналізі матчів із фаворитами. Вони не передбачили заздалегідь великих сенсацій на кшталт вильоту Нідерландів від Марокко, але в матчах Канади, Бразилії, Норвегії, Франції дали досить точні напрямки та рахунки. Іншими словами, вони не найкращі в пошуку сенсацій, але добре визначають, чи фаворит переможе впевнено, чи ледве виграє.

У ChatGPT немає надзвичайних прогнозів рахунку, але аналіз ходу гри досить точний

ChatGPT не передбачив заздалегідь, як Марокко виб'є Нідерланди в серії пенальті, як Gemini, і не вгадав кілька конкретних рахунків поспіль, як Grok та Qianwen. Але його сильна сторона — у багатьох матчах, які на перший погляд здаються легкими для фаворитів, ChatGPT більш явно попереджає, що гра може бути не такою простою.

Бразилія — Японія є прикладом. ChatGPT передбачив вихід Бразилії, але не змалював гру як легкий розгром, а зазначив, що пресинг, рух та дисципліна Японії зроблять гру некомфортною для Бразилії, і що Японія навіть може забити першою або зрівняти рахунок. Матч Кот-д'Івуар — Норвегія був аналогічним: ChatGPT передбачив вихід Норвегії, але заздалегідь сказав, що це не буде легка гра, і що фізична боротьба, флангові атаки та здатність до переходу Кот-д'Івуару створять проблеми.

Прогноз ChatGPT на матч Англія — Демократична Республіка Конго

Сильна сторона ChatGPT полягає не в точному прогнозуванні рахунку кожного разу, а в тому, що він часто заздалегідь визначає, в чому полягають труднощі матчу. Він добре підходить для розуміння гри, але не для пошуку одного остаточного рахунку. Він може досить точно описати хід гри, але коли справа доходить до справжньої сенсації, йому трохи бракує рішучості.

Виліт Німеччини став колективною поразкою AI-моделей

Якщо попередні матчі дозволили побачити сильні сторони різних моделей, то матч Німеччина — Парагвай став колективним провалом.

Перед грою всі AI-моделі були на боці Німеччини. ChatGPT, Grok, Qianwen, Gemini, Claude — всі вважали фаворитом Німеччину, прогнози рахунку здебільшого були 2:0, 3:0 або 3:1. Аргументи були однакові: Німеччина має сильніший склад на папері, глибшу лаву запасних, потужнішу атаку.

Але проблема полягала в тому, що вони недооцінили здатність Парагваю затягнути гру в болото. Німеччина не змогла вирішити матч в основний час, не змогла зламати глухий кут у додатковий час і врешті-решт програла в серії пенальті, вилетівши з турніру.

Хто найточніший наразі?

З уже завершених матчів плей-оф видно, що починають проявлятися особливості різних моделей.

DeepSeek та Gemini мають найбільші досягнення. Вони не тільки змогли передбачити вихід фаворитів, як-от Бразилія чи Франція, але й у складних сенсаційних матчах дали дуже змістовні відповіді. У матчі Нідерланди — Марокко їхньою ключовою перевагою була сміливість заздалегідь написати сценарій сенсації та серії пенальті. Особливо Gemini, який прямо передбачив вихід Марокко через пенальті — це справді яскраво.

Grok та Qianwen більше схожі на «гравців за рахунками». Вони вгадали багато конкретних рахунків, особливо в матчах Канади, Бразилії, Норвегії, Франції. Але проблема в тому, що при зустрічі з традиційними сильними командами, як-от Німеччина чи Нідерланди, вони все ж схилялися до фаворитів.

ChatGPT та Claude більше схожі на «аналітиків». Вони пишуть повні аргументи, напрямок здебільшого не помиляється, можуть попередити про ризик додаткового часу. Але проблема в тому, що вони часто бачать, що гра буде важкою, але не наважуються зробити висновок на користь сенсації. Матч Нідерланди — Марокко саме такий: вони вже бачили ризик додаткового часу та пенальті, але все ж більше вірили в Нідерланди.

Тому замість того, щоб поспішно питати, яка модель найкраще розуміється на футболі, варто подивитися, яка модель підходить для якого сценарію.

Оригінальне посилання

Натисніть, щоб дізнатися про вакансії у BlockBeats

Ласкаво просимо до офіційної спільноти BlockBeats:

Telegram підписка: https://t.me/theblockbeats

Telegram чат: https://t.me/BlockBeats_App

Twitter офіційний акаунт: https://twitter.com/BlockBeatsAsia

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів