Microsoft випустила функції Critique та Council для Copilot Researcher; тест DRACO показав 57.4 бали, що випереджає галузевий рівень

GateNews

Новини Gate News, 31 березня, у понеділок Microsoft оголосила про запуск двох нових функцій для Copilot Researcher — Critique та Council, поєднавши GPT від OpenAI і Claude від Anthropic для одного й того самого дослідницького завдання. Critique використовує послідовний режим взаємодії: GPT відповідає за планування дослідження, пошук матеріалів і створення першого чернеткового варіанту, а Claude згодом виконує роль рецензента, перевіряючи точність фактів і якість посилань; Council, своєю чергою, дозволяє двом моделям паралельно й незалежно генерувати звіт, а потім третя модель-суддя порівнює відмінності та узагальнює розбіжності. У DRACO-бенчмарку, який охоплює 100 складних дослідницьких завдань у 10 сферах, зокрема медицині, праві та технологіях, Copilot із Critique набирає 57.4 бала, випереджаючи друге місце майже на 14%, далеко випереджаючи показник Claude Opus 4.6, який під час окремого запуску становить 42.7 бала.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів