Исследователи OpenAI: системы ИИ могут справиться с большей частью исследовательской работы в течение двух лет

Сообщение Gate News, 29 апреля — исследователи OpenAI Сэбастьен Бьюбек и Эрнест Рю заявляют, что системы ИИ смогут выполнять большую часть человеческой исследовательской работы в течение двух лет, представляя математику как четкий показатель прогресса ИИ. В отличие от расплывчатых тестов производительности, математические задачи дают точную верификацию: ответы либо правильные, либо неправильные, не оставляя места для двусмысленности.

Бьюбек отметил, что истинное мышление ИИ требует способности выдерживать длинные цепочки рассуждений. Одна ошибка в многошаговом аргументе рушит все доказательство, делая обнаружение и исправление ошибок по ходу процесса главной целью для продвинутых моделей. Внутренние лаборатории OpenAI уже сгенерировали более десяти полностью новых теорем, пригодных для публикации в ведущих журналах по комбинаторике, демонстрируя, что ИИ теперь создает действительно оригинальные, прорывные работы, выходя за рамки простого комбинирования уже существующих статей.

Однако устойчивые научные прорывы требуют постоянного сосредоточения на протяжении недель тестирования. Текущие системы все еще нуждаются в строгом человеческом надзоре, чтобы направлять и проверять каждую смену курса. Бьюбек использует выражение “время для достижения AGI” (AGI time), чтобы измерить, как долго модель может независимо имитировать человеческое мышление; текущие системы работают примерно от нескольких дней до одной недели, а цель индустрии — недели или месяцы, чтобы обеспечить автономную работу в таких областях, как биология.

Долговременная память критически важна для этого будущего. Обычные окна чата ограничивают глубину — сложные математические доказательства часто превышают 50 страниц — тогда как репозитории кода показывают, как расширенные сессии работы позволяют вести более глубокое решение задач. По мере того как ИИ получает больше независимости и памяти, человеческая экспертиза становится более ценной, а не менее. Работникам нужно сохранять глубокие базовые знания, чтобы оспаривать и верифицировать ответы машины, а организациям потребуются новые автоматизированные фильтры и системы репутации, чтобы поддерживать доверие в условиях потока научных исследований, дополненных ИИ.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Nvidia инвестирует в шведский AI-юридический стартап Legora, Джуд Лоу стал глобальным амбассадором бренда

Nvidia провела расширительное инвестиционное раундирование Series D в Legora на 50 миллионов долларов, доведя общий объём привлечённых средств Legora до 600 миллионов долларов и оценку до 5,6 миллиарда долларов; в раунде участвуют Atlassian, Adams Street Partners и Insight Partners. Legora фокусируется на AI-юртехе, предоставляя такие инструменты, как автоматизированная проверка, анализ контрактов и юридические исследования; ARR превышает 100 миллионов долларов, а число сотрудников выросло с 40 до 400. Jude Law стал глобальным лицом бренда, а рекламный слоган — Law just got more attractive.

ChainNewsAbmedia2м назад

Anthropic открывает бета-версию безопасности Claude для корпоративных пользователей 1 мая

Согласно BlockBeats, 1 мая Anthropic объявила, что Claude Security — инструмент для защиты кода — открыла публичное бета-тестирование для пользователей Claude Enterprise. Инструмент сканирует репозитории кода на наличие уязвимостей безопасности, выполняет вторичную проверку для снижения числа ложных срабатываний и автоматически g

GateNews7м назад

Министерство труда США запустило портал для AI-стажировок, чтобы помогать компаниям обучать персонал

Американское Бюро по трудоустройству запустило на Неделе национального ученичества портал для AI-учеников, предоставляющий ресурсы для обучения «под ключ»: через рамку AI-грамотности он превращается в практические навыки. Платформа предлагает многоотраслевые модули и гибкие маршруты, помогая компаниям встроить AI-обучение в зарегистрированную программу ученичества и повысить уровень кадров и конкурентоспособность отрасли.

ChainNewsAbmedia31м назад

X запускает в апреле 2026 года обновлённую AI-ориентированную рекламную платформу, крупнейшее обновление за 20 лет

По данным X, платформа начала поэтапный запуск обновлённой рекламной платформы в апреле 2026 года. Это крупнейшее за примерно 20 лет обновление рекламной системы компании, которая переносит больше своих рекламных инструментов на ИИ. Новый Ads Manager использует AI-нацеливание и ранжирование на основе

GateNews1ч назад

Intel взлетает на 114% в апреле на фоне сильной отчётности и оптимизма вокруг ИИ

По данным CNBC, акции Intel взлетели на 114% в апреле, показав свой лучший месяц за всю историю. Рост был вызван более сильными квартальными результатами и возобновившимся оптимизмом инвесторов относительно восстановления, связанного с ИИ. Акции выросли на 24% 24 апреля после того, как CEO Лип-Бу Тан объявил, что квартальная выручка увеличилась более чем на 7%, в то время как

GateNews1ч назад

Marathon Digital Holdings приобретет Long Ridge Energy за 1,5 миллиарда долларов для расширения AI-центра обработки данных

Marathon Digital Holdings приобретает Long Ridge Energy за 1,5 миллиарда долларов, чтобы расширить мощность своих центров обработки данных для ИИ. Сделка включает газовую электростанцию мощностью 505 МВт и 1 600 акров земли в Огайо, что обеспечивает более 1 ГВт мощности для поддержки будущей инфраструктуры ИИ и ИТ

GateNews1ч назад
комментарий
0/400
Нет комментариев