Сообщение Gate News, 20 апреля — Топовые AI-модели отлично решают сложные задачи вроде олимпиады по математике, но испытывают трудности с рутинной корпоративной работой, согласно Дэвиду Мейеру из Databricks. Некоторые модели могут исправить неверный номер счета-фактуры вместо того, чтобы пометить его как ошибку, а инструменты для кодирования вроде Claude также могут хуже справляться с задачами по data engineering.
Разрыв связан с фундаментальными различиями между корпоративными данными и публичным текстом веба, который используют для обучения больших моделей. Корпоративные данные часто содержат расплывчатые названия колонок, множество пустых полей и коды, хранящиеся в виде обычного текста. В одном академическом исследовании показатель F1 AI-модели, который балансирует точность и полноту, упал с 0.94 на публичных данных до 0.07 на корпоративных данных для задачи по data engineering. Кроме того, большие модели часто по умолчанию опираются на знакомые шаблоны из обучения; некоторые по умолчанию подставляли Structured Query Language (SQL) даже после получения инструкций и документации для проприетарного языка запросов компании.
Небольшие модели с открытым исходным кодом, настроенные с помощью обучения с подкреплением, могут справляться с конкретными задачами более эффективно и при существенно более низких затратах на обучение, чем большие универсальные модели. Databricks разрабатывает меньшие AI-агенты для конкретных рабочих процессов, например KARL, который использует обучение с подкреплением для многошагового рассуждения с документами компании. Индустрия смещается от опоры на гигантские модели к гибридным архитектурам, где небольшие эффективные модели обрабатывают типовой объем, а затем эскалируют только неясные или сложные случаи в более крупные и дорогие системы.
Недавно Databricks приобрела Quotient AI, чтобы помочь крупным предприятиям запускать AI-агентов более надежно. Конкуренция в AI-бизнесе сейчас сосредоточена на том, чтобы пройти весь жизненный цикл AI, включая системы обратной связи для отслеживания ошибок и непрерывного улучшения моделей со временем, благодаря чему инструменты для оценки и настройки становятся все более ценными после внедрения.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Реальность AI-агентов из Кремниевой долины: массовая трата токенов, интеграция систем «крайне хаотична», прогноз Хуан Жэньсюня «следующего ChatGPT» требует проверки
На недавней конференции в Силиконовой долине несколько CEO новых AI-стартапов высказали свои мнения о проблемах использования текущих AI-агентов, считая, что перед ними стоят две главные трудности: потери токенов и системная неразбериха. Эксперты отмечают, что компаниям нужно более осторожно решать, когда использовать большие языковые модели, чтобы избежать ненужной траты ресурсов. Кроме того, совместная работа нескольких AI-агентов часто приводит к проблемам с передачей сообщений и согласованностью состояния, что указывает на то, что стандартизация на данный момент требует улучшений. Хотя в своих комментариях Хуан Жэньсюнь затронул точку зрения о показателях токен-зарплат, отзывы показывают, что это не равно производительности; реальная ценность заключается в эффективном проектировании задач.
ChainNewsAbmedia13ч назад
ИИ поглощает 80% глобального венчурного капитала; Q1 2026 перетекает 242 миллиарда долларов: как участники крипторынка должны реагировать на перераспределение средств
Согласно сообщениям, в первом квартале 2026 года общий объем глобальных венчурных инвестиций почти достигнет 300 млрд долларов, при этом компании, связанные с ИИ, занимают примерно 242 млрд долларов, что составляет 80% венчурных инвестиций. Это показывает, что ИИ уже стал главным фокусом венчурного капитала. По мере концентрации средств в ИИ другие сферы, такие как crypto, испытывают давление; участникам рынка необходимо корректировать стратегии, глубже интегрируя ИИ в свою деятельность, и ожидается, что будет наблюдаться тенденция к консолидации инфраструктуры.
ChainNewsAbmedia17ч назад
Почетный робот-победитель: человекоподобный робот выиграл полумарафон в Пекине Ичжуан 2026 за 50 минут 26 секунд
Полумарафон в Пекине Ичжуан 2026 года включал гонки человекоподобных роботов на дистанции 21,0975 км. Автономная команда Qitian Dasheng победила за 50:26, в то время как команда с дистанционным управлением Jueying Chitu финишировала первой по чистому времени, но получила более низкое место из-за штрафов.
GateNews19ч назад
Полиция Гонконга предупреждает о криптомошенничестве с «ИИ‑количественным трейдингом»: женщина лишилась 7,7 млн HKD
Полиция Гонконга раскрыла случай криптовалютного мошенничества: женщина потеряла 7,7 млн HKD из‑за мошенников, которые выдавали себя за инвестиционных экспертов и через Telegram обещали высокую доходность с помощью ИИ‑трейдинга. Полиция предупредила общественность о рисках, связанных с инвестициями в криптовалюты.
GateNews19ч назад
Сооснователь Ethereum Любин: ИИ станет критически важным поворотным моментом для криптовалют, но монополия техгигантов несет системный риск
Сооснователь Ethereum Джозеф Любин подчеркнул преобразующий потенциал ИИ для криптовалютного сектора, одновременно предостерегая от рисков централизации среди технологических гигантов. Он представляет ИИ-управляемые автономные транзакции в блокчейне и отмечает сближение традиционных финансов с DeFi.
GateNews04-18 14:01
Luffa сотрудничает с платформой цифровых активов, чтобы интегрировать ИИ-ориентированную криптоторговлю
Луффа, социальная Web3-экосистема, партнерилась с платформой для торговли цифровыми активами, чтобы интегрировать функции ИИ-торговли, повышая защищённую коммуникацию и трейдинг в едином интерфейсе при сохранении децентрализации и снижении рисков.
GateNews04-18 06:31