Databricks 称:顶级 AI 模型在日常企业任务中落后 更小的专用模型表现更佳

Gate News 消息,4 月 20 日——据 Databricks 的 David Meyer 称,顶级 AI 模型擅长解决诸如奥林匹克竞赛数学这类复杂问题,但在日常企业工作中却表现吃力。某些模型可能会把错误的发票号码改正掉,而不是将其标记为错误;此外,像 Claude 这样的编程工具在数据工程任务上也可能表现不佳。

这种差距源于企业数据与用于训练大型模型的公开网络文本之间的根本差异。企业数据往往包含含糊的列标签、大量空白字段,以及以纯文本形式存储的代码。在一项学术研究中,用于平衡精确率与召回率的 AI 模型 F1 分数在数据工程任务上,从公开数据的 0.94 降至企业数据的 0.07。除此之外,大型模型往往会默认采用训练中熟悉的模式;例如,即使在收到公司专有查询语言的指令和文档之后,仍有模型默认使用结构化查询语言 (SQL)。

经过强化学习调优的小型开源模型能够以更高效率、更远低于大型通用模型的训练成本处理特定工作。Databricks 正在为特定工作流构建更小的 AI 代理,例如 KARL,它使用强化学习来结合公司文档进行多步骤推理。该行业正在从依赖巨型模型转向混合架构:由小而高效的模型处理常规的海量任务,然后只在遇到不清楚或复杂的案例时,才将其升级到更大、更昂贵的系统。

Databricks 最近收购 Quotient AI,帮助大型企业更可靠地运行 AI 代理。如今 AI 业务中的竞争,围绕的是运行完整的 AI 生命周期,包括用于追踪错误的反馈系统,并随时间持续改进模型,这使得评估与调优工具在部署之后变得愈发有价值。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Realidad de los agentes de IA en Silicon Valley: se desperdician muchos tokens, la integración de sistemas está «extremadamente desordenada», la predicción de Huang Renxun sobre «el próximo ChatGPT» aún debe verificarse

En una reciente conferencia en Silicon Valley, varios CEO de nuevas empresas de IA compartieron sus puntos de vista sobre los problemas de uso actuales de los agentes de IA, y consideran que se enfrentan a dos grandes dificultades: el desperdicio de tokens y la confusión del sistema. Los expertos señalaron que las empresas deben determinar con mayor cautela cuándo utilizar modelos de lenguaje a gran escala para evitar el desperdicio innecesario de recursos. Además, la colaboración entre múltiples agentes de IA a menudo provoca problemas en la transmisión de mensajes y en la coherencia del estado, lo que muestra que la estandarización actual aún necesita mejoras. Aunque Huang Renxun mencionó su opinión sobre el indicador de salarios por token, la retroalimentación indica que esto no equivale a la productividad; el valor real radica en un diseño eficaz de tareas.

ChainNewsAbmediahace13h

La IA se devora el 80% del capital global de venture, Q1 2026 se lleva 240 mil millones de dólares: ¿cómo responden los actores de la industria cripto a la reasignación de capital?

Según informes, en el primer trimestre de 2026 el monto global total de capital de riesgo se aproxima a 300 mil millones de dólares, de los cuales las empresas relacionadas con IA abarcan alrededor de 242 mil millones de dólares, lo que representa el 80% del capital de riesgo. Esto muestra que la IA se ha convertido en el foco principal del capital de riesgo. A medida que el financiamiento se concentra en la IA, otros ámbitos como crypto se han visto presionados; los proveedores necesitan ajustar sus estrategias, integrar la IA de manera más profunda en sus operaciones y esperan que surja una tendencia a la consolidación de infraestructura.

ChainNewsAbmediahace17h

El robot humanoide honor gana el Medio Maratón de Yizhuang de Pekín 2026 en 50 minutos 26 segundos

El Medio Maratón de Yizhuang de Pekín 2026 contó con robots humanoides compitiendo en una carrera de 21.0975 km. El equipo autónomo Qitian Dasheng ganó en 50:26, mientras que el equipo de control remoto Jueying Chitu terminó primero en tiempo neto, pero quedó mejor posicionado por detrás debido a sanciones.

GateNewshace19h

La policía de Hong Kong advierte de la estafa cripto de "trading cuantitativo con IA"; una mujer pierde 7,7 millones de HKD

La policía de Hong Kong reveló un fraude de criptomonedas en el que una mujer perdió 7,7 millones de HKD ante estafadores que se hacían pasar por expertos en inversiones mediante Telegram, prometiendo altos rendimientos mediante el trading con IA. La policía advirtió al público sobre los riesgos asociados a las inversiones en criptomonedas.

GateNewshace19h

Cofundador de Ethereum Lubin: la IA será un punto de inflexión crítico para las criptomonedas, pero el monopolio de los gigantes tecnológicos plantea un riesgo sistémico

El cofundador de Ethereum Joseph Lubin destacó el potencial transformador de la IA para el sector de las criptomonedas, al tiempo que advirtió sobre los riesgos de la centralización entre los gigantes tecnológicos. Él imagina transacciones autónomas impulsadas por IA en blockchain y resalta la convergencia de las finanzas tradicionales con DeFi.

GateNews04-18 14:01

Luffa与数字资产平台合作集成AI驱动的加密交易

Luffa,一个面向Web3的社交生态系统,与数字资产交易平台合作以集成由AI驱动的交易功能,在保持去中心化和风险缓解的同时,增强安全通信与交易,并在统一界面中实现这些能力。

GateNews04-18 06:31
Comentar
0/400
Sin comentarios