SWE-rebench clasificación más reciente: modelos de IA chinos ocupan los primeros catorce lugares, GLM-5 ocupa el tercer puesto

Gate News Noticias, el 25 de marzo, el mantenedor de la prueba de referencia SWE-rebench, Ibragim, anunció la actualización de la lista el 23 de marzo. SWE-rebench es una prueba de referencia en tiempo real que extrae nuevas tareas de ingeniería de software de GitHub cada mes, y el modelo no puede optimizarse previamente para las tareas. En esta actualización se eliminaron las demostraciones de ejemplo y la restricción de 80 pasos, además de añadirse tareas de evaluación auxiliares.

Las diez mejores posiciones más recientes son: 1. Claude Opus 4.6 (65.3%); 2. GPT-5.2 medium (64.4%); 3. GLM-5 (62.8%); 4. GPT-5.4 medium (62.8%); 5. Gemini 3.1 Pro Preview (62.3%); 6. DeepSeek-V3.2 (60.9%); 7. Claude Sonnet 4.6 (60.7%); 8. Claude Sonnet 4.5 (60.0%); 9. Qwen3.5-397B-A17B (59.9%); 10. Step-3.5-Flash (59.6%).

El modelo de código abierto de Zhipu AI, GLM-5 (licencia MIT), ocupa el tercer lugar con un 62.8%, siendo el modelo de código abierto mejor clasificado en la lista. Cuatro modelos chinos están en el top ten, además de GLM-5, incluyendo DeepSeek-V3.2 (sexto), Qwen3.5-397B-A17B de Alibaba Tongyi Qianwen (noveno) y Step-3.5-Flash (décimo). Li Zixuan, responsable global de Z.ai de Zhipu AI, afirmó que en la última actualización de SWE-rebench, todos los modelos chinos estaban fuera del top ten.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Franklin Templeton FOBXX alcanza 19,8 mil millones de dólares en Stellar y se convierte en el segundo mayor RWA

Según Cointelegraph, el fondo FOBXX de Franklin Templeton alcanzó 19,8 mil millones de dólares en activos el 1 de mayo, convirtiéndose en el segundo mayor activo del mundo real (RWA) en la red Stellar.

GateNewshace14h

Un destacado CEX recién incorporado al ranking ocupa el noveno lugar, mientras que otra bolsa cae fuera del top 10

Según ChainCatcher, RootData publicó su octava clasificación de transparencia para intercambios de criptomonedas el 30 de abril. Un CEX importante entró por primera vez en el top diez, en el noveno lugar, mientras que otro intercambio salió del top diez debido a la caída del volumen de operaciones y al incumplimiento insuficiente transp

GateNews04-30 11:06

La oferta de USDT en TRC20 alcanza un récord de 87,3 mil millones de dólares, Tron captura el 27,3% de la cuota de mercado de stablecoins

Según ChainCatcher y CoinDesk Data, la oferta de TRC20-USDT alcanzó 87,3 mil millones de USD al 30 de abril, marcando un nuevo máximo histórico, con la red de Tron añadiendo 6 mil millones de USDT emitidos en lo que va de año. La cuota de mercado de las stablecoins de Tron subió a 27,3% en el 1T de 2026, mientras que los ingresos por tarifas del protocolo alcanzaron 82,2 millones de USD...

GateNews04-30 07:51

El zkDTVM de Ant Digital rompe el récord de EthProofs de Ethereum con una velocidad de prueba de bloques de 3,7 segundos

Según BlockBeats, la máquina virtual de prueba de conocimiento cero zkDTVM desarrollada por Ant Digital logró una velocidad de prueba de bloque de 3.7 segundos el 30 de abril en el punto de referencia global de Ethereum EthProofs, rompiendo el récord anterior de la industria de 4.2 segundos y asegurando el primer puesto global bajo una h unificada

GateNews04-30 02:25

Block Inc aumenta sus tenencias de Bitcoin en 114.89 BTC; la posición total alcanza 8,998 BTC

Mensaje de Gate News, 28 de abril — Block Inc, la empresa de tecnología financiera liderada por Jack Dorsey, compró 114.89 Bitcoin adicionales, llevando sus tenencias totales a 8,998 BTC. Con esta posición, Block Inc ahora ocupa el puesto 14 entre los mayores tenedores de Bitcoin

GateNews04-28 10:50

La empresa francesa cotizada Capital B añade 6 Bitcoin a sus tenencias; la posición total alcanza 2,943 BTC

Mensaje de Gate News, 28 de abril: la empresa francesa cotizada Capital B incrementó sus tenencias de Bitcoin en 6 BTC, elevando su posición total a 2,943 BTC, según BitcoinTreasuries.NET. La empresa ahora ocupa el puesto 25 en el ranking de tenencias de Bitcoin entre las principales

GateNews04-28 07:29
Comentar
0/400
Sin comentarios