Modelo Ling-2.6-flash de Ant Group publicado como código abierto: 104B de parámetros con 7.4B activos, logra múltiples puntos de referencia SOTA

Mensaje de Gate News, 29 de abril — Los pesos del modelo flash Ling-2.6 de Ant Group ahora se han publicado como código abierto, después de haber estado disponibles previamente solo vía API. El modelo cuenta con 104 mil millones de parámetros totales, con 7.4 mil millones activados por inferencia, una ventana de contexto de 256K y licencia MIT. Hay versiones de precisión BF16, FP8 e INT4 disponibles en HuggingFace y ModelScope.

Ling-2.6-flash introduce mejoras en la atención lineal híbrida sobre Ling 2.0, actualizando el GQA original a una arquitectura híbrida 1:7 MLA plus Lightning Linear combinada con MoE altamente disperso. La eficiencia de inferencia supera significativamente a la de modelos comparables: la velocidad máxima de generación alcanza 340 tokens/s en 4 GPUs H20, con un rendimiento de prefill y decode aproximadamente 4 veces mayor que el de modelos comparables de código abierto. Los puntos de referencia relacionados con agentes muestran un rendimiento sólido: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval y PinchBench logran o se acercan a niveles SOTA. En toda la suite de benchmarks de Artificial Analysis, el consumo total de tokens es de solo 15 millones. En AIME 2026, el modelo obtuvo 73.85%.

El sitio web oficial de Ant Group también lista las versiones insignia Ling-2.6-1T (de cientos de miles de millones de parámetros) y Ling-2.6-mini (de versión ligera), aunque a la fecha de publicación, sus pesos aún no se han lanzado en HuggingFace, con solo la serie flash disponible para descarga.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

La IA de Microsoft para empresas se duplica hasta $370B ARR; planes de $190B Capex para 2026

El 29 de abril, Microsoft informó los resultados del tercer trimestre fiscal de 2026 para el periodo finalizado el 31 de marzo, superando las expectativas del mercado. Los ingresos del Q3 alcanzaron 82,886 mil millones de dólares, un 18% más interanual y por encima de lo esperado, 81,4 mil millones de dólares; el beneficio neto GAAP creció un 23% hasta 31,778 mil millones de dólares; las ganancias diluidas no-GAAP por

GateNewsHace9m

OpenAI DevDay 2026 se llevará a cabo el 29/9 en San Francisco

El 29 de abril, OpenAI publicó un anuncio oficial: la conferencia anual para desarrolladores DevDay 2026, la cita insignia para desarrolladores, se celebrará el 29 de septiembre en San Francisco, retomando el formato de conferencia presencial tras varios años de ausencia. Al mismo tiempo, también se dio a conocer una convocatoria para enviar propuestas: los desarrolladores usarán GPT-5.5 y Image Gen para crear obras y presentarlas; cada semana, Codex seleccionará 2-3 envíos creativos, cuyos autores obtendrán entradas gratuitas para DevDay (incluye vuelos entre ciudades y gastos de hotel). Tema de la conferencia: el ecosistema de desarrolladores en torno a GPT-5.5 + Image Gen El stack central de aplicaciones para este DevDay está claramente centrado en GPT-5.5. GPT-5.5 se lanzó el 23 de abril y el 24 se abrió por completo la API; junto con finales de abril GPT-5.4

ChainNewsAbmediaHace53m

BioMysteryBench: Mythos resuelve expertos sin solución 29,6%

Anthropic el 29 de abril publicó en su anuncio oficial de investigación BioMysteryBench, un nuevo conjunto de evaluación para las capacidades de análisis de bioinformática de la IA, compuesto por preguntas abiertas en escenarios de investigación reales. Los datos más dignos de atención son: en las preguntas que ni siquiera después de que un panel de expertos humanos lo intentara pudieron resolverse, el modelo insignia Mythos de Anthropic las resolvió 29,6% y Opus 27,0%. Diseño de la evaluación: dos vías, preguntas resolubles y preguntas no resolubles para expertos BioMysteryBench se compone de dos tipos de preguntas. El primer tipo es «preguntas resolubles»: tareas de análisis diseñadas por investigadores de bioinformática con respuestas estándar para compararlas. El segundo tipo es «preguntas no resolubles para expertos»: preguntas que, tras el intento de un panel de expertos humanos, todavía no pudieron encontrar respuestas fiables, para comprobar si el modelo puede ir más allá de los límites del conocimiento del sector actual.

ChainNewsAbmediaHace56m

OpenAI anuncia el lanzamiento del modelo de ciberseguridad GPT-5.5-Cyber en los próximos días

Según Cointelegraph, Sam Altman anunció que OpenAI lanzará GPT-5.5-Cyber, un modelo de ciberseguridad, en los próximos días. El modelo se pondrá a disposición de defensores críticos de ciberseguridad, y OpenAI planea establecer mecanismos de acceso confiables en colaboración con entidades gubernamentales para

GateNewshace1h

El CEO de Google DeepMind predice que la AGI llegará en 2030, dando a las empresas cuatro años para prepararse

Según la serie de videos de Sequoia Capital en la que aparece Demis Hassabis, el CEO de Google DeepMind predice que la inteligencia artificial general (AGI) llegará para 2030. Hassabis, ganador del Premio Nobel de Química de 2024, ve este calendario como una realidad empresarial estricta que obliga a los líderes a replantearse el diseño de producto de

GateNewshace1h

OpenAI operará como una empresa con beneficios perpetuamente bajos y firma un acuerdo de suministro eléctrico de 20 años

Según Odaily, el CEO de OpenAI, Sam Altman, afirmó en Stripe Sessions que OpenAI busca convertirse en una empresa de infraestructura masiva y de rápido crecimiento, con beneficios persistentemente bajos, ofreciendo productos similares a un “medidor inteligente” que los usuarios pueden comprar para automatizar operaciones comerciales o integrarlos en

GateNewshace1h
Comentar
0/400
Sin comentarios