Mensaje de Gate News, 24 de abril — DeepSeek ha lanzado la serie V4 de modelos de código abierto bajo la Licencia MIT, con pesos ahora disponibles en Hugging Face y ModelScope. La serie incluye dos modelos (MoE) de mezcla de expertos: V4-Pro con 1,6 billones de parámetros totales y 49 mil millones activados por token, y V4-Flash con 284 mil millones de parámetros totales y 13 mil millones activados por token. Ambos admiten una ventana de contexto de 1 millón de tokens.
La arquitectura presenta tres mejoras clave: un mecanismo de atención híbrida que combina atención dispersa comprimida (CSA) y atención altamente comprimida (HCA) que reduce significativamente la sobrecarga para contextos largos: los FLOPs de inferencia para 1M de contexto de V4-Pro son solo el 27% de los de V3.2, y la caché KV (VRAM para almacenar información histórica durante la inferencia) es solo el 10% de la de V3.2; enlaces hiperconectados con restricción de manifold (mHC) que reemplazan las conexiones residuales tradicionales para mejorar la estabilidad de la propagación de señales entre capas; y el optimizador Muon para una convergencia de entrenamiento más rápida. El preentrenamiento utilizó más de 32 billones de tokens de datos.
El postentrenamiento emplea un enfoque de dos etapas: primero, entrenar expertos específicos del dominio mediante fine-tuning supervisado (SFT) y aprendizaje por refuerzo con GRPO, luego fusionarlos en un único modelo mediante destilación en línea. V4-Pro-Max (modo de inferencia más alto) afirma ser el modelo de código abierto más potente, con puntos de referencia de codificación de nivel superior y brechas significativamente reducidas frente a modelos de frontera de código cerrado en tareas de razonamiento y de agentes. V4-Flash-Max logra un rendimiento de razonamiento a nivel Pro con un presupuesto de cómputo suficiente, pero se ve limitado por la escala de parámetros en conocimiento puro y tareas de agentes complejas. Los pesos se almacenan en precisión mixta FP4+FP8.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
OpenAI Lanza una Seguridad Avanzada de Cuentas para ChatGPT
Lanzamiento de seguridad avanzada de cuentas
OpenAI el jueves presentó Advanced Account Security, un nuevo ajuste opcional para ChatGPT diseñado para usuarios que desean una protección más sólida o que se enfrentan a riesgos más altos de ciberataques. La compañía dijo que la nueva función se creó en respuesta a cómo las personas son
CryptoFrontierHace4m
X (Twitter) recibe la mayor actualización de la plataforma publicitaria de 20 años, con la intervención de xAI; la segmentación publicitaria basada en el significado de la IA se convierte en el núcleo
X anunció que, a partir de abril de 2026, lanzará la mayor renovación de su plataforma publicitaria en 20 años, reconstruyendo la tecnología subyacente y combinándola con xAI. La nueva plataforma se centra en la optimización impulsada por IA del rendimiento, así como en la publicidad semántica y contextual, con el objetivo de mejorar la facilidad de operación y la supervisión del control de campañas. Busca convertir los anuncios en señales comerciales de contexto inmediato y, en línea con la estrategia de Everything App, convertirse en el motor comercial del ecosistema de X.
ChainNewsAbmediahace3h
Impulsada por OpenAI, 1X inaugura una fábrica de 58.000 pies cuadrados en California, con el objetivo de desplegar 10.000 robots en su primer año
Según Bloomberg, 1X Technologies, una startup de robótica respaldada por OpenAI y fundada en Noruega, ha inaugurado una instalación de fabricación de 58.000 pies cuadrados en Hayward, California, con el objetivo de liderar la producción en masa de robots humanoides de grado de consumo.
Se espera que la instalación produzca 10.000 robots en su
GateNewshace5h
La Casa Blanca elabora un borrador de memorando de política de IA que ordena a las agencias de EE. UU. usar múltiples proveedores de IA el 30 de abril
De acuerdo con fuentes citadas por PANews el 30 de abril, funcionarios de la Casa Blanca están redactando un memorando amplio de política de inteligencia artificial que instruye a las agencias del gobierno de EE. UU. a adoptar múltiples proveedores de servicios de IA y a evitar depender de un solo proveedor. El memorando también exige que todas las empresas de IA contratadas
GateNewshace6h
La Administración de Ciberespacio de China lanza una campaña de 4 meses para frenar el caos de las aplicaciones de IA el 30 de abril
Según CCTV News, la Administración del Ciberespacio de China lanzó el 30 de abril una campaña nacional de cuatro meses para abordar el caos en las aplicaciones de IA. La iniciativa, desplegada en dos fases, apunta a problemas como registros de modelos faltantes, capacidades insuficientes de seguridad y revisión de plataformas,
GateNewshace6h
Forefront Tech completa la fijación de precios de su $100M IPO, cotiza en Nasdaq bajo el código FTHAU
Según ChainCatcher, la empresa de adquisición con fines específicos Forefront Tech completó una fijación de precio de su IPO por 100 millones de dólares el 30 de abril y cotizará en Nasdaq bajo el símbolo bursátil FTHAU. La empresa planea usar los ingresos para buscar oportunidades de fusiones y adquisiciones en blockchain, fintech, inteligencia artificial en
GateNewshace8h