NVIDIA publica como código abierto la arquitectura TwoTower, logra una aceleración de 2,42x en generación de texto

Según Beating, NVIDIA ha lanzado como código abierto Nemotron-Labs-TwoTower, una arquitectura de difusión de texto discreta diseñada para acelerar la generación de texto de modelos de lenguaje de gran escala. El diseño de doble torre separa un modelo autorregresivo congelado que preserva la capacidad de razonamiento de una torre de eliminación de ruido entrenable que genera texto en paralelo. Utilizando solo 1/12 de los datos de preentrenamiento de referencia en un modelo Mamba-Transformer de mezcla de expertos con 30 mil millones de parámetros, TwoTower retuvo el 98,7 % de la calidad de referencia mientras aumentó la velocidad de generación en 2,42 veces sin sobrecarga adicional de memoria.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios