NVIDIA открывает исходный код архитектуры TwoTower, достигает ускорения генерации текста в 2,42 раза

Согласно Beating, NVIDIA опубликовала с открытым исходным кодом Nemotron-Labs-TwoTower — дискретную архитектуру текстового диффузионного моделирования, предназначенную для ускорения генерации текста большими языковыми моделями. Двухбашенная конструкция разделяет замороженную авторегрессионную модель, сохраняющую способность к рассуждению, и обучаемую башню шумоподавления, генерирующую текст параллельно. Используя всего 1/12 базовых данных предварительного обучения на модели смеси экспертов Mamba-Transformer с 30 миллиардами параметров, TwoTower сохранил 98,7% базового качества, увеличив скорость генерации в 2,42 раза без дополнительных затрат памяти.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев