TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
“Яндекс” разработал новые методы сжатия нейросетей Команда Yandex Research совместно с исследователями из ISTA и KAUST разработала новые методы сжатия больших языковых моделей, позволяющие сократить расходы на внедрение нейросетей до 8 раз. Эти методы уменьшают вычислительные ресурсы, необходимые для работы моделей, сохраняя при этом в среднем 95% качества ответов, что превышает показатели других инструментов сжатия. Код и обучающие материалы уже доступны на GitHub. Они позволяют специалистам использовать уменьшенные модели для своих задач. Статья о методе сжатия AQLM, подготовленная совместно с ISTA и Neural Magic, была представлена на конференции по машинному обучению ICML. Мы из будущего