Post #783

@MachineLearningResearch

AML

Views65Post view count

PostedMar 2303/23/2026, 07:15 PM

Post content

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights Yulu Gan, Phillip Isola Paper: https://arxiv.org/abs/2603.12228 Code: https://github.com/sunrainyg/RandOpt Review: https://arxiviq.substack.com/p/neural-thickets-diverse-task-experts Авторы предложили полностью параллельный безградиентный алгоритм RandOpt для post-training Он улучшает предобученные большие языковые модели (LLM) путём простого сэмплирования случайного гауссовского шума поверх весов, оценки этих зашумлённых моделей и ансамблирования предсказаний лучших из них Работа ставит под сомнение устоявшееся мнение, что выравнивание (alignment) языковых моделей строго требует сложной последовательной оптимизации вроде обучения с подкреплением Исследование раскрывает структурный феномен «нейронных дебрей» (neural thickets) Оказывается, при достаточном масштабе предобученная модель работает как распределение, в непосредственной окрестности весов которого плотно упакованы разнообразные эксперты под конкретные задачи