TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
Post content
StableMTL: многозадачное обучение с диффузионными моделями Обычно для ML на нескольких задачах нужно разметить огромное количество данных для каждой задачи Это дорого и долго Исследователи предложили использовать диффузионные модели (те же, что создают картинки из текста) для решения этой проблемы Их метод позволяет обучать ML даже на частично размеченных синтетических данных Фишка в том, что модель может работать в "zero-shot" режиме — выполнять задачи, на которых её специально не обучали Это работает за счёт мощной способности диффузионных моделей к обобщению Результат — можно создавать ML для сложных задач с гораздо меньшими затратами на данные https://arxiv.org/abs/2506.08013