TGTGInsightаналитика telegramLIVE / telegram public index
← DeepSchool
DeepSchool avatar

TGINSIGHT POST

Post #47

@deep_school

DeepSchool

Просмотры3,640Количество просмотров
Опубликован30 мая30.05.2022, 10:03
Содержимое поста

Содержимое

​​Multi-Task Learning или MTL MTL — это когда вы учите одну модель решать сразу несколько задач. Например, сегментировать и классифицировать картинку. Multi-Task-нейросети состоят из общей части и нескольких голов, каждая из которых решает свою задачу. При обучении общая часть кодирует картинку в фичи ➡️ затем они подаются на вход в каждую голову ➡️ головы выдают предсказания ➡️ для каждой головы считается своя функция потерь ➡️ градиент спускается от каждой головы к началу сети. Multi-Task-модель сэкономит вам время и память, ведь несколько задач теперь решаются одной нейросетью. Также MTL можно использовать и для регуляризации ваших моделей. Интуиция такая: если сеть учится решать несколько задач, ей сложнее будет переобучиться под одну из них. Поэтому в следующий раз при обучении сегментации, попробуйте добавить голову-классификатор после энкодера. Благодаря этому ваша модель точнее выучит полезные паттерны, а во время инференса будет сегментировать лучше (но это не точно🙂 как обычно, пробуем оба способа и сравниваем метрики). #mtl#multitasklearning