TGTGInsightаналитика telegramLIVE / telegram public index
← DeepSchool
DeepSchool avatar

TGINSIGHT POST

Post #357

@deep_school

DeepSchool

Просмотры4,810Количество просмотров
Опубликован14 мая14.05.2024, 10:56
Содержимое поста

Содержимое

Глубокое Q-обучение В далеком 2016 году весь IT-мир заговорил об обучении с подкреплением — reinforcement learning, или RL. И неспроста: алгоритм глубокого Q-обучения научился играть в игры Atari на уровне людей-экспертов. С тех пор и проснулся большой интерес к обучению с подкреплением. Многие идеи, которые используются в глубоком Q-обучении, применяются также в современных алгоритмах. Из этой статьи вы узнаете: - как адаптировать классическое Q-обучение для решения реальных задач - какие трюки используют для стабилизации тренировок в глубоком Q-обучении - и, конечно же, что представляет собой сам алгоритм глубокого Q-обучения Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Q-1ed7a65cc3d24a70928275bf0406296a?pvs=4