TGTGInsightаналитика telegramLIVE / telegram public index
← DeepSchool
DeepSchool avatar

TGINSIGHT POST

Post #309

@deep_school

DeepSchool

Просмотры5,750Количество просмотров
Опубликован26 февр.26.02.2024, 15:06
Содержимое поста

Содержимое

Q-Learning Q-Обучение — один из фундаментальных алгоритмов обучения с подкреплением. Его использовали ещё при обучении агентов в играх на Атари. Он актуален и сегодня — применяется, например, в офлайн-обучении с подкреплением. Из новой статьи вы узнаете: - как работают методы обучения с подкреплением, основанные на функции ценности - какие есть методы для оценки этой функции - что такое уравнение Беллмана - и конечно же, какой алгоритм у Q-обучения. Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Q-314e0f83efb14ef19b12ffaacfc2b4a6?pvs=4