TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
Прочитал про Move 37 - гипотезу о том, что AI-модели начнут со временем делать странные (для нас) вещи. Это будет выглядеть как галлюцинации - до тех пор, пока не окажется, что модель открыла способ решать задачи непонятным человеку способом. Изначально Move 37 - это про AlphaGo и странный 37-й ход во втором матче против Ли Седоля. Человек бы такой никогда не сделал, но модель каким-то образом его проинтуичила. И ретроспективно он оказался блестящим. Интересно, что Move 37 по определению нельзя натренировать человеческими учителями, а делается это через reinforcement learning, то есть модель должна доходить до них методом проб и ошибок. Все, как у человеческих детенышей 🙃