TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #760 · 10.02

Почему в видеоиграх такие тупые мини-игры? Во многих видеоиграх есть мини-задачки, которые моделируют какое-то якобы сложное действие. Например, вскрытие замков, взлом компьютера, какие-нибудь типа научные исследования в сюжете. И я не помню, видел ли хоть раз в жизни не тупую мини-игру. В лучшем случае у вас будет что-то типа головоломки "Трубопровод". В худшем — задачка уровня цветной пирамидки для младенцев. Почему так? Нельзя сказать, что все видеоигры спроектированы для глупых или для детей. Иногда в основном сюжете или механике игры есть элементы, которые требуют уметь хотя бы чуть-чуть шевелить мозгами. Но почему нигде не делают интересные мини-игры, которые было бы сложно решать? Ведь образцов для этого дофига: начиная с какого-нибудь "Сапёра" и заканчивая Wordle. А там блин везде соедини точки, да подвинь квадратики. Кажется, попытка сделать интересную мини-игру была в Cyberpunk в системе взлома, но не удалась — хорошая идея реализовывалась авторами, которые плохо понимают, как работают игры и вообще интерактивные системы, в итоге для хоть какой-нибудь решаемости сделали сами наборы данных супер примитивными. Знаете ли вы примеры игр с интересными мини-задачками, если только вся игра не построена на них (как например The Witness, хотя там больше половины задачек очень скучные)? #games

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #sft

当前筛选 #sft清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8851 · 24.10.2025 г., 22:00

🧠 Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, сравнив её «мозг» с мозгом пчелы. Он обучил модель считать, сколько раз буква r встречается в слове strawberry, и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи. Сначала генерируются диалоги: «Сколько букв r в слове strawberry?» и правильные ответы. После этого модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык. Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы. Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче понимает задачу. Nanochat решает задачу двумя способами: — логически, рассуждая пошагово; — через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата. Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные. 📘 Разбор: github.com/karpathy/nanochat/discussions/164 @ai_machinelearning_big_data #AI#Karpathy#Nanochat#LLM#SFT#RL#MachineLearning#OpenSource